国产一区高清|日韩精品一区人妻|曰夲AV一区二区|美日韩一区二区三区|国产喷水在线观看|狼友网站成人大全|欧美日韩制服中文视频在线|久草加勒比手机在线|婷婷色综合无码专区|japanese 精品视频在线观看

北京電標出分了,哪款大模型猜對了?

撰文 | 小不董

編輯 | 李信馬

題圖 | 文心一格

就在5月26日,北京市新能源小客車指標發(fā)布了。

根據(jù)此前截至2024年3月8日24時的申請,經(jīng)審核,新能源小客車指標申請數(shù)量如下:?

2023年,北京家庭新能源指標配置的積分排序入圍名單中,分數(shù)最高的家庭為258分,分數(shù)最低的家庭為60分,入圍“分數(shù)線”比2022年提高了4分。

在積分排序入圍名單上,排在第一位、總積分258分的家庭有三代人參與搖號,成員最早注冊時間為2011年2月19日。

并且,有將近1600個家庭的積分都是60。以最后一名入圍的60分家庭來看,共有三代人參與搖號,成員最早注冊時間為2013年3月3日。數(shù)相同的情況下,按家庭成員中最早在系統(tǒng)注冊時間先后排序。

以過去三年間,從最低入圍分數(shù)來看在逐步上升,難度一年大過一年,不少人都在擔心,自己的積分夠了嗎?會不會有一個配額屬于自己呢??

對此,我們決定用幾款大模型對于2024年家庭新能源指標入圍積分線進行了預(yù)測,看看哪款大模型更了解中國的實際情況,給出的答案最準確。經(jīng)整理結(jié)果如下:?

首先,是直接選擇“棄權(quán)”的選手,比如字節(jié)跳動旗下的豆包大模型就表示無法準確預(yù)測,建議關(guān)注官方。?

圖片來源:豆包

與之類似的還有訊飛星火大模型,只是模糊的表示,競爭會更激烈。?

圖片來源:訊飛星火?

騰訊的混元大模型 也是無法預(yù)測,不過給出了些建議,俗稱 “甩鍋”。?

圖片來源:騰訊混元助手?

相比之下,阿里云的通義千問,雖然沒有給出具體答案,但是認為會超過60,即使這個范圍很寬泛,但比前三個還是要有進步。

圖片來源:通義千問?

而給出的答案最符合要求的大模型,當屬百度的文心一言,明確給出會在64-66分之間,理由也比較清晰。?

圖片來源:文心一言?

此外,作為對比 ,我們還向chatGPT也詢問了這個問題 ,其干脆利落地給出了無法提供未來數(shù)據(jù)的答案。?

不過最終,在5月26日實際發(fā)布的的本期配置中,分數(shù)最高的家庭282分,分數(shù)最低的家庭60分,與去年的入圍“分數(shù)線”持平。某種意義上來說,是“全軍覆沒”了,可見在預(yù)測方面,大模型還有不小的進步空間。最后,恭喜成功入圍的朋友們啦!

標簽: 新能源
北京電標出分了,哪款大模型猜對了?
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號-1