智譜官方今日正式發(fā)布了GLM-Zero的初代版本GLM-Zero-Preview,這是智譜首個基于擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型。GLM-Zero-Preview作為GLM家族中的一員,專注于增強(qiáng)AI的推理能力,尤其在處理數(shù)理邏輯、代碼和需要深度推理的復(fù)雜問題上表現(xiàn)出色。
據(jù)官方介紹,GLM-Zero-Preview在不顯著降低通用任務(wù)能力的情況下,專家任務(wù)能力得到了大幅提升。在AIME 2024、MATH500和LiveCodeBench等評測中,其表現(xiàn)與OpenAI的o1-preview相當(dāng)。然而,官方也坦承,GLM-Zero-Preview與OpenAI的o3模型相比仍有差距,未來將繼續(xù)優(yōu)化迭代強(qiáng)化學(xué)習(xí)技術(shù),并計劃推出正式版GLM-Zero,進(jìn)一步擴(kuò)展其深度思考能力。
在數(shù)學(xué)領(lǐng)域,GLM-Zero-Preview展現(xiàn)了強(qiáng)大的歸納與演繹能力,能夠快速處理復(fù)雜的數(shù)學(xué)運(yùn)算,解答包括代數(shù)、微積分、概率統(tǒng)計等領(lǐng)域的問題。以2025年考研數(shù)學(xué)一為例,GLM-Zero-Preview得分為126分,展現(xiàn)了其在復(fù)雜數(shù)學(xué)問題上的應(yīng)用潛力。
目前,GLM-Zero-Preview已經(jīng)上線,用戶可通過智譜清言和智譜開放平臺進(jìn)行體驗。這一新模型的發(fā)布,標(biāo)志著AI推理能力的進(jìn)一步提升,未來有望在更多領(lǐng)域發(fā)揮重要作用。