国产一区高清|日韩精品一区人妻|曰夲AV一区二区|美日韩一区二区三区|国产喷水在线观看|狼友网站成人大全|欧美日韩制服中文视频在线|久草加勒比手机在线|婷婷色综合无码专区|japanese 精品视频在线观看

MiniMax發(fā)布開(kāi)源大模型M1,支持百萬(wàn)級(jí)上下文輸入

6月17日,國(guó)內(nèi)大模型公司MiniMax發(fā)布了全球首個(gè)開(kāi)源的大規(guī)?;旌霞軜?gòu)推理模型MiniMax-M1。這是“MiniMaxWeek”系列發(fā)布活動(dòng)的首個(gè)成果。

M1在復(fù)雜場(chǎng)景中的能力處于開(kāi)源模型領(lǐng)先地位,接近海外最先進(jìn)水平,并具備業(yè)內(nèi)最高性價(jià)比。其主要優(yōu)勢(shì)包括支持最高100萬(wàn)上下文輸入,與Google Gemini 2.5 Pro持平,為DeepSeek R1的8倍,同時(shí)提供最長(zhǎng)8萬(wàn)Token的推理輸出。

成本方面,M1采用低成本訓(xùn)練方式,僅用512塊H800 GPU歷時(shí)三周完成訓(xùn)練,總成本約為385萬(wàn)元人民幣。得益于閃電注意力機(jī)制為主的混合架構(gòu),M1在長(zhǎng)文本處理任務(wù)中表現(xiàn)顯著優(yōu)于DeepSeek R1,生成長(zhǎng)度為10萬(wàn)Tokens時(shí),計(jì)算量?jī)H為DeepSeek R1的25%。

M1的核心競(jìng)爭(zhēng)力在于超長(zhǎng)上下文處理能力和低算力消耗。在復(fù)雜任務(wù)(如工具調(diào)用、長(zhǎng)文本理解)中,M1表現(xiàn)接近甚至超越DeepSeek R1,尤其適合處理百萬(wàn)級(jí)Token的場(chǎng)景,例如法律文檔分析和代碼庫(kù)理解。相比之下,DeepSeek R1在傳統(tǒng)數(shù)學(xué)推理和編程基準(zhǔn)測(cè)試中略占優(yōu)勢(shì),但在長(zhǎng)文本任務(wù)中效率較低。

價(jià)格策略上,M1在MiniMax APP和Web端提供不限量免費(fèi)使用服務(wù)。API定價(jià)分三檔:第一檔輸入長(zhǎng)度0-32k時(shí),輸入0.8元/百萬(wàn)Token,輸出8元/百萬(wàn)Token;第二檔32k-128k時(shí),輸入1.2元/百萬(wàn)Token,輸出16元/百萬(wàn)Token;第三檔128k-1M時(shí),輸入2.4元/百萬(wàn)Token,輸出24元/百萬(wàn)Token。

值得注意的是,DeepSeek已成為行業(yè)對(duì)標(biāo)標(biāo)桿。此前,火山引擎發(fā)布的豆包大模型1.6通過(guò)按輸入長(zhǎng)度區(qū)間定價(jià),綜合成本僅為DeepSeek R1的三分之一。

與此同時(shí),DeepSeek R1也在持續(xù)升級(jí)中。5月29日更新的版本(DeepSeek-R1-0528)優(yōu)化了“幻覺(jué)”問(wèn)題,在改寫(xiě)潤(rùn)色、總結(jié)摘要等場(chǎng)景中,幻覺(jué)率降低45%-50%,結(jié)果更為準(zhǔn)確可靠。然而,更新后的DeepSeek單任務(wù)處理時(shí)間有所延長(zhǎng),據(jù)測(cè)評(píng)可達(dá)30-60分鐘。

免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。

最新文章
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號(hào)-1