都市激情在线亚洲国产,日韩美女精品在线视频,国产福利精品一二二区

DoNews > 專欄 > 閆俊杰不甘心

閆俊杰不甘心

字母榜 2025-06-10 16:31:36

555505

分享到

從AI六小龍縮減為AI四小強(qiáng)后，四家明星大模型創(chuàng)業(yè)公司終于都要上線自己的推理模型了。

在智譜AI、月之暗面和階躍星辰相繼上線自研推理模型后，近期虎嗅爆料MiniMax籌備半年多的文本推理模型也即將發(fā)布。

有接近MiniMax的知情人士向字母榜（ID：wujicaijing）確認(rèn)了上述爆料的真實(shí)性。

字母榜曾在《無人再談AI六小龍》一文中率先指出，原本被冠以六小龍稱號(hào)的隊(duì)伍中，因?yàn)橛腥嗣黠@掉隊(duì)（零一萬物明確放棄追逐AGI，百川智能專注醫(yī)療垂類賽道），剩下的四家（智譜AI、MiniMax、月之暗面和階躍星辰），也失去了如一條過江龍般，足以挑戰(zhàn)乃至對(duì)抗大廠的資本和技術(shù)底氣。曾經(jīng)的AI六小龍，已經(jīng)在新一輪大模型競(jìng)賽中滑落成了新的“AI四小強(qiáng)”。

曾幾何時(shí)，四小強(qiáng)中的MiniMax一度引領(lǐng)行業(yè)之先。2023 年下半年，大部分國內(nèi)大模型廠商還在繼續(xù)迭代稠密模型（dense model）之際，MiniMax創(chuàng)始人兼CEO閆俊杰就把80%以上的研發(fā)和算力資源投到了一件不確定的事情上—— MoE（Mixture of Experts 混合專家模型）。

2024年 1 月，MiniMax上線的abab6，成為國內(nèi)首個(gè)MoE大模型。此后，MoE架構(gòu)徹底取代稠密架構(gòu)，成了大模型領(lǐng)域技術(shù)迭代的新方向，年初爆火出圈的DeepSeek，應(yīng)用的也是MoE。

但在DeepSeek R1掀起的新一輪推理模型浪潮中，MiniMax卻成了那個(gè)后來者。當(dāng)騰訊等玩家紛紛靠接入DeepSeek賺取用戶關(guān)注之際，不甘心的MiniMax選擇了一種折中方案：國內(nèi)C端應(yīng)用上堅(jiān)持不接入DeepSeek，只在海外的AI應(yīng)用上選擇接入DeepSeek。

MiniMax的此番操作，不免讓人聯(lián)想到字節(jié)，后者同樣選擇不在國內(nèi)主力C端應(yīng)用豆包上接入DeepSeek，而是堅(jiān)持等到后續(xù)自研推理模型的上線，才補(bǔ)上了深度思考的能力短板。

如今，閆俊杰也等來了一個(gè)如字節(jié)一般的機(jī)會(huì)，即嘗試通過借助自家推理模型的上線，來重新證明MiniMax的技術(shù)底色。

缺失推理模型的影響，正從多個(gè)方面左右著大模型玩家的發(fā)展?fàn)顟B(tài)。

首當(dāng)其沖的便是外界對(duì)其高估值和后續(xù)融資是否可持續(xù)的質(zhì)疑。

2024年3月，MiniMax拿下6億美元A輪融資后，投后估值來到25億美元，這是MiniMax最后一次公開披露的投融資和估值信息。

2025年年初，外界有傳聞MiniMax估值已經(jīng)超過30億美元，不過，據(jù)字母榜從接近MiniMax知情人士處獲悉的消息，當(dāng)前MiniMax估值已經(jīng)超過40億美元，仍然是當(dāng)前四小強(qiáng)中估值最高的一家，“（MiniMax）全棧技術(shù)價(jià)值更高一些?！焙銟I(yè)資本管理合伙人江一如此評(píng)價(jià)道。

但遲遲未上推理模型，資本市場(chǎng)也開始重估MiniMax的估值體系。

比上線推理模型更難的是，不僅要有，作為后來者，還要做到比R1更好才行，“Kimi就是一個(gè)例子，盡管跟R1同時(shí)期上線了K1.5推理模型，但效果對(duì)比上顯然敗給了R1?！比斯ぶ悄軐＜伊址宀┦空f。

這也成了拖住MiniMax自家推理模型未能更早上線的因素之一。在MiniMax前員工李?。ɑ┗貞浿?，去年中公司就開啟了推理模型的研發(fā)工作。MiniMax高級(jí)研究總監(jiān)鐘怡然更是曾對(duì)外劇透，公司有望在4月到5月間，推出深度推理模型。

但現(xiàn)實(shí)的情況是，在技術(shù)迭代優(yōu)化過程中，MiniMax食言了。按照當(dāng)前進(jìn)度來看，樂觀情況下，MiniMax自研推理模型也要到6月中旬左右上線了。

因缺失推理模型所帶來的深度思考能力短板，還使得MiniMax在應(yīng)用側(cè)難以吸引并聚攏起更多用戶，考慮到國內(nèi)應(yīng)用還堅(jiān)持不接入DeepSeek，這一難題無疑被進(jìn)一步放大。

對(duì)比騰訊元寶，靠著率先接入DeepSeek的舉動(dòng)，其月活用戶一躍從去年AI原生APP陣營中的others，變成了當(dāng)前的行業(yè)TOP3（僅次于DeepSeek和豆包）。

B端的影響也在逐步顯現(xiàn)。因?yàn)闊o法提供推理模型選項(xiàng)，公司可能會(huì)被迫將更多模型調(diào)用需求推向?qū)κ帧?/strong>

因模型能力短板或性價(jià)比因素而轉(zhuǎn)投新陣營的事例比比皆是。去年5月DeepSeek掀起價(jià)格戰(zhàn)后，作為第一家在旗艦?zāi)Ｐ蜕细M(jìn)降價(jià)的玩家，字節(jié)就曾靠著性價(jià)比優(yōu)勢(shì)，從MiniMax手中分潤走了一部分AI兒童玩具公司Haivivi的語音模型調(diào)用需求。

B

拖累MiniMax推理模型更早上線的原因，一部分要?dú)w因于閆俊杰更大的賭性。

當(dāng)DeepSeek、Kimi們著手研發(fā)推理模型之際，MiniMax則將重心放在了架構(gòu)創(chuàng)新上。“相同的算力和資源的情況下，內(nèi)部沒有太多人力去做深度推理的，這導(dǎo)致我們跟隨深度推理的腳步慢一點(diǎn)?！盡iniMax高級(jí)研究總監(jiān)鐘怡然曾對(duì)外如此解釋。

早于DeepSeek R1發(fā)布近一周，1月15日，MiniMax發(fā)布了MiniMax-01并正式開源，在新模型中首次嘗試使用線性注意力架構(gòu)Linear Attention。

官方介紹，MiniMax-01是首次在4000億以上參數(shù)的大模型中，使用了線性注意力機(jī)制新架構(gòu)（ChatGPT采用的標(biāo)準(zhǔn)Transformer是非線性注意力機(jī)制），能高效處理全球最長的 400萬token上下文。

就像當(dāng)年冒險(xiǎn)賭注MoE一樣，閆俊杰將籌碼再次押在了Linear Attention上。

2024年4月，MiniMax成為第一批鉆研Linear Attention的AI公司。隨著MiniMax-01發(fā)布，公司內(nèi)部也開始迎來新架構(gòu)的更換，即從此前abab系列模型采用的Transformer架構(gòu)，逐步更換為MiniMax-01模型采用的線性架構(gòu)，后續(xù)視頻、音樂等多模態(tài)模型更新，都將基于全新架構(gòu)。

這也是MiniMax內(nèi)部沒有選擇立馬跟進(jìn)OpenAI o1的原因之一?！拔覀冋J(rèn)為單純強(qiáng)調(diào)推理能力，可能僅會(huì)在某些特定方面增強(qiáng)模型性能。”鐘怡然解釋說。

然而，R1的發(fā)布，給了MiniMax一個(gè)措手不及，“我們發(fā)現(xiàn)融入這些推理能力，模型的外推能力顯著提升，泛化能力更好?！睘榱俗汾s行業(yè)新態(tài)勢(shì)，鐘怡然所在的模型研發(fā)團(tuán)隊(duì)，整個(gè)春節(jié)期間都在趕工，以圖加快推理模型上線?！皟?nèi)部給出的目標(biāo)是，要做出比R1更好、甚至要達(dá)到o1或o3相近水準(zhǔn)的推理模型，且實(shí)現(xiàn)多模態(tài)推理能力?！?/p>
不甘心的閆俊杰決定再次冒險(xiǎn)：試圖趕在DeepSeek前面，推出一個(gè)原生多模態(tài)深度推理模型，既能實(shí)現(xiàn)文本推理能力，又具備視覺理解能力。

但在虎嗅爆料中，MiniMax即將發(fā)布的推理模型則指具備文本理解能力。后續(xù)是否會(huì)加入視覺理解，還是分階段逐步推出，目前仍留有懸念。

C

除了因冒險(xiǎn)押注新架構(gòu)帶來的資源分散之外，在應(yīng)用上的豪賭布局，也分散了MiniMax追求模型迭代的精力。

AI六小龍中，MiniMax布局幾乎最廣：既做To C，又做to B；既做國內(nèi)，又做海外。龐大的業(yè)務(wù)策略，帶來的代價(jià)之一便是產(chǎn)品和模型團(tuán)隊(duì)之間的“打架”。

MiniMax前員工李俊告訴字母榜，2024年，公司將收入和產(chǎn)品日活視為兩大重要指標(biāo)，甚至?xí)霈F(xiàn)這月追求收入，下月強(qiáng)調(diào)用戶增長的頻繁變動(dòng)情況。

從2023年開始，圍繞娛樂和生產(chǎn)力工具賽道，MiniMax一個(gè)都不打算放過：Talkie、星野、海螺AI相繼問世，堪比AI圈的新APP工廠。

為了打造產(chǎn)品，閆俊杰還特意挖來前今日頭條用戶產(chǎn)品負(fù)責(zé)人張前川，給其賦予了公司合伙人的身份。

但豪賭一年后，閆俊杰為公司設(shè)立的2024年收入過億美元和產(chǎn)品日活過千萬兩大目標(biāo)，均未能實(shí)現(xiàn)。這也成為公司后續(xù)人員變動(dòng)和組織架構(gòu)調(diào)整的新導(dǎo)火索。

今年3月份，MiniMax負(fù)責(zé)商業(yè)化的合伙人兼副總裁魏偉離職，更早之前，從去年9月份開始，MiniMax產(chǎn)品負(fù)責(zé)人張前川，便淡出公司事務(wù)，改任產(chǎn)品顧問一職。

兩大合伙人相繼變動(dòng)之下，MiniMax在應(yīng)用側(cè)也改變了策略：旗下AI應(yīng)用“海螺AI”一分為二，拆分為一個(gè)主打AI助手的“MiniMax”，和側(cè)重視頻創(chuàng)作的“海螺AI”。

幾次豪賭過后，閆俊杰吸取到的最大教訓(xùn)之一是，對(duì)技術(shù)品牌沒有很深的認(rèn)知。在2023年初認(rèn)識(shí)梁文鋒后，后者有兩件事對(duì)閆俊杰一直帶來啟發(fā)：一是DeepSeek品牌做得非常好；另一個(gè)是DeepSeek一開始沒有產(chǎn)品，所以更聚焦。

DeepSeek爆火并在短短時(shí)間內(nèi)成為國內(nèi)月活第一AI原生APP后，閆俊杰糾正了自己過去兩年來的一個(gè)誤區(qū)：即認(rèn)為用戶越多，模型能力提升越快。實(shí)際則是“更好的模型可以導(dǎo)向更好的應(yīng)用，但更好的應(yīng)用和更多用戶并不會(huì)導(dǎo)向更好的模型?！?/p>
基于這一新的判斷，閆俊杰重新做了取舍，不再將用戶規(guī)模和商業(yè)化視作重點(diǎn)，而是重新將技術(shù)迭代確立為MiniMax的最重要目標(biāo)。

D

但新的挑戰(zhàn)接踵而至。

當(dāng)下大模型賽道正進(jìn)入淘汰賽，資金持續(xù)承壓已成為行業(yè)現(xiàn)實(shí)。恒業(yè)資本管理合伙人江一爆料稱，魏偉的離職原因之一，是因?yàn)槿谫YKPI考核未達(dá)標(biāo)。

但被融資困住的不只有MiniMax。“本質(zhì)上是市夢(mèng)率的時(shí)代在短短兩年內(nèi)已經(jīng)結(jié)束?，F(xiàn)在面臨的是融資放緩+收入壓力+戰(zhàn)略調(diào)整的新階段?！?/strong>在江一看來，外界對(duì)大模型公司的考核標(biāo)準(zhǔn)，正從交付MaaS變成交付結(jié)果，競(jìng)爭(zhēng)焦點(diǎn)也從過去比參數(shù)大小、多模態(tài)能力，偏向現(xiàn)在比誰能真正解決用戶問題。

“最后市場(chǎng)狀態(tài)，基礎(chǔ)模型市場(chǎng)上正常情況下應(yīng)該不超過三家?！痹趺茨艽_保繼續(xù)留在這場(chǎng)大模型牌桌之上，持續(xù)獲取融資的能力便成了決定勝負(fù)的關(guān)鍵手。

畢竟，無論是更新迭代模型能力，還是打造能夠解決用戶真實(shí)需求的Agent，無一例外都需要人才和算力資源的支撐，這些要素都得靠源源不斷的金錢來維系運(yùn)轉(zhuǎn)。

稍有松懈，這些大模型廠商就可能面臨被迫落后的局面：要么核心研發(fā)人員出走創(chuàng)業(yè)，要么在重要技術(shù)迭代方向上慢人一步。

即便解決好內(nèi)部人才和資源問題，但隨著DeepSeek重新激起大廠的AI熱情，如MiniMax一般的初創(chuàng)公司，該如何在競(jìng)爭(zhēng)中繼續(xù)做出自己的技術(shù)亮點(diǎn)并保持領(lǐng)先地位，正變得越來越難。

MiniMax當(dāng)前正寄望于用新的原生多模態(tài)推理模型重回舞臺(tái)中央，但在這一領(lǐng)域，字節(jié)、阿里，騰訊，提前一步已經(jīng)在文本推理模型之外，上線了圖像推理模型：3月份，阿里通義千問團(tuán)隊(duì)推出QVQ-Max視覺推理模型；4月份，豆包深度思考模型專門打造了視覺版，具備視覺推理能力；5月份，騰訊混元T1-Vision上線元寶，可深度理解圖片內(nèi)容。

更大的競(jìng)爭(zhēng)還在后面。延期后的MiniMax推理模型，即將直面DeepSeek R2和GPT-5的競(jìng)爭(zhēng)，后兩者都有望在今年下半年上線。

近期在墨西哥舉辦的AI Summit上，OpenAI代表確認(rèn)正在開發(fā)下一代基礎(chǔ)模型GPT-5，并有望年內(nèi)上線。

DeepSeek R2的推出步伐也越來越近。按照DeepSeek以往內(nèi)部模型每7個(gè)月一更新的節(jié)奏，新一代V4模型有望在今年7月份亮相。如果梁文鋒希望在V4版本上訓(xùn)練R2,以R1與V3相隔1個(gè)月的推出時(shí)間差評(píng)估，R2最快便有望在8月份上線。

對(duì)于想要繼續(xù)留在牌桌上的閆俊杰而言，這場(chǎng)AI大模型的競(jìng)爭(zhēng)還遠(yuǎn)沒到盡頭。

參考資料：

《MiniMax正暗戳戳憋大招》虎嗅

《奧特曼逼梁文鋒出大招》直面AI

《晚點(diǎn)對(duì)話 MiniMax 閆俊杰：創(chuàng)業(yè)沒有天選之子》晚點(diǎn)對(duì)話

《3700 次預(yù)訓(xùn)練尋找 “線性注意力” 非共識(shí)，MiniMax-01 開發(fā)者講述 4 年探索》晚點(diǎn)LatePost

《MiniMax-01開源：新架構(gòu)開啟Agent時(shí)代》MiniMax稀宇科技

《MiniMax：7000萬美金營收下的甜蜜和隱憂》智能涌現(xiàn)

《MiniMax大模型每日與世界的30億次交互》MiniMax稀宇科技

特別聲明：本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載，文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn)，不代表DoNews專欄的立場(chǎng)，轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請(qǐng)聯(lián)系idonews@donews.com)

標(biāo)簽: 閆俊杰 AI 大模型 MiniMax

閆俊杰不甘心

掃描二維碼查看原文

分享自DoNews

關(guān)于我們| 電子協(xié)議| 合作聯(lián)系| 蜀ICP備2024059877號(hào)-1

網(wǎng)站信息

Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號(hào)-1
聯(lián)系地址：北京市海淀區(qū)寶盛東路興華綠色產(chǎn)業(yè)樓3層307室（東升地區(qū)）
郵箱：jubao@infinities.com.cn
網(wǎng)上有害信息舉報(bào)專區(qū): www.12377.cn

Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號(hào)-1

京公網(wǎng)安備11010802023059號(hào)

国产一区高清|日韩精品一区人妻|曰夲AV一区二区|美日韩一区二区三区|国产喷水在线观看|狼友网站成人大全|欧美日韩制服中文视频在线|久草加勒比手机在线|婷婷色综合无码专区|japanese 精品视频在线观看