中国一区一级黄片,久草亚洲专区一区二区三区,av网站在线免费观看

DoNews > 商業(yè) > 講真，馬斯克的Grok-3，“碰瓷”不了DeepSeek

講真，馬斯克的Grok-3，“碰瓷”不了DeepSeek

原創(chuàng) 2025-02-24 17:50:00

222741

分享到

撰文 | 雁? 秋

編輯 | 李信馬

題圖 | 豆包AI?

前不久，一場高規(guī)格民企座談會讓坊間議論紛紛。這是中央時隔6年3個月再度專門召開民營企業(yè)座談會，會上，中國互聯(lián)網和科技產業(yè)的精英齊聚一堂，釋放出新質生產力、科技創(chuàng)新產業(yè)向好的趨勢。

年輕的梁文峰也在其中，他與任正非、曾毓群等老一輩企業(yè)家同座，而他的DeepSeek正成為在場各家業(yè)務的連接橋梁。

沒過多久，馬斯克旗下xAI公司突然發(fā)布新一代大語言模型Grok-3，號稱是“地球上最聰明的人工智能”，計算能力是去年8月發(fā)布的Grok 2的10倍，推理能力超越包括ChatGPT和DeepSeek在內的其他領先AI模型。

一場橫跨太平洋的“AI對戰(zhàn)”瞬間點燃科技圈，在外界看來，Grok 3令AI行業(yè)競爭更加激烈。誰是在實驗室里“秀肌肉”，誰又能將技術變成實實在在的生產力，是未來這場風暴的中心。?

01、訓練：一個賭“壕氣”，一個用“巧思”

Grok-3是馬斯克與團隊xAI為挑戰(zhàn)OpenAI、ChatGPT而精心打造的產品，被稱為“地球上最聰明的人工智能”。

在官方的直播演示中，Grok-3和Grok-3 mini在數(shù)學、科學和編程基準測試上，超越了包括GPT-4o、DeepSeek-V3和Gemini-2 Pro等主流模型。

同時，具備推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning則超越了DeepSeek-R1和OpenAI的o3 mini等。

看得出，DeepSeek已經與頭部大模型比肩。

自打這個國產大模型爆火后，包括硅谷在內的許多AI公司都開始重新評估用堆算力和參數(shù)來推進所謂的“擴展法則”，是否仍然適用。因為DeepSeek顛覆了以往發(fā)展AI就是要不斷的堆算力、堆GPU的燒錢路子，而是采用了一條分布式算力+混合云優(yōu)化的路線：通過動態(tài)調度公有云、私有服務器甚至邊緣計算資源，結合自研的模型壓縮技術（如稀疏化訓練），在千億參數(shù)規(guī)模下實現(xiàn)了訓練成本降低40%以上。

然而目前看來，馬斯克并不這么認為。事實上，xAI一直是追求“大力出奇跡”的代表，相關負責人表示：

“如果你看看所有性能的來源，當你有一個非常強大的工程團隊和最優(yōu)秀的AI人才時，唯一需要的就是一個強大的集群，才能產生巨大的智能。”

某種意義上，Grok3也是大力出奇跡的結果，馬斯克為其攢下了“壕”無人性的算力家底。據了解，xAI團隊在122天內讓第一批10萬塊GPU投入使用，是“目前最大的完全連接的H100集群”。之后又用了92天的時間，將數(shù)據中心的容量繼續(xù)翻倍，并基于這些成果構建出了Grok-3。

而被拿來進行對比的DeepSeek-V3模型，則是在配備了2048個英偉達H800 GPU的集群上進行訓練的。H800是英偉達特供中國市場的AI芯片，在性能上不及先進的H200、H100等。

雖然如此，擁有更高集群的Grok-3在演示時也未呈現(xiàn)出“地球最聰明”的狀態(tài)。直播中Grok-3一度“思考卡殼”，在任務時因為顯示“Thinking Hard”后很長一段時間沒有反應，等待幾秒后演示人員關閉了頁面開啟下一話題。

有網友親自下場向Grok 3提問，在面對下圖中“比薩斜塔上兩個球哪個先落下”這樣常識性的問題時，Grok 3也仍然無法應對，因此被戲稱為“天才不愿意回答簡單問題”。

圖源：x（谷歌翻譯）

盡管如此，馬斯克稱未來他們將會進一步加大數(shù)據中心的建設力度，xAI的下一個計算集群會成為世界上最強大的集群，能耗達到1.2GW，相當于數(shù)十萬戶家庭1年的用電量。

網友犀利的評價：“自DeepSeek-R1之后，我們只應考慮效率更高的進步，而不僅僅那些規(guī)模更大、且比競爭對手耗能更多的進步?！?/p>

02、開源：一個“擠牙膏”，一個全開放

一般情況下，企業(yè)依靠高算力而堆出來的高性能模型，會基于成本考慮選擇閉源或延遲開源。

關于Grok-3，馬斯克并未當場宣布開源，而是表示：“當下一個版本完全發(fā)布時，將開源Grok的上一個版本，也就是當Grok-3成熟穩(wěn)定時，我們將開源Grok-2?！?/p>

2月20日，馬斯克轉發(fā)xAI的推文，宣布短期內Grok 3.0向所有人免費開放。不出意外，Grok-3會延續(xù)“基礎版開源+高級功能付費”的策略。這樣既能吸引開發(fā)者貢獻算力（社區(qū)訓練反哺主模型），又能用開源生態(tài)倒逼競爭對手。

圖源：x

而在剛剛過去的兩周，以DeepSeek為中心的朋友圈迅速擴容。國外，有包括微軟、英偉達、亞馬遜等世界級云計算巨頭；國內，三大基礎運營商、超過15家芯片廠商，還有手機、車企、云服務、金融在內的200多家企業(yè)，多地政務服務系統(tǒng)，甚至兩款“國民級應用”騰訊微信、百度搜索也先后宣布接入。

大模型到底應該開源，還是應該閉源？這個話題討論已久，企業(yè)基本上走出三條路子：

只做開源，沒有盈利模式，只有大公司燒得起，Meta是少數(shù)走這條路的；
開源閉源并行，比較靈活，既有收入又能獲取用戶，包括微軟、谷歌、阿里云、騰訊云等，均踐行這條路；
只做閉源，相當于走了一條簡單直接邏輯清晰的路，亞馬遜、華為盤古、還有以前的文心一言（百度）、GPT-4（OpenAI）均如此。亞馬遜、谷歌云在過去一年的營收增速都有所提升，這被認為是大模型拉動的結果。

在發(fā)展過程中，企業(yè)的觀念也在發(fā)生變化。長期以來，OpenAI因為「不open」（不開放）而備受爭議。OpenAI首席執(zhí)行官薩姆·奧特曼曾為下一個模型的開源項目征集意見，“做一個相當小但仍需要在GPU上運行的o3-mini級模型，還是做一個我們能做得最好的適合手機運行的模型？”

就在看似閉源OpenAI遙遙領先之時，DeepSeek開源大模型的出圈又帶來了巨大的不確定性。薩姆·奧特曼稱OpenAI在開源AI軟件方面“一直站在歷史的錯誤一邊”，他還透露，雖然并非所有員工都同意其觀點，但OpenAI內部正討論公開AI模型的權重等事宜。

開源或閉源，這其中摻雜了商業(yè)利益、技術觀點等多重因素。Gartner高級分析師Mike Fang在接受DoNews采訪時則表示，在人工智能大模型領域，開源和閉源的路線持續(xù)并存。

“如果閉源模型的性能不及開源模型，則其商業(yè)價值將受到質疑。然而，對于高性能的閉源模型，其商業(yè)路徑仍然具備優(yōu)勢。未來AI大模型可能進入低算力、低成本時期，但高端模型仍會保持一定溢價。”

至于瘋狂開源的DeepSeek，其發(fā)展模式是否會調整？未來盈利前景又將如何？在Mike Fang看來，這家公司短期不以盈利為目的，能夠從研究角度鼓勵工程師更高效運營，而沒有特別多的財務變化或者業(yè)務變化的壓力。未來如何能夠保持初心，讓發(fā)展模式或者技術創(chuàng)新能夠持續(xù)下去，才是主要考慮的方向。

換個角度想，對于日活用戶數(shù)量達數(shù)千萬的DeepSeek來說，找到盈利模式并不困難，開源的價值要比想象中大得多。從某種層面來講，DeepSeek的影響力是以往的技術突破無法比擬的——我們不應該只考慮它作為單個公司的科技價值、商業(yè)價值，而應該思考它對推動新質生產力發(fā)展的巨大價值。

03、面對DeepSeek的普及，企業(yè)要怎么做？

DeepSeek所代表的資源消耗更小、算法效率更高、推理更精確的技術路徑，正在進一步助推AI應用成本下降。

從近期企業(yè)動作來看，不僅包括大語言模型領域積累較弱的手機、家電、PC、汽車廠商，就連已經開發(fā)出AI大模型的騰訊、360、百度等大廠，也在為自家的AI工具注入新動力。

但這會產生新的問題，所有人都接入了，等于所有人都沒接。家家戶戶都有DeepSeek這把“金鑰匙”，打開市場的、或者說驅動業(yè)務增長的核心差異化能力體現(xiàn)在哪里？在新的環(huán)境下，企業(yè)又該如何競爭？

關于這一點，Gartner的Mike Fang告訴我們，企業(yè)若僅滿足于“簡單接入”，就無法在競爭中脫穎而出。關鍵是要找到適合自身業(yè)務場景的AI解決方案，深度挖掘大模型的潛力，將其與行業(yè)特點、客戶需求和特定場景緊密結合，并注重工程化落地與治理，從而實現(xiàn)高效且負責任的技術應用。

也就是說，大模型賦予產品強大的技術力，但如何將這一能力轉化為無可替代的產品體驗，讓用戶發(fā)自內心地接受使用，才是競爭的最終目標。

Mike Fang舉例表示，當下，從車企到券商紛紛宣布接入DeepSeek，但也僅僅是接入，距離真實大規(guī)模應用落地還需要更長時間。“這其中涉及到模型切換，面對新的業(yè)務場景，企業(yè)要通過不斷的流程測試以及在真實業(yè)務當中檢驗。 ”

但這里要注意數(shù)據問題，對于AI來說，有三大要素需要分析：大模型、算力和數(shù)據。在大模型迎來顛覆式創(chuàng)新之后，對算力的需求開始降低，下一個重要的瓶頸是數(shù)據。

通過Gartner研究表示，海外AI公司應用數(shù)據的能力較高，已經支持企業(yè)大模型的落地。反觀國內，數(shù)據方面的數(shù)值一直徘徊在較低位，只有少部分企業(yè)能夠實際把生成式AI應用從實驗到最后的生產落地。

這就要考驗企業(yè)是否具備構建一個從技術到市場的良性循環(huán)，不僅僅是關于產品的迭代與優(yōu)化，更是如何在短期內通過市場數(shù)據和產品調整，不斷提升大模型的能力。未來，誰能夠獲取專有數(shù)據，并能實現(xiàn)實時更新，將是競爭的關鍵所在。

單個企業(yè)是如此，而對于整個中國的AI產業(yè)來講，DeepSeek還可以帶動很多開發(fā)、推理，甚至是芯片方面的額外的機會，這將進一步加速企業(yè)“出?！薄４送?，AI接下來的治理也會變得更為重要，“如果把DeepSeek的能力比作高速行駛的一輛車，企業(yè)就需要自建或者管控出一個原生的剎車系統(tǒng)，這樣才會使得大模型更健壯，‘車’能夠開得更快?！盡ike Fang表示。

可以說，DeepSeek攪動起的，早已不是AI大模型競技規(guī)則變化的風云，而是影響多個產業(yè)迭代的深層變革浪潮。我們都站在了時代潮頭，更需要以開放的心態(tài)擁抱變化。