商業(yè)
英偉達(dá)發(fā)布旗艦?zāi)P蚇emotron 3:專為“智能體時(shí)代”設(shè)計(jì)
英偉達(dá)推出Nemotron 3系列開源模型,含Nano、Super、Ultra三版本,主打Mamba-Transformer MoE架構(gòu)、強(qiáng)化學(xué)習(xí)訓(xùn)練與百萬Token上下文,專為高效智能體系統(tǒng)設(shè)計(jì)。
楊亮
5小時(shí)前
谷歌公司4月17日宣布,在Google AI Studio和Vertex AI中以API形式推出Gemini 2.5 Flash預(yù)覽版AI模型。這款混合推理模型具備動(dòng)態(tài)計(jì)算能力,開發(fā)者可根據(jù)查詢復(fù)雜度靈活調(diào)整處理時(shí)間。
用戶可通過Gemini應(yīng)用內(nèi)的模型選擇器直接使用該模型,并結(jié)合Canvas工具優(yōu)化文檔和代碼編輯。谷歌表示,Gemini 2.5 Flash專為高容量、實(shí)時(shí)應(yīng)用場景設(shè)計(jì),特別適合客戶服務(wù)和文檔解析等需求,是響應(yīng)式虛擬助手和實(shí)時(shí)總結(jié)工具的理想選擇。
作為首款全混合推理模型,Gemini 2.5 Flash允許開發(fā)者按需開關(guān)推理功能,平衡響應(yīng)質(zhì)量、成本和延遲。與同類前沿模型相比,其成本優(yōu)勢明顯,定價(jià)為每百萬tokens輸入0.15美元,輸出0.6至3.5美元不等。