商業(yè)
英偉達發(fā)布旗艦模型Nemotron 3:專為“智能體時代”設計
英偉達推出Nemotron 3系列開源模型,含Nano、Super、Ultra三版本,主打Mamba-Transformer MoE架構、強化學習訓練與百萬Token上下文,專為高效智能體系統設計。
楊亮
4小時前
天眼查App顯示,亞信科技(中國)有限公司于2024年12月4日申請了一項名為“一種基于混合專家大模型的數據處理方法及裝置”的發(fā)明專利,并于同年12月31日公布。該專利涉及混合專家大模型領域,旨在通過調用混合專家大模型對用戶輸入的目標問題文本進行處理,從而得到更準確的目標答案。
該混合專家大模型包括至少一個子模型組,每個子模型組分別對應不同的目標應用領域,子模型組中包含至少一個子模型。此外,模型還包含與子模型對應的門控權重矩陣,該矩陣利用子模型對應的有監(jiān)督數據在預訓練的問答模型進行處理得到。門控權重矩陣與訓練樣本中的問題文本的特征矩陣的點積,用于表征有監(jiān)督數據的數據特征與問題文本的數據特征的相似度。
通過這種設計,該專利能夠選擇適用于問題的子模型,并且子模型更加專注于處理對應的應用領域的問題,從而提升目標答案的準確性。這一創(chuàng)新技術有望在未來的數據處理和人工智能領域發(fā)揮重要作用。
風險警告:本文根據網絡內容由AI生成,內容僅供參考,不應作為專業(yè)建議或決策依據。用戶應自行判斷和驗證信息的準確性和可靠性,本站不承擔可能產生的任何風險和責任。內容如有問題,可聯系本站刪除。