亚洲天堂在线日,精品少妇人妻一区二区,日韩三级.com,久久久卡一卡,一区日韩高清无久久,黄色动图日韩久久网,日韩一区二区精品av,久久综合福利院,激情内射网站在线观看

Meta新模型Muse Spark上線 能力仍落后于第一梯隊
來源:21世紀經(jīng)濟報道作者:彭新2026-04-10 07:38
字號
超大
標準

當?shù)貢r間4月8日,Meta Platforms(納斯達克:META)旗下超級智能實驗室(Meta Superintelligence Labs,下稱MSL)發(fā)布多模態(tài)推理模型Muse Spark系列,并同步上線該系列第一款模型。

Meta將Muse Spark稱為公司“有史以來最強大的模型”。該模型支持工具使用、視覺思維鏈以及多智能體編排,主打多模態(tài)感知與推理能力。Meta首席人工智能官、MSL負責人汪滔(Alexandr Wang)介紹,過去九個月,MSL團隊“從一片空地”上重建了整條AI系統(tǒng)框架和算力基礎(chǔ)設(shè)施,推翻了過往的諸多做法。

這是MSL自2025年6月成立以來發(fā)布的首個正式產(chǎn)品,也是Meta在人工智能戰(zhàn)略大幅調(diào)整后向外界交出的第一份答卷。消息公布當日,Meta股價收漲6.50%,報612.42美元/股。

從開源轉(zhuǎn)向“閉源”,模型能力尚未全面領(lǐng)先

與Meta此前發(fā)布的Llama系列模型不同,Muse Spark為閉源模型。目前用戶可通過網(wǎng)站及Meta AI應(yīng)用程序使用該模型,但API(應(yīng)用程序接口)尚未全面開放,僅向少數(shù)客戶提供預(yù)覽版。至于Muse Spark未來是否開源,汪滔僅表示其后續(xù)版本“計劃開源”,但并未給出時間表。

在效率方面,Meta表示,通過改進模型架構(gòu)、優(yōu)化算法及數(shù)據(jù)清洗,Muse Spark的算力效率大幅提升——與上一代旗艦?zāi)P蚅lama 4 Maverick相比,Muse Spark達到相同能力所需算力不足后者十分之一。

從Meta公布的內(nèi)部基準測試結(jié)果來看,Muse Spark在多模態(tài)理解、健康問答和智能體任務(wù)方面的表現(xiàn)具有競爭力,但尚未實現(xiàn)全面超越競爭對手的頭部模型。例如,在多模態(tài)基準測試CharXiv Reasoning中,Muse Spark思考模式得分為86.4,超過GPT-5.4的82.8和Gemini 3.1 Pro High的80.2,但在其他多個多模態(tài)基準測試中,其得分低于Gemini 3.1 Pro High。

在智能體能力方面,Muse Spark思考模式在DeepSearchQA測試中得分74.8,超過Gemini 3.1的69.7和GPT-5.4的73.6,GDPval-AA Elo測試得分亦高于Gemini 3.1和Grok 4.2。在編程能力關(guān)鍵指標SWE-Bench Verified等多項基準測試中,Muse Spark的得分接近或低于Claude Opus 4.6、Gemini 3.1和GPT-5.4。

Muse Spark還提供“沉思模式(Contemplating mode)”,該模式通過編排多個智能體進行并行推理。沉思模式的Muse Spark在“人類終極考試(Humanity’s Last Exam)”中取得了58.4%的成績,略遜于GPT 5.4 Pro的58.7%,在“前沿科學研究(Frontier Science Research)”中取得了38.3%的成績,高于GPT 5.4 Pro的36.7%。

在第三方平臺Artificial Analysis的綜合智能能力排名上,Muse Spark目前列第四,前三名依次為谷歌Gemini 3.1 Pro、OpenAI GPT-5.4和Claude Opus 4.6。

獨立評測機構(gòu)Vals AI在Muse Spark公開發(fā)布前對其進行了測試。該機構(gòu)首席執(zhí)行官雷恩·克里希南(Rayan Krishnan)認為,Meta從Llama 4到Muse Spark實現(xiàn)了模型能力的顯著提升,Meta已成為一家具備競爭力的AI實驗室,若能維持當前進步速度,有望在較短時間內(nèi)推出業(yè)內(nèi)領(lǐng)先的模型。但他同時指出,編程能力仍是Muse Spark的明顯短板,預(yù)計這將是Meta后續(xù)重點攻關(guān)的方向。

驗證Meta AI戰(zhàn)略轉(zhuǎn)型成果

Muse Spark也是Meta過去一年AI戰(zhàn)略劇烈轉(zhuǎn)型的成果。

2023年至2024年間,Meta憑借Llama 1、2、3系列開源模型在AI社區(qū)贏得廣泛認可。這些模型性能接近OpenAI同期的旗艦?zāi)P?,一度成為學術(shù)領(lǐng)域和開發(fā)者社區(qū)的重要基礎(chǔ)設(shè)施。

但轉(zhuǎn)折發(fā)生于2025年4月,Meta發(fā)布開源多模態(tài)模型Llama 4后遭到外界質(zhì)疑,多名測試者指出模型針對特定排行榜進行優(yōu)化“刷榜”,實際性能甚至不及馬斯克旗下xAI發(fā)布的上一代模型。Meta后來承認了針對基準測試的特定優(yōu)化行為。

與此同時,Meta首席AI科學家楊立昆(Yann LeCun)長期質(zhì)疑主流大語言模型(LLM)路線,認為其無法通向通用人工智能,楊立昆主張基于視頻訓練的世界模型(World Model),要讓模型與人類一樣,通過物理直覺的方式來理解世界,這一立場被部分人士認為其令Meta在大模型競爭中貽誤時機。

多重壓力之下,Meta啟動了大規(guī)模AI團隊重組。2025年6月,Meta宣布以約143億美元獲得數(shù)據(jù)標注初創(chuàng)公司Scale AI 49%股份,并將時任Scale AI創(chuàng)始人兼首席執(zhí)行官汪滔招入麾下。隨后,扎克伯格發(fā)布內(nèi)部信,將基礎(chǔ)研究、產(chǎn)品團隊及FAIR整合成為新的MSL。扎克伯格給新實驗室定下的目標是:下一代AI大模型在2026年前后達到行業(yè)先進水平,未來要做服務(wù)個人的超級智能體(Agent),由汪滔與GitHub前CEO Nat Friedman領(lǐng)導(dǎo)。

Meta首席執(zhí)行官扎克伯格還親自出馬招攬AI人才,據(jù)報道曾在其位于加州帕洛阿爾托和太浩湖的私宅中接待研究人員,并開出高達1億美元的薪資待遇。最終,MSL組建了一支由50余名研究人員、工程師及其他AI從業(yè)者構(gòu)成的核心團隊。

然而,人員大規(guī)模涌入也帶來了摩擦。2025年10月,Meta被曝計劃裁減其人工智能團隊約600個職位,多名Meta早期AI員工在此期間離職,部分系主動跳槽,另有部分人員在2025年10月公司重組中遭裁員。去年底,楊立昆宣布離職,這一人事變動被外界普遍視為Meta徹底擁抱主流LLM路線的標志性信號。

對于新模型,扎克伯格曾在1月份的財報電話會議上表示,預(yù)計首批模型會表現(xiàn)不錯,但更重要的是,新模型將展示Meta所處的快速發(fā)展軌道,隨著新模型的不斷發(fā)布,預(yù)計Meta將在年內(nèi)穩(wěn)步推進技術(shù)前沿。

仍面臨巨大競爭壓力

Meta長遠目標是構(gòu)建其所謂的“超級智能”(superintelligence),這是一種超越人類的智能技術(shù),能為Meta超10億用戶提供處理各類任務(wù)的個人智能體。

而在資本市場方面,Meta在AI基礎(chǔ)設(shè)施領(lǐng)域的投入規(guī)模在美國科技公司中屬于最為激進之列。該公司此前預(yù)告,2026年資本開支可能相比上年翻一倍,預(yù)計在1150億美元至1350億美元之間。

目前來看,Meta雖已憑借Muse Spark重新進入第一梯隊的競爭視野,但距離全面領(lǐng)先仍有明顯差距,大模型賽道的競爭在2026年正愈發(fā)激烈。

4月7日,Anthropic披露最新大模型Claude Mythos Preview,號稱能在沒有任何人類干預(yù)的情況下,自主發(fā)現(xiàn)并利用各大主流操作系統(tǒng)和Web瀏覽器中的復(fù)雜漏洞。據(jù)Anthropic發(fā)布的技術(shù)博客,在體現(xiàn)真實漏洞利用能力的測試中,Claude Mythos Preview準確率大幅提升。Anthropic還表示,新模型有望重塑網(wǎng)絡(luò)安全領(lǐng)域。

此外,市場傳言顯示,OpenAI的GPT-6可能在4月推出。與此同時,DeepSeek于4月8日低調(diào)更新了對話界面,新增“快速模式”與“專家模式”選項,被部分觀察人士解讀為DeepSeekV4版本上線的前奏。

責任編輯: 鄧衛(wèi)平
聲明:證券時報力求信息真實、準確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風險自擔
下載"證券時報"官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
為你推薦
用戶評論
登錄后可以發(fā)言
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
發(fā)表評論
暫無評論
時報熱榜
換一換
    熱點視頻
    換一換
    涟源市| 上思县| 濉溪县| 淮南市| 延吉市| 忻州市| 陕西省| 绥阳县| 松阳县| 长阳| 垫江县| 集安市| 延川县| 进贤县| 玉龙| 清丰县| 阜康市| 鹰潭市| 舟曲县| 涡阳县| 思茅市| 阿荣旗| 团风县| 布尔津县| 监利县| 永善县| 游戏| 敦化市| 桃源县| 堆龙德庆县| 通山县| 昂仁县| 房山区| 济南市| 灵山县| 金塔县| 涿州市| 晋中市| 鄂尔多斯市| 厦门市| 松溪县|