久久人人妻人人做人人爽涩爱|人妻少妇精品视频一区二区|99热只有这里有99精品|91久久国产青草亚洲,性高朝久久久久久久,成全免费看高清电影,日本欧美一区二区三区在线

重磅發(fā)布!剛剛,全線大漲!
來源:證券時報網(wǎng)作者:周樂2025-04-30 14:45

一則消息突然引爆。

今日,小米系集體爆發(fā),小米集團一度大漲超5%,金山云一度大漲超18%。消息面上,小米大模型微信公眾號稱,小米開源首個為推理(Reasoning)而生的大模型“Xiaomi MiMo”,聯(lián)動預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。

當前,AI大模型競爭再度進入白熱化。4月29日,阿里巴巴通義千問發(fā)布了新版Qwen3系列模型。同一天,世界首富馬斯克也宣布,下周Grok 3.5早期測試版將向SuperGrok訂閱者發(fā)布。

券商機構(gòu)分析認為,國內(nèi)外大模型能力差距縮小,國產(chǎn)算力芯片持續(xù)進化,國內(nèi)頭部互聯(lián)網(wǎng)廠商加大Capex投入,為國內(nèi)AI突圍之路奠定了基石。伴隨國內(nèi)外巨頭大模型持續(xù)迭代,C端或有望迎來殺手級應(yīng)用。

全線大漲

4月30日,小米系全線拉升,小米集團盤中一度大漲超5%,金山云一度大漲超18%,金山軟件最高漲超6%。

與此同時,港股云計算板塊持續(xù)拉升,截至午間收盤,金蝶國際漲4.7%,中國軟件國際漲2.72%,阿里巴巴-W漲1.48%?

據(jù)“小米大模型”公眾號消息,今日,小米開源首個為推理(Reasoning)而生的大模型“Xiaomi MiMo”,聯(lián)動預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。

據(jù)介紹,在數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo以7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview。

官方稱,在相同RL訓(xùn)練數(shù)據(jù)情況下,MiMo-7B的數(shù)學(xué)&代碼領(lǐng)域的強化學(xué)習潛力顯著領(lǐng)先。iMo-7B全系列模型均已開源。

小米技術(shù)團隊表示,MiMo的核心突破在于預(yù)訓(xùn)練與后訓(xùn)練階段的協(xié)同優(yōu)化。在預(yù)訓(xùn)練階段,模型通過挖掘高質(zhì)量推理語料并合成約2000億tokens專項數(shù)據(jù),采用三階段漸進訓(xùn)練策略,累計訓(xùn)練量達25萬億tokens。

后訓(xùn)練階段則引入創(chuàng)新強化學(xué)習技術(shù),包括自研的“Test Difficulty Driven Reward”算法和“Easy Data Re-Sampling”策略,有效提升模型在復(fù)雜任務(wù)中的穩(wěn)定性。技術(shù)團隊還開發(fā)了“Seamless Rollout”系統(tǒng),使訓(xùn)練效率提升2.29倍,驗證速度加快1.96倍。

值得注意的是,小米官方表示,MiMo-7B在相同強化學(xué)習訓(xùn)練數(shù)據(jù)下,數(shù)學(xué)與代碼領(lǐng)域的表現(xiàn)顯著優(yōu)于當前業(yè)界廣泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型。

目前,小米已在HuggingFace平臺開源MiMo-7B全系列4個模型,并發(fā)布詳細技術(shù)報告。

值得一提的是,就在小米宣布“Xiaomi Mimo”開源前,阿里巴巴通義千問于4月29日凌晨發(fā)布了新版Qwen3系列模型,包括2個MoE模型和6個dense模型。

通義千問表示,作為Qwen系列全新一代的混合推理模型,Qwen 3在GPQA、AIME24/25、LiveCodeBench等多個權(quán)威評測中表現(xiàn)出極具競爭力的結(jié)果。在相同計算資源下,Qwen 3模型以更小的規(guī)模實現(xiàn)了對更大體量上一代模型的超越,真正做到了“小而強大”。

Qwen 3融合了推理與非推理能力,在邏輯分析和創(chuàng)意生成等任務(wù)中表現(xiàn)卓越。預(yù)訓(xùn)練數(shù)據(jù)量達到約36萬億 tokens,并通過多輪大規(guī)模強化學(xué)習與精細優(yōu)化,在推理、工具調(diào)用、指令遵循及多語言能力等方面顯著提升。

“AI大模型大戰(zhàn)”再起

值得注意的是,AI大模型競爭再度進入白熱化。

4月29日,馬斯克在社交平臺上宣布,下周,Grok 3.5早期測試版將向SuperGrok訂閱者發(fā)布,它是第一個能夠準確回答有關(guān)火箭發(fā)動機或電化學(xué)技術(shù)問題的人工智能。馬斯克稱,Grok是從第一原理推理并得出互聯(lián)網(wǎng)上根本不存在的答案。

2025年以來,全球AI大模型的競爭愈發(fā)激烈,據(jù)不完全統(tǒng)計,在過去119天內(nèi),中美十家主要大模型公司就發(fā)布或更新了14款基礎(chǔ)大模型。

國際市場調(diào)研機構(gòu)Artificial Analysis發(fā)布的報告顯示,美國大模型雖然目前還領(lǐng)先,但中國的差距在不斷縮小。

西部證券指出,AI大模型能力提升和使用成本下降是主旋律,多模態(tài)或逐步成為未來基礎(chǔ)模型的標配,進一步拉動算力需求。國內(nèi)外大模型能力差距縮小,國產(chǎn)算力芯片持續(xù)進化,國內(nèi)頭部互聯(lián)網(wǎng)廠商加大Capex投入,為國內(nèi)AI突圍之路奠定了基石。

開源證券認為,AI Agent為以大語言模型(LLM)為驅(qū)動,具有自主理解、感知、規(guī)劃、記憶和使用工具的能力,能自動執(zhí)行復(fù)雜任務(wù)的系統(tǒng)。不同于傳統(tǒng)人工智能,AI Agent具備通過獨立思考、調(diào)用工具逐步完成給定目標的能力。看好AI Agent應(yīng)用將在2025年多點開花,其中AI Agent有望在B端率先商業(yè)化,電商、營銷、CRM、金融、法律等場景加速落地。伴隨國內(nèi)外巨頭大模型持續(xù)迭代,C端或有望迎來殺手級應(yīng)用。

天風證券表示,通義千問體系在模型能力、硬件能力及生態(tài)建設(shè)上保持領(lǐng)先,已實現(xiàn)全模態(tài)覆蓋,成為全球最大模型開源生態(tài)。其自主算力體系較強,覆蓋通用計算與智算需求,在自主可控行業(yè)具有優(yōu)勢。AI Agent市場規(guī)模有望超萬億,通義千問憑借在B端資源稟賦及深厚技術(shù)積淀,已發(fā)布多行業(yè)垂直生態(tài)體系,有望成為B端Agent鏈主,相關(guān)生態(tài)體系公司或?qū)⑹芤妗?/p>

排版:王璐璐

校對:陶謙???

責任編輯: 冉超
聲明:證券時報力求信息真實、準確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風險自擔
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換