阿裏Qwen猛追DeepSeek
技術迭代加速,生態競爭白熱化。
來源:華爾街見聞⠠⠤𝜨 | 劉寶丹
編輯 | 黃昱
46天前,DeepSeek-R1正式發布,並同步開源模型權重,App也做了更新。此後,DeepSeek火遍全球,帶領中國AI向前邁出一大步。46天之後,阿裏複製了這一路徑。
3月6日淩晨,阿裏發布並開源全新的推理模型通義千問QwQ-32B,該模型整體性能比肩DeepSeek-R1,並將部署成本進一步降到了消費級顯卡水平上。同時,用戶也將可通過通義APP免費體驗該模型。
這意味著,繼DeepSeek、騰訊、月之暗麵等公司之後,阿裏也正式推出了深度推理模型,進一步推動模型在更複雜場景的應用。
千問QwQ-32B是阿裏探索推理模型的最新成果,推理能力疊加低消耗,使得該模型適合快速響應或對數據安全要求高的應用場景。不過,多位業內人士均對華爾街見聞表示,該模型的市場反饋還需要一段時間觀望。
當日收盤,阿裏港股報140.800港元,創近三年新高,當日股價漲幅8.39%。年初以來,阿裏股價漲幅超過70%,市值達2.68萬億港元。美股收盤,阿裏股價微跌0.77%。
這場全球AI競賽正處於關鍵的攻堅階段,阿裏的硬仗才剛剛開始。
追趕DeepSeek
DeepSeek是當前最受青睞的AI大模型,如今,阿裏準備取而代之。
這次,阿裏發布的通義千問QwQ-32B屬於中等參數模型,它最大的亮點是做到了大參數推理模型才具備的效果,很大程度上證明了,參數規模不再是模型性能的決定性因素。
根據阿裏公布的一係列權威基準測試,千問QwQ-32B模型表現異常出色,幾乎完全超越了OpenAI-o1-mini,比肩最強開源推理模型DeepSeek-R1,後者擁有6710億參數。
比如,在測試數學能力的AIME24評測集上,以及評估代碼能力的LiveCodeBench中,千問QwQ-32B表現與DeepSeek-R1相當,遠勝於o1-mini及相同尺寸的R1蒸餾模型。在LiveBench、穀歌等提出的IFEval評測集、由加州大學伯克利分校等提出的BFCL測試中,千問QwQ-32B的得分均超越了DeepSeek-R1。
千問QwQ-32B在保持強勁性能的同時,大幅降低了部署使用成本。阿裏表示,該模型在消費級顯卡上也能實現本地部署。
北京星漢未來創始人、CEO劉道儒對華爾街見聞表示,DeepSeek-R1滿血版是671B,對部署配置要求非常高,需要至少8張A100顯卡,QwQ-32B的話,英偉達4090的增強版就能部署,成本是R1的1/10以內,會更利於推理模型的應用和普及。
千問QwQ-32B更高的性價比背後,得益於阿裏采取了不同的技術路線。華爾街見聞從內部人士處獲悉,該模型采用了密集架構(Dense),而DeepSeek是混合專家係統(MoE),Dense和MoE是模型架構的兩種形態。
該人士進一步表示,阿裏通義團隊在冷啟動基礎上,針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習,在32B的模型尺寸上獲得了令人驚喜的推理能力提升,印證了大規模強化學習可顯著提高模型性能。
阿裏雲內部員工稱,推理模型內部做了很久,公司從年初二就開始加班,至今沒有在半夜兩點之前下過班,現在也是這個狀態,公司上周發布了預覽版,緊接著這周就發布正式版並開源。
在業內看來,千問QwQ-32B進一步降低了模型的應用成本,尤其該模型既能提供極強的推理能力,又能滿足更低的資源消耗需求,適合快速響應或對數據安全要求高的應用場景,開發者和企業可以在消費級硬件上將其部署到本地設備中,打造AI解決方案。
目前,千問QwQ-32B已在魔搭社區、HuggingFace及GitHub等平台基於寬鬆的Apache2.0協議開源,所有人都可免費下載模型進行本地部署。用戶也將可通過通義APP免費體驗最新的千問QwQ-32B模型。
對於雲端部署需求,用戶可通過阿裏雲PAI平台完成快速部署,並進行模型微調、評測和應用搭建;或是選擇容器服務ACK搭配阿裏雲GPU算力,實現模型容器化部署和高效推理。
三年豪擲3800億
如果說DeepSeek帶火了中國AI產業,那阿裏無疑是承接這一波AI紅利的贏家之一。
2月24日,阿裏巴巴集團CEO吳泳銘宣布,未來三年,阿裏將投入超過3800億元,用於建設雲和AI硬件基礎設施,總額超過去十年總和。這也創下中國民營企業在雲和AI硬件基礎設施建設領域有史以來最大規模投資紀錄。
阿裏對AI進行了廣泛的布局,包括雲計算、模型以及自身生態體係的應用,但歸根到底,阿裏最看重的主線是支撐AI應用的雲計算市場。
2月21日,在最新季度電話會上,阿裏表示,阿裏AI戰略的首要目標是追求實現AGI,不斷突破模型智能能力邊界,智能就是AI模型背後輸出的token,未來90%的token將在雲計算網絡上生成和輸出,通過阿裏雲遍布全球的數據中心,才能以更快的方式輸送給全球開發者。
對阿裏來說,一個重要策略就是開源。作為國內最早開源自研大模型的大廠,阿裏雲在業界率先實現“全尺寸、全模態、多場景”開源。
在QwQ-32B之前,阿裏今年已經先後開源了100萬Tokens上下文的Qwen2.5-1M模型,以及視覺模型Qwen2.5-VL。去年11月,阿裏開源了通義千問代碼模型全係列,共6款Qwen2.5-Coder模型。
2023年至今,阿裏通義團隊已開源200多款模型,包含大語言模型千問Qwen及視覺生成模型萬相Wan等兩大基模係列,開源囊括文本生成模型、視覺理解/生成模型、語音理解/生成模型、文生圖及視頻模型等全模態,覆蓋從0.5B到110B等參數。
據阿裏內部人士介紹,截至目前,海內外AI開源社區中千問Qwen的衍生模型數量突破10萬,超越美國Llama係列模型,成為全球最大的開源模型族群。
在劉道儒看來,模型開源最有利的還是阿裏雲等雲廠商,模型門檻降低了,但算力的門檻還是很高的,不管推理還是訓練都需要用到大規模的GPU算力,因此阿裏全力推動開源。
阿裏雲首席技術官周靖人曾對華爾街見聞表示,希望能以開放心態把先進技術開源出來,讓大家做並行探索。AI產品也一樣,通過開源的體係跟企業一起探索,不僅僅是模型能力提升,更重要的是基於模型能夠做什麽,把它的前景和潛力深入地挖掘出來。
不過,阿裏QwQ-32B開源後的效果還需要時間來進一步觀察。有業內人士表示擔憂,當前推理模型主要是用來做數學題和寫代碼,但DeepSeek出圈的是文學創作和思想性的內容,從用戶視角達到“比肩”效果並不容易。
可以確定的是,開源已經成為AI發展的主流。DeepSeek通過開源周活動公布了最新技術進展,包括FlashMLA、DeepEP、DeepGEMM和3FS四個開源項目,以及DualPipe、EPLB等代碼庫,並在最後一天披露了理論上的成本利潤率545%這一數字。
3月6日,騰訊混元發布圖生視頻模型並對外開源。目前,混元開源係列模型在Github累計獲得超2.3萬開發者關注和star(星標)。百度近日也宣布,文心大模型4.5將於3月16日發布,並於6月30日正式開源。
2月18日,階躍星辰首次開源,將開源視頻生成模型Step-Video-T2V和開源語音交互大模型Step-Audio向全球開發者開源。更早之前,MiniMax開源了MiniMax-01全新係列模型,包含基礎語言大模型MiniMax-Text-01和視覺多模態大模型MiniMax-VL-01。
同期,月之暗麵也公布了稀疏注意力技術——MoBA(MixtureofBlockAttention),這是一種受專家混合(MoE)和塊稀疏注意力(BlockSparseAttention)啟發的注意力架構,能夠在全注意力和稀疏注意力模式之間無縫切換,使其成為長上下文任務的有效解決方案。
各家AI公司紛紛拿出自己壓箱底兒的技術路線背後,AI行業已經從最初的技術競賽大步邁向應用落地,後者將是2025年AI公司最激烈的戰場。
打響AI應用之戰
開源已經成為多數AI企業的選擇,甚至在很多人眼裏,是否開源關係著公司能否在這場AI軍備賽中拔得頭籌。
在上述內部人士看來,行業最早開源是一個無奈之舉,因為大家的水平跟OpenAI開發的GPT差距比較大,需要追趕,如果不開源,差距隻會越來越大,現在開源模型和GPT的能力已經很小,現在開源更多是搶占行業話語權。
階躍星辰創始人、CEO薑大昕表示,開源是希望分享最新技術成果,更重要的是,多模態模型是實現AGI的必經之路,目前尚處於早期階段,需要開發者集思廣益,共同拓展模型技術邊界,並推動產業落地。
“不開源就開除。”一位提供AI雲基礎設施的公司高管對華爾街見聞表示,今年春節前後,DeepSeek陸續開源了基礎模型和推理模型,其他模型公司被逼得沒有辦法,不開源都活不下去,也融不到錢。
多位業內人士表示,當前行業對開源模式的強烈推崇,本質在於,開源已成為推動技術迭代、生態構建、市場擴張的核心策略,而閉源或“偽開源”模式則可能因技術壁壘難以維係或生態封閉性逐漸失去競爭力。
不過,開源也帶來了商業化上的挑戰。對很多AI模型廠商來說,此前的主要收費方式是按Token給API定價,如今將模型權重開源之後,如何實現盈利的可持續增長成為亟需破解的難題。
一位AI模型廠商內部人士表示,這可能會倒逼模型公司重新思考商業模式,公司的商業重心會往服務端走。模型落地要考慮的問題非常多,如果應用在生產環節,要考慮產品設備的穩定性和性能,模型需要很多配套的工具鏈。“提供企業級服務是未來比較有商業價值的地方。”
劉道儒認為,開源之後模型微調、蒸餾等需求也會劇增,微調、蒸餾還是有門檻的,其他模型公司可以幫助企業在垂直場景落地。此外,像多模態大模型、語音大模型等不同類型的大模型由於通用性不強、算力要求高,也相對適合其他大模型廠商。
目前,AI大模型廠商已經開始把重點放在垂類應用上,以期打造出差異化競爭力。3月3日,AI獨角獸百川智能啟動了一輪裁員,金融行業ToB業務團隊被裁撤,員工當天就簽署了離職協議。
華爾街見聞從百川內部獲悉,公司優化金融業務是為了集中資源,聚焦核心優勢業務,加速實現“造醫生、改路徑、促醫學”的願景。據了解,百川與北京兒童醫院共同研發的AI兒科醫生已在疑難病例的頂級專家會診中正式“上崗”。
AI Agent被認為是2025年AI落地的最重要產品形態。3月6日,全球首款通用AI Agent Manus迅速火爆整個社交圈,它在寫文章、做PPT、寫分析報告等能力上表現出色,雖然目前仍有不少質疑聲,但Manus爆火本身說明,市場對AI Agent已經有了很大期待。
目前,智譜、MiniMax和階躍星辰等都在大力發展AI Agent。長上下文能力與多模態處理能力的提升,是發展AI Agent的必要條件,這也被認為是AI創業公司接下來最重要的機遇。
去年12月,智譜披露了Agent新進展,公司發布的AutoGLM可以自主執行超過50步的長步驟操作,也可以跨app執行任務,AutoGLM被認為是邁向AI智能操作係統的重要嚐試。近日,智譜與三星達成合作,未來會將Agent體驗帶到三星最新手機GalaxyS25係列上。
此外,千問QwQ-32B模型也集成了與智能體Agent相關的能力,使其能夠在使用工具的同時進行批判性思考,並根據環境反饋調整推理過程。阿裏通義團隊表示,未來將繼續探索將智能體與強化學習的集成,以實現長時推理,探索更高智能進而最終實現AGI的目標。
在經過兩年的AI技術競賽後,AI市場正在迎來新一輪大洗牌,阿裏、騰訊、字節憑借各自龐大的生態優勢嶄露頭角,對於AI創業公司來說,未來的機會點仍然是找到差異化能力,並持續打造競爭壁壘。
這會是異常殘酷的淘汰賽,槍聲已經打響了。
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。