阿裏Qwen猛追DeepSeek

2025-07-05 08:00:06栏目：评测

TAG：贝贝社交

技術迭代加速，生態競爭白熱化。

來源：華爾街見聞⠠⠤𝜨€… | 劉寶丹

編輯 | 黃昱

46天前，DeepSeek-R1正式發布，並同步開源模型權重，App也做了更新。此後，DeepSeek火遍全球，帶領中國AI向前邁出一大步。46天之後，阿裏複製了這一路徑。

3月6日淩晨，阿裏發布並開源全新的推理模型通義千問QwQ-32B，該模型整體性能比肩DeepSeek-R1，並將部署成本進一步降到了消費級顯卡水平上。同時，用戶也將可通過通義APP免費體驗該模型。

這意味著，繼DeepSeek、騰訊、月之暗麵等公司之後，阿裏也正式推出了深度推理模型，進一步推動模型在更複雜場景的應用。

千問QwQ-32B是阿裏探索推理模型的最新成果，推理能力疊加低消耗，使得該模型適合快速響應或對數據安全要求高的應用場景。不過，多位業內人士均對華爾街見聞表示，該模型的市場反饋還需要一段時間觀望。

當日收盤，阿裏港股報140.800港元，創近三年新高，當日股價漲幅8.39%。年初以來，阿裏股價漲幅超過70%，市值達2.68萬億港元。美股收盤，阿裏股價微跌0.77%。

這場全球AI競賽正處於關鍵的攻堅階段，阿裏的硬仗才剛剛開始。

追趕DeepSeek

DeepSeek是當前最受青睞的AI大模型，如今，阿裏準備取而代之。

這次，阿裏發布的通義千問QwQ-32B屬於中等參數模型，它最大的亮點是做到了大參數推理模型才具備的效果，很大程度上證明了，參數規模不再是模型性能的決定性因素。

根據阿裏公布的一係列權威基準測試，千問QwQ-32B模型表現異常出色，幾乎完全超越了OpenAI-o1-mini，比肩最強開源推理模型DeepSeek-R1，後者擁有6710億參數。

比如，在測試數學能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，千問QwQ-32B表現與DeepSeek-R1相當，遠勝於o1-mini及相同尺寸的R1蒸餾模型。在LiveBench、穀歌等提出的IFEval評測集、由加州大學伯克利分校等提出的BFCL測試中，千問QwQ-32B的得分均超越了DeepSeek-R1。

千問QwQ-32B在保持強勁性能的同時，大幅降低了部署使用成本。阿裏表示，該模型在消費級顯卡上也能實現本地部署。

北京星漢未來創始人、CEO劉道儒對華爾街見聞表示，DeepSeek-R1滿血版是671B，對部署配置要求非常高，需要至少8張A100顯卡，QwQ-32B的話，英偉達4090的增強版就能部署，成本是R1的1/10以內，會更利於推理模型的應用和普及。

千問QwQ-32B更高的性價比背後，得益於阿裏采取了不同的技術路線。華爾街見聞從內部人士處獲悉，該模型采用了密集架構（Dense），而DeepSeek是混合專家係統（MoE），Dense和MoE是模型架構的兩種形態。

該人士進一步表示，阿裏通義團隊在冷啟動基礎上，針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習，在32B的模型尺寸上獲得了令人驚喜的推理能力提升，印證了大規模強化學習可顯著提高模型性能。

阿裏雲內部員工稱，推理模型內部做了很久，公司從年初二就開始加班，至今沒有在半夜兩點之前下過班，現在也是這個狀態，公司上周發布了預覽版，緊接著這周就發布正式版並開源。

在業內看來，千問QwQ-32B進一步降低了模型的應用成本，尤其該模型既能提供極強的推理能力，又能滿足更低的資源消耗需求，適合快速響應或對數據安全要求高的應用場景，開發者和企業可以在消費級硬件上將其部署到本地設備中，打造AI解決方案。

目前，千問QwQ-32B已在魔搭社區、HuggingFace及GitHub等平台基於寬鬆的Apache2.0協議開源，所有人都可免費下載模型進行本地部署。用戶也將可通過通義APP免費體驗最新的千問QwQ-32B模型。

對於雲端部署需求，用戶可通過阿裏雲PAI平台完成快速部署，並進行模型微調、評測和應用搭建；或是選擇容器服務ACK搭配阿裏雲GPU算力，實現模型容器化部署和高效推理。

三年豪擲3800億

如果說DeepSeek帶火了中國AI產業，那阿裏無疑是承接這一波AI紅利的贏家之一。

2月24日，阿裏巴巴集團CEO吳泳銘宣布，未來三年，阿裏將投入超過3800億元，用於建設雲和AI硬件基礎設施，總額超過去十年總和。這也創下中國民營企業在雲和AI硬件基礎設施建設領域有史以來最大規模投資紀錄。

阿裏對AI進行了廣泛的布局，包括雲計算、模型以及自身生態體係的應用，但歸根到底，阿裏最看重的主線是支撐AI應用的雲計算市場。

2月21日，在最新季度電話會上，阿裏表示，阿裏AI戰略的首要目標是追求實現AGI，不斷突破模型智能能力邊界，智能就是AI模型背後輸出的token，未來90%的token將在雲計算網絡上生成和輸出，通過阿裏雲遍布全球的數據中心，才能以更快的方式輸送給全球開發者。

對阿裏來說，一個重要策略就是開源。作為國內最早開源自研大模型的大廠，阿裏雲在業界率先實現“全尺寸、全模態、多場景”開源。

在QwQ-32B之前，阿裏今年已經先後開源了100萬Tokens上下文的Qwen2.5-1M模型，以及視覺模型Qwen2.5-VL。去年11月，阿裏開源了通義千問代碼模型全係列，共6款Qwen2.5-Coder模型。

2023年至今，阿裏通義團隊已開源200多款模型，包含大語言模型千問Qwen及視覺生成模型萬相Wan等兩大基模係列，開源囊括文本生成模型、視覺理解/生成模型、語音理解/生成模型、文生圖及視頻模型等全模態，覆蓋從0.5B到110B等參數。

據阿裏內部人士介紹，截至目前，海內外AI開源社區中千問Qwen的衍生模型數量突破10萬，超越美國Llama係列模型，成為全球最大的開源模型族群。

在劉道儒看來，模型開源最有利的還是阿裏雲等雲廠商，模型門檻降低了，但算力的門檻還是很高的，不管推理還是訓練都需要用到大規模的GPU算力，因此阿裏全力推動開源。

阿裏雲首席技術官周靖人曾對華爾街見聞表示，希望能以開放心態把先進技術開源出來，讓大家做並行探索。AI產品也一樣，通過開源的體係跟企業一起探索，不僅僅是模型能力提升，更重要的是基於模型能夠做什麽，把它的前景和潛力深入地挖掘出來。

不過，阿裏QwQ-32B開源後的效果還需要時間來進一步觀察。有業內人士表示擔憂，當前推理模型主要是用來做數學題和寫代碼，但DeepSeek出圈的是文學創作和思想性的內容，從用戶視角達到“比肩”效果並不容易。

可以確定的是，開源已經成為AI發展的主流。DeepSeek通過開源周活動公布了最新技術進展，包括FlashMLA、DeepEP、DeepGEMM和3FS四個開源項目，以及DualPipe、EPLB等代碼庫，並在最後一天披露了理論上的成本利潤率545%這一數字。

3月6日，騰訊混元發布圖生視頻模型並對外開源。目前，混元開源係列模型在Github累計獲得超2.3萬開發者關注和star（星標）。百度近日也宣布，文心大模型4.5將於3月16日發布，並於6月30日正式開源。

2月18日，階躍星辰首次開源，將開源視頻生成模型Step-Video-T2V和開源語音交互大模型Step-Audio向全球開發者開源。更早之前，MiniMax開源了MiniMax-01全新係列模型，包含基礎語言大模型MiniMax-Text-01和視覺多模態大模型MiniMax-VL-01。

同期，月之暗麵也公布了稀疏注意力技術——MoBA（MixtureofBlockAttention），這是一種受專家混合（MoE）和塊稀疏注意力（BlockSparseAttention）啟發的注意力架構，能夠在全注意力和稀疏注意力模式之間無縫切換，使其成為長上下文任務的有效解決方案。

各家AI公司紛紛拿出自己壓箱底兒的技術路線背後，AI行業已經從最初的技術競賽大步邁向應用落地，後者將是2025年AI公司最激烈的戰場。

打響AI應用之戰

開源已經成為多數AI企業的選擇，甚至在很多人眼裏，是否開源關係著公司能否在這場AI軍備賽中拔得頭籌。

在上述內部人士看來，行業最早開源是一個無奈之舉，因為大家的水平跟OpenAI開發的GPT差距比較大，需要追趕，如果不開源，差距隻會越來越大，現在開源模型和GPT的能力已經很小，現在開源更多是搶占行業話語權。

階躍星辰創始人、CEO薑大昕表示，開源是希望分享最新技術成果，更重要的是，多模態模型是實現AGI的必經之路，目前尚處於早期階段，需要開發者集思廣益，共同拓展模型技術邊界，並推動產業落地。

“不開源就開除。”一位提供AI雲基礎設施的公司高管對華爾街見聞表示，今年春節前後，DeepSeek陸續開源了基礎模型和推理模型，其他模型公司被逼得沒有辦法，不開源都活不下去，也融不到錢。

多位業內人士表示，當前行業對開源模式的強烈推崇，本質在於，開源已成為推動技術迭代、生態構建、市場擴張的核心策略，而閉源或“偽開源”模式則可能因技術壁壘難以維係或生態封閉性逐漸失去競爭力。

不過，開源也帶來了商業化上的挑戰。對很多AI模型廠商來說，此前的主要收費方式是按Token給API定價，如今將模型權重開源之後，如何實現盈利的可持續增長成為亟需破解的難題。

一位AI模型廠商內部人士表示，這可能會倒逼模型公司重新思考商業模式，公司的商業重心會往服務端走。模型落地要考慮的問題非常多，如果應用在生產環節，要考慮產品設備的穩定性和性能，模型需要很多配套的工具鏈。“提供企業級服務是未來比較有商業價值的地方。”

劉道儒認為，開源之後模型微調、蒸餾等需求也會劇增，微調、蒸餾還是有門檻的，其他模型公司可以幫助企業在垂直場景落地。此外，像多模態大模型、語音大模型等不同類型的大模型由於通用性不強、算力要求高，也相對適合其他大模型廠商。

目前，AI大模型廠商已經開始把重點放在垂類應用上，以期打造出差異化競爭力。3月3日，AI獨角獸百川智能啟動了一輪裁員，金融行業ToB業務團隊被裁撤，員工當天就簽署了離職協議。

華爾街見聞從百川內部獲悉，公司優化金融業務是為了集中資源，聚焦核心優勢業務，加速實現“造醫生、改路徑、促醫學”的願景。據了解，百川與北京兒童醫院共同研發的AI兒科醫生已在疑難病例的頂級專家會診中正式“上崗”。

AI Agent被認為是2025年AI落地的最重要產品形態。3月6日，全球首款通用AI Agent Manus迅速火爆整個社交圈，它在寫文章、做PPT、寫分析報告等能力上表現出色，雖然目前仍有不少質疑聲，但Manus爆火本身說明，市場對AI Agent已經有了很大期待。

目前，智譜、MiniMax和階躍星辰等都在大力發展AI Agent。長上下文能力與多模態處理能力的提升，是發展AI Agent的必要條件，這也被認為是AI創業公司接下來最重要的機遇。

去年12月，智譜披露了Agent新進展，公司發布的AutoGLM可以自主執行超過50步的長步驟操作，也可以跨app執行任務，AutoGLM被認為是邁向AI智能操作係統的重要嚐試。近日，智譜與三星達成合作，未來會將Agent體驗帶到三星最新手機GalaxyS25係列上。

此外，千問QwQ-32B模型也集成了與智能體Agent相關的能力，使其能夠在使用工具的同時進行批判性思考，並根據環境反饋調整推理過程。阿裏通義團隊表示，未來將繼續探索將智能體與強化學習的集成，以實現長時推理，探索更高智能進而最終實現AGI的目標。

在經過兩年的AI技術競賽後，AI市場正在迎來新一輪大洗牌，阿裏、騰訊、字節憑借各自龐大的生態優勢嶄露頭角，對於AI創業公司來說，未來的機會點仍然是找到差異化能力，並持續打造競爭壁壘。

這會是異常殘酷的淘汰賽，槍聲已經打響了。

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

阿裏Qwen猛追DeepSeek

随机看看

热门文章

推荐文章