阿里AI三連發，連奪三項第一！

2025-07-25 21:06

7月25日，阿里巴巴全新開源千問3推理模型，性能大幅提升，一舉奪下「全球最強開源模型」王座，比肩頂級閉源模型Gemini-2.5 pro、o4-mini。本周阿里已連續開源3款重磅模型，分別斬獲基礎模型、編程模型、推理模型等主流領域的三項全球開源冠軍。兩天前開源的AI編程模型Qwen3-Coder，更是引爆全球AI圈，掀起一波用中國千問開源模型替代閉源模型的新浪潮。

最新推出的千問3推理模型，登頂全球最強開源推理模型。 自千問3旗艦模型Qwen3-235B-A22B發布后，阿里通義團隊一直在擴展大模型的推理極限，全新開源的千問3推理模型在通用能力和深度思考能力上實現巨大飛躍。千問3推理模型支持256K上下文長度，在知識（SuperGPQA）、編程（LiveCodeBench v6）、數學（AIME25）、人類偏好對齊（Arena-Hard v2）、創意寫作（WritingBench）、多語言能力（MultilF）等核心能力上，千問3推理模型完全可比肩Gemini-2.5 pro、o4-mini等頂尖閉源模型，并創下全球開源模型的最佳性能表現。

在經典基礎模型領域，千問3全球最強。3天前開源的Qwen3-235B-A22B-Instruct-2507（非思考版）新模型，性能顯著提升，在GPQA（知識）、AIME25（數學）、LiveCodeBench（編程）、Arena-Hard（人類偏好對齊）、BFCL（Agent能力）等眾多測評中表現出色，超越Claude4（Non-thinking）等領先閉源模型。權威AI研究機構Artificial Analysis指出，“千問3是全球最智能的非思考基礎模型”。

在AI編程領域，新開源的Qwen3-Coder被譽為「全球最好的編程模型」。Qwen3-Coder在代碼能力及Agent調用能力方面取得重大突破。在多語言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力評估中，Qwen3-Coder超越GPT4.1、Claude4等頂級閉源模型，并登頂全球最大AI開源社區HuggingFace 模型總榜冠軍。借助Qwen3-Coder，剛入行的程序員一天就能完成資深程序員一周的工作，生成一個品牌官網最快只需5分鐘。

Qwen3-Coder的開源，引爆硅谷科技圈，在全球AI圈掀起一波「AI編程」熱潮。推特創始人杰克·多爾西（Jack Dorsey）、爆火Agent應用Perplexity CEO 阿拉溫德·斯里尼瓦斯（Aravind Srinivas）、著名風投公司a16z合伙人馬克·馬斯克羅（Marco Mascorro）等硅谷大咖盛贊Qwen3-Coder，HuggingFace CEO 克萊門特·德朗格（Clement Delangue）更是連轉帶發12條推文，向全球開發者力薦這一最好的編程模型。海外知名模型API聚合平臺OpenRouter數據顯示，阿里千問API調用量暴漲，過去幾天已突破1000億Tokens，在OpenRouter趨勢榜上包攬全球前三，是當下最熱門的模型。

截至目前，阿里巴巴已開源300余款通義大模型，通義千問衍生模型突破14萬個，超越Meta的Llama系列成為全球第一的開源模型家族，通義也是開發者和企業使用最廣泛的大模型。未來三年，阿里巴巴還將投入超過3800億元用于建設云和AI硬件基礎設施，持續升級全棧AI能力，為中國和全球開發者和企業提供更先進的模型和云計算服務。

免責聲明：本文觀點僅代表作者本人，供參考、交流，不構成任何建議。