国产精品自拍亚洲-国产精品自拍一区-国产精品自拍在线-国产精品自拍在线观看-亚洲爆爽-亚洲不卡一区二区三区在线

阿里AI三連發,連奪三項第一!

2025-07-25 21:06

7月25日,阿里巴巴全新開源千問3推理模型,性能大幅提升,一舉奪下「全球最強開源模型」王座,比肩頂級閉源模型Gemini-2.5 pro、o4-mini。本周阿里已連續開源3款重磅模型,分別斬獲基礎模型、編程模型、推理模型等主流領域的三項全球開源冠軍。兩天前開源的AI編程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中國千問開源模型替代閉源模型的新浪潮。 

最新推出的千問3推理模型,登頂全球最強開源推理模型。 自千問3旗艦模型Qwen3-235B-A22B發布后,阿里通義團隊一直在擴展大模型的推理極限,全新開源的千問3推理模型在通用能力和深度思考能力上實現巨大飛躍。千問3推理模型支持256K上下文長度,在知識(SuperGPQA)、編程(LiveCodeBench v6)、數學(AIME25)、人類偏好對齊(Arena-Hard v2)、創意寫作(WritingBench)、多語言能力(MultilF)等核心能力上,千問3推理模型完全可比肩Gemini-2.5 pro、o4-mini等頂尖閉源模型,并創下全球開源模型的最佳性能表現。

 在經典基礎模型領域,千問3全球最強。3天前開源的Qwen3-235B-A22B-Instruct-2507(非思考版)新模型,性能顯著提升,在GPQA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等眾多測評中表現出色,超越Claude4(Non-thinking)等領先閉源模型。權威AI研究機構Artificial Analysis指出,“千問3是全球最智能的非思考基礎模型”。

在AI編程領域,新開源的Qwen3-Coder被譽為「全球最好的編程模型」。Qwen3-Coder在代碼能力及Agent調用能力方面取得重大突破。在多語言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力評估中,Qwen3-Coder超越GPT4.1、Claude4等頂級閉源模型,并登頂全球最大AI開源社區HuggingFace 模型總榜冠軍。借助Qwen3-Coder,剛入行的程序員一天就能完成資深程序員一周的工作,生成一個品牌官網最快只需5分鐘。 

Qwen3-Coder的開源,引爆硅谷科技圈,在全球AI圈掀起一波「AI編程」熱潮。推特創始人杰克·多爾西(Jack Dorsey)、爆火Agent應用Perplexity CEO 阿拉溫德·斯里尼瓦斯(Aravind Srinivas)、著名風投公司a16z合伙人馬克·馬斯克羅(Marco Mascorro)等硅谷大咖盛贊Qwen3-Coder,HuggingFace CEO 克萊門特·德朗格(Clement Delangue)更是連轉帶發12條推文,向全球開發者力薦這一最好的編程模型。海外知名模型API聚合平臺OpenRouter數據顯示,阿里千問API調用量暴漲,過去幾天已突破1000億Tokens,在OpenRouter趨勢榜上包攬全球前三,是當下最熱門的模型。

截至目前,阿里巴巴已開源300余款通義大模型,通義千問衍生模型突破14萬個,超越Meta的Llama系列成為全球第一的開源模型家族,通義也是開發者和企業使用最廣泛的大模型。未來三年,阿里巴巴還將投入超過3800億元用于建設云和AI硬件基礎設施,持續升級全棧AI能力,為中國和全球開發者和企業提供更先進的模型和云計算服務。

免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。