炒股配资平台_股票配资公司_股票杠杆平台_线上配资官网

阿里千问登顶全球最强开源模型,成本仅DeepSeek-R1三分之一,引领AI技术新篇章

阿里千问3成为全球最强开源模型,其成本仅为DeepSeek-R1的三分之一,这一重要突破展示了阿里在人工智能领域的强大实力和创新能力,千问3的优化和高效性能,将极大地推动开源社区和AI技术的发展,为各行业带来更多可能性。

每经杭州4月29日电(记者叶晓丹)记者从阿里云获悉,4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。

阿里千问登顶全球最强开源模型,成本仅DeepSeek-R1三分之一,引领AI技术新篇章-图1

千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T ,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,即创下所有国产模型及全球开源模型的性能新高:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

分享:
扫描分享到社交APP
上一篇
下一篇