李飞飞团队s1模型基于Qwen训练？阿里云确认：基于Qwen2.5-32B-Instruct模型训练_科技动态

李飞飞团队s1模型基于Qwen训练？阿里云确认：基于Qwen2.5-32B-Instruct模型训练

佚名

2025-02-08 22:01:01

0次

新浪科技讯 2月6日晚间消息，今日，李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型，该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似，引发广泛关注。

不过很快，该s1模型被指“并非从零开始训练”，其基座模型为“阿里通义千问（Qwen）模型”。对此，新浪科技向阿里云方面求证，阿里云方面确认了这一消息，并回应称：“他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，在16块H100 GPU上监督微调26分钟，训练出新模型s1-32B，取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比o1-preview高出27%。”

阿里云方面表示，更早之前，DeepSeek官方曾透露，将DeepSeek-R1的推理能力蒸馏6个模型开源给社区，其中4个模型来自Qwen：基于Qwen-32B蒸馏的模型，在多项能力上实现了对标OpenAI o1-mini的效果。一时间，在开源社区备受追捧的通义千问Qwen模型，因这一轮推理模型技术新浪潮而浮出水面：Qwen模型性能强劲，开源尺寸多样化，并且拥有全球最大的衍生模型群，已经取代Llama成为开源社区事实上最重要的标杆基座模型。

据了解，从2023年8月起，阿里云通义千问相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型，囊括大语言模型、多模态模型、数学模型和代码模型等数十款，数次登上HuggingFace的Open LLM Leaderboard、Chatbot Arena大模型盲测榜单、司南OpenCompass等多个国内外权威大模型榜单，性能全球领先，屡次斩获“全球开源冠军”。

目前，海内外开源社区中Qwen的衍生模型数量已突破9万，超越Llama系列衍生模型，通义千问Qwen成长为世界最大的生成式语言模型族群。全球AI模型开发者都用Qwen，也可以更好地进行不同技术的差异化比较，从而进一步推动了Qwen的火热，让Qwen成为开源社区事实上最重要的标杆基座模型。（文猛）

阿里李飞飞是哪里人__阿里李飞飞p几

海量资讯、精准解读，尽在新浪财经APP

李飞飞团队s1模型基于Qwen训练？阿里云确认：基于Qwen2.5-32B-Instruct模型训练

上一篇：英伟达加速研发GB300 NVL72：每机柜总DrMOS成本降低约35-40%

下一篇：苹果诉前员工泄露机密案达成和解，后者公开致歉

李飞飞团队s1模型基于Qwen训练？阿里云确认：基于Qwen2.5-32B-Instruct模型训练

相关内容

热门资讯