李飞飞团队s1模型基于Qwen训练?阿里云确认:基于Qwen2.5-32B-Instruct模型训练
佚名
2025-02-08 22:01:01
0

新浪科技讯 2月6日晚间消息,今日,李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型,该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似,引发广泛关注。

不过很快,该s1模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。对此,新浪科技向阿里云方面求证,阿里云方面确认了这一消息,并回应称:“他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100 GPU上监督微调26分钟,训练出新模型s1-32B, 取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。”

阿里云方面表示,更早之前,DeepSeek官方曾透露,将DeepSeek-R1的推理能力蒸馏6个模型开源给社区,其中4个模型来自Qwen:基于Qwen-32B蒸馏的模型,在多项能力上实现了对标OpenAI o1-mini的效果。一时间,在开源社区备受追捧的通义千问Qwen模型,因这一轮推理模型技术新浪潮而浮出水面:Qwen模型性能强劲,开源尺寸多样化,并且拥有全球最大的衍生模型群,已经取代Llama成为开源社区事实上最重要的标杆基座模型。

据了解,从2023年8月起,阿里云通义千问相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括大语言模型、多模态模型、数学模型和代码模型等数十款,数次登上HuggingFace的Open LLM Leaderboard、Chatbot Arena大模型盲测榜单、司南OpenCompass等多个国内外权威大模型榜单,性能全球领先,屡次斩获“全球开源冠军”。

目前,海内外开源社区中Qwen的衍生模型数量已突破9万,超越Llama系列衍生模型,通义千问Qwen成长为世界最大的生成式语言模型族群。全球AI模型开发者都用Qwen,也可以更好地进行不同技术的差异化比较,从而进一步推动了Qwen的火热,让Qwen成为开源社区事实上最重要的标杆基座模型。(文猛)

阿里李飞飞是哪里人__阿里李飞飞p几

海量资讯、精准解读,尽在新浪财经APP

相关内容

李飞飞团队s1模型基于Qw...
新浪科技讯2月6日晚间消息,今日,李飞飞等斯坦福大学和华盛顿大学研...
2025-02-08 22:01:01

热门资讯

靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
中国改变全球创新药估值!生物技... 中国改变全球创新药估值!生物技术的“DeepSeek时刻”已来,中国,医药,制药,创新药,生物技术,...
96GB大容量,芝奇推出DDR... 该套装将于2025年第一季度在全球各地陆续开售。
谷歌Pixel 9a手机渲染图... IT之家 2 月 10 日消息,爆料人士 Evan Blass 曝光了谷歌 Pixel 9a 的渲染...
国产雷克萨斯终于来了,但我怀疑... 国产的雷克萨斯电车,不可能再给你玩加价那一套了
连雷军都在劝你学AI,但这课我... 连雷军都在劝你学AI,但这课我劝你别买。。。,雷军,宇宙,编程,电脑,李飞飞,人工智能
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...