智元机器人开源百万真机数据集AgiBot World
佚名
2024-12-31 22:04:33
0

高质量数据集是具身智能训练的重要燃料,但当下缺乏真机数据成为人形机器人技术发展的一个瓶颈。12月30日,澎湃科技()上海机器人初创公司智元机器人处获悉,智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,正式开源百万真机数据集AgiBot World,旨在支持更泛化和更通用的机器人大模型训练。智能机器人透露,后续该公司还将发布具身基座大模型。

据智元机器人介绍,AgiBot World是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。此前,具身智能训练领域大规模的开源数据集是Google的Open X-Embodiment。相较于前者,AgiBot World长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量也从实验室级上升到工业级标准。

“在这个具身数据的世界里,机器人不再只是进行简单的桌面任务,而是进入到人类日常生活的方方面面,既有抓取、放置、推、拉等基础操作,也有搅拌、折叠、熨烫等复杂动作。”智元机器人相关负责人介绍说。

据了解,AgiBot World数据集诞生于智元自建的大规模数据采集工厂与应用实验基地,空间总面积超过4000平方米,包含3000多种真实物品,复刻了家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)五大核心场景,收录了80多种日常生活中的多样化技能视频。

当前,高质量的数据集对于当下人形机器人技术的发展尤为重要,但行业内高质量数据稀缺这一问题存在已久,有业内人士此前在接受澎湃科技采访时曾指出,尽管语音和图像数据可以通过互联网获取进行标注训练,但机器人需要的特定场景数据极为稀缺。

在数据采集方面,一直以来,业界也正积极补齐数据短缺这一短板。比如今年8月,特斯拉对外高薪招募“数据采集员”;12月27日,北京国地共建具身智能机器人创新数据采集基地亮相,同日,上海提出“搭建超大规模城市级的模拟应用场景,率先赋能具身智能、自动驾驶等大模型实训”。

据了解,AgiBot World是智元机器人本年度开源的第三个项目,相关数据将在HuggingFace、Github以及Agibot-world.com项目主页上分批上传。智元机器人方面称,将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调;发布全套工具链,实现采集、训练和评测闭环。

相关内容

智元机器人开源百万真机数据...
高质量数据集是具身智能训练的重要燃料,但当下缺乏真机数据成为人形机...
2024-12-31 22:04:33

热门资讯

靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
中国改变全球创新药估值!生物技... 中国改变全球创新药估值!生物技术的“DeepSeek时刻”已来,中国,医药,制药,创新药,生物技术,...
96GB大容量,芝奇推出DDR... 该套装将于2025年第一季度在全球各地陆续开售。
谷歌Pixel 9a手机渲染图... IT之家 2 月 10 日消息,爆料人士 Evan Blass 曝光了谷歌 Pixel 9a 的渲染...
国产雷克萨斯终于来了,但我怀疑... 国产的雷克萨斯电车,不可能再给你玩加价那一套了
连雷军都在劝你学AI,但这课我... 连雷军都在劝你学AI,但这课我劝你别买。。。,雷军,宇宙,编程,电脑,李飞飞,人工智能
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...