字节发布机器人全能大脑机器人有一体化大脑了
字节Seed发布了一个给机器人用的大模型Robix。跟过去“散装拼接”的方案不同,它用一个模型就能搞定推理、任务规划和自然语言交互。
传统做机器人时,语言理解、任务规划、动作执行往往要分模块处理,信息衔接费时费力。而Robix把视觉和语言结合,从而避免模块间沟通的卡顿。
- 思维链推理:像人一样一步步琢磨怎么做,考虑物体、空间关系和任务要求;
- 三阶段训练:先大规模预训练学会理解,再监督微调适应真实任务,最后靠强化学习提升决策稳定性。
在性能上,Robix两个版本(7B和32B)在多项空间理解任务里表现超越Qwen2.5-VL,并在多数基准测试中压过GPT-4o和Gemini 2.5 Pro。真实机器人测试中,Robix-32B的任务完成度也更高,达到92.5%。
有人说,机器人比拼的时代,可能不再是“拼模块”,而是看谁能打造更强的一体化大脑。
技术细节可见:
官网:robix-seed.github.io/robix/
论文:arxiv.org/abs/2509.01106