OpenAI机器人懂人话会干活家务小能手

“
Figure与OpenAI合作展示了全尺寸人形机器人的惊人能力。该机器人能自主互动、执行任务。此举可能对竞争对手造成压力,如特斯拉的Optimus项目和与亚马逊合作的Agility。Figure表示不会将机器人用于军事目的。
今日,一家名为 Figure 的机器人初创公司展示了其与新投资者和合作伙伴 OpenAI 的首次合作。Figure由前波士顿动力、特斯拉、谷歌 DeepMind 和 Archer 航空的员工创立,估值达到 26 亿美元,成立仅不到两年。此次合作展示令人印象深刻。
Figure 的联合创始人兼首席执行官 Brett Adcock 在社交平台 X 上发布了一段视频演示,展示了 Figure 01(读作“Figure One”)全尺寸人形机器人的惊人能力。这个机器人展示了与人类和环境互动的能力,能够听从人类的命令,找到并递给他们一个物体(在本例中是一个苹果),描述自己正在做的事情并与人类交谈。尽管反应速度略有延迟,但机器人可以自主识别、规划和执行有用的任务,如清理垃圾和整理碗盘。
视频开头的场景犹如科幻电影中的一幕,人类问道:“嗨,Figure One,你现在看到了什么?”机器人回答道:“我看到了桌子中央的盘子上有一个红苹果,一个装满杯子和盘子的晾盘架,以及你站在附近手放在桌子上。”人类接着问:“好的,我可以吃点东西吗?”机器人回答:“当然可以”,小心地拿起苹果并递给了人类——甚至不需要人类具体指定。
视频还展示了 Figure 捡拾垃圾并整理碗盘的场景。
Adcock 在 X 上的帖子中提到,“Figure 的机载摄像头输入到了 OpenAI 训练的大型视觉语言模型(VLM)中”,虽然目前尚不清楚这个模型是不是 GPT-4,OpenAI 的旗舰模型,它驱动 ChatGPT(Plus)的订阅版本,比如 GPT-4V,或者它是一个对现有模型进行了优化的版本,还是一个全新的模型。我们已经联系了 OpenAI 获取更多关于这次合作和演示的细节,等待他们的回复后会进行更新。
Adcock 还指出:“视频展示了端到端神经网络。没有远程操作。此外,这是以 1.0 倍速度拍摄并连续拍摄的。” 换句话说:视频没有加速播放,之前的人形机器人演示视频通常会加速播放,以展示更流畅的动作,而且在幕后也没有人类远程控制机器人的动作。
Figure 的演示视频似乎是人形通用机器人交互的一个重大飞跃——展示了机器人与人类相当自然地互动,服从他们,洞察他们想要的东西,并且比许多其他公司和研究人员以前的示例更流畅地完成任务。
然而,这当然仅仅是一个演示,而且是一个原型的演示。要使这样的机器人准备好进行商业部署并销售给企业和/或个人,可能还需要做出更多的工作。但 Adcock 公开表示,包括他今天在 X 上的帖子中,“我们的目标是训练一个世界模型来操作十亿级别的人形机器人。”
Figure 的目标是开发通用人形机器人,对人类产生积极影响,并为未来的几代人创造更美好的生活。这些机器人可以消除不安全和不受欢迎的工作——最终使我们过上更幸福、更有意义的生活。
Figure展示的进展,可能会给其他人形机器人领域的竞争对手,如特斯拉的 Optimus带来更大的压力。

往期推荐

多巨头联合OpenAI投资机器人公司,对马斯克的Optimus造成重大打击
AI驱动的人形机器人开始进入宝马生产线


共有 0 条评论