智元机器人与北大合作推出通用机器人操作框架

## 智元机器人与北大合作推出通用机器人操作框架

### 1月24日讯,智元机器人携手北京大学推出OmniManip架构,将视觉语言模型(VLM)的高层次推理能力转化为机器人的低层次高精度动作。

### 针对具身智能领域的难题,智元机器人与北大联合实验室提出“OmniManip”架构,基于以对象为中心的3D交互基元,实现VLM与机器人操作的结合。

### 针对大模型幻觉问题和真实环境操作的不确定性,OmniManip采用双闭环系统设计,即VLM规划和机器人执行的双重反馈,提升了操作性能。

### 实验结果表明,OmniManip作为一种免训练的开放词汇操作方法,在各种机器人操作任务中展现出强大的零样本泛化能力。

## 总结

智元机器人与北大合作推出的OmniManip架构,不仅解决了视觉语言模型在机器人操作中的应用难题,还为具身智能领域的发展提供了新的思路和方向。