一场关于“具身智能”的变革,正在以前所未有的速度席卷而来。从文本到图像,从二维到三维,人工智能的触角正不断延伸,基于文本和图像处理的开源模型已无法满足具身智能对三维空间感知和动态交互的需求,这使得自主研发底层模型成为行业发展的必然选择,而多模态融合则是驱动这场变革的核心引擎。机器人不再是冰冷的机械,而是具备感知、理解、交互能力的智能体,它们正以前所未有的速度融入我们的生活,重塑着产业的边界。而这场变革的核心驱动力,无疑是多模态技术的崛起。本期专访,雷峰网对话了虚拟动点董事长兼CEO刘耀东,他们基于对行业痛点的深刻理解,自主研发了一套针对3D数据处理的底层模型LYDIA。也因此拥有了更大的自主性和领先优势。更值得关注的是,随着多模态技术的不断演进,图像识别、动作驱动等技术之间的融合正在加速,这不仅将推动机器人感知能力的跃迁,也将引发整个行业的技术迭代和市场扩张。虚拟动点入局空间计算多年,基于在动作捕捉领域的案例累积,公司不仅拥有大量、高精度、高质量的动作数据,也在持续产出更多的优质数据,为人形机器人动作训练提供依托。在与刘耀东的访谈过程中,我们深入剖析了虚拟动点的技术路线、市场战略,以及对行业未来趋势的研判,看他们技术如何落地,如何解决行业难题,力求为读者呈现一个更清晰、更全面的产业图景。以下是媒体与刘耀东的对谈实录,雷峰网在不改变原意的情况下做了编辑和调整:• 全球范围内,是否有其
...
继续阅读
(5)