1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

科技 [视频]乐高不会拼了?这款AI能帮你根据手册拼搭出成品

本帖由 漂亮的石头2022-08-03 发布。版面名称:新闻聚焦

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    487,979
    赞:
    47
    被乐高套装难住了?最新开发的机器学习框架能够引导你拼接完成。来自斯坦福大学、麻省理工大学加速季科学和人工智能实验室、Autodeck AI 实验室的科研团队联合开发了一种基于机器学习的框架,能够根据 2D 拼搭指导手册来展示 3D 效果。

    [​IMG]

    该框架叫做 Manual-to-Executable-Plan Network(简称 MEPNet),目前已经在多款计算机生成的乐高套装、真实的乐高套装指南和 Minecraft 风格的立体建筑上成功测试,科研人员表示其性能已经超过现有其他版本。​

    对于人工智能来说,理解 2D 指导手册并不容易。研究人员表示,视觉指令有几个关键问题,就像乐高套装一样,完全由图像组成:识别 2D 和 3D 对象之间的对应关系,以及处理许多基本部件都非常困难。​


    研究人员表示在,任何复杂的乐高套装都是建立在基础的乐高砖块上。研究人员表示这增加了机器对乐高手册的理解难度,它需要推断由可见图元组成的不可见物体的 3D 姿势。​

    研究人员表示,现有的将手动步骤解析为机器可执行计划的方法主要包括两种形式:基于搜索的方法,简单准确但计算成本高;以及基于学习的模型,这些模型速度很快,但不太擅长处理看不见的 3D 形状。​

    研究人员说,MEPNet 结合了两者。研究人员写道,从组件的 3D 模型、乐高集的当前状态和 2D 手动图像开始,MEPNet “预测每个组件的一组 2D 关键点和掩码”。​

    完成后,2D 关键点“通过找到基本形状和新组件之间的可能连接,反向投影到 3D”。该团队写道,这种组合“保持了基于学习的模型的效率,并更好地推广到看不见的 3D 组件”。在论文中,研究人员表示,他们的目标是创造帮助人们组装复杂物体的机器,他们的应用列表中包括家具、乐高积木和像素世界。​

    [​IMG]

    [​IMG]

    [​IMG]
     
正在加载...