“控制中的数字大脑”:Microsoft AI软件和机器人,这是一种推动自动化极限的进步-Techguru

简而言之
  • Microsoft揭示岩浆,将视觉和语言处理结合到控制软件和机器人的集成AI模型。
  • 🔍合作在微软和著名的大学之间,创建了一个独特的系统,结合了感知和控制。
  • 🔧岩浆以其以某种方式行动的能力而出名自主,制定计划并执行复杂的任务。
  • 🌐与其他项目相比操作员岩浆从Openai开始,将空间和言语智能纳入单个模型中。

微软最近揭幕岩浆,将视觉和语言处理结合到控制软件界面和机器人系统的综合基础。这种开发可能代表着对多种模式AI的重大进步,能够在实际和数字空间中进行交互操作。如果在Microsoft内部测试之外确认结果,则可能会改变我们与智能技术互动的方式。

空前的合作

岩浆项目不是机会的结果,而是著名研究人员之间的合作。微软与多家著名的学术机构合作,特别是Kaist,马里兰大学,威斯康星大学麦迪逊分校和华盛顿大学。这项合作旨在增强岩浆的能力,使其在处理多模式数据(例如文本,图像和视频)以及以本地方式对它们进行多模式数据的能力。

与其他基于大型语言模型的项目,例如Google Palm-E和RT-2,或Microsoft的机器人技术,Magma将感知和控制集成到单个基础模型中。这意味着这些功能无需不同的模型,这简化并优化了与机器人系统和软件接口的交互过程。

微软将岩浆定位为迈向代理AI的一步自主系统的新时代能够代表人类制定计划并执行多阶段任务。这些系统超越了对他们所看到的问题的简单答案,通过主动采取行动来实现定义的目标。

由于它有能力制定计划并采取行动,岩浆可以将各个部门从客户服务转变为包括制造业在内的医学。通过有效地从可用的视觉和语言数据传输知识,岩浆在口头,空间和时间智能之间建立了一个桥梁,使其可以在复杂的任务和环境中导航。

与其他AI项目的比较

重要的是要注意,微软并不孤单地寻求开发代理AI。诸如Openai和Google这样的竞争对手还通过诸如操作员双子座2.0。这些举措旨在创建能够在Web浏览器中执行用户界面任务或执行类似代理项目的代理。

但是,岩浆区别的是它的独特集成与基于变形金刚的大型语言模型的技术。虽然其他模型主要关注口头智能,但岩浆还包括空间智能,其中包括计划和执行动作。通过对图像,视频,机器人数据和用户界面交互的混合进行训练,岩浆被定位为真正的多模式代理。

对未来的影响

岩浆对交互式技术的未来的影响是巨大的。通过将感知和行动的能力整合到单个基础模型中,岩浆可以彻底改变人类与机器互动的方式。潜在的应用是无数的从改进用户界面到复杂环境中机器人的自主管理。

岩浆能够对多模式数据进行解释和行动,公司可能会发现效率和生产力的提高。这也可以在物流,健康和教育等领域开辟新的创新方式,在该领域,智能代理在复杂环境中导航的能力至关重要。

尽管微软继续完善岩浆,但仍然存在一个问题:这项技术将如何改变我们的日常生活,以及从广义采用中会带来哪些新的道德和技术挑战?

你喜欢它吗?4.4/5(30)