如何在 Microsoft Edge 中免费使用 Copilot Vision

Avilas

跟上所有新的人工智能工具可能很困难。您甚至可能可以访问许多您没有时间注意到的人工智能功能和资源。

例如,Copilot Vision 现在可供所有人免费在 Microsoft Edge 中使用。如果您不使用 Edge 作为常规浏览器,或者您从未听说过 Copilot Vision,那么您可能不会意识到这一点。

它是 Microsoft Copilot AI 的扩展,本质上可以“看到”您在网络上查看的内容。现在,这可能已经在你的脑海中敲响了一些隐私警钟:你真的希望人工智能跟踪你在网上的一举一动吗?

好吧,也许吧,如果你觉得它有用的话。这意味着您可以向 Copilot 询问您正在查看的内容并获得建议 - 无论您是想寻找最好的手冲咖啡机还是为您的下一次公路旅行制定完美的行程。

微软说您与 Copilot Vision 聊天的任何内容都不会永久存储,并且会话中的数据会在您结束后立即删除。如果您对这些护栏感到满意,请按照以下步骤开始使用该功能。

确保您使用的是最新版本的 Microsoft Edge,方法是在 WIndows 上启动浏览器,然后单击三个点(右上角),然后帮助和反馈 > 关于 Microsoft Edge。您还需要通过工具栏上三个点左侧的个人资料头像按钮登录您的 Microsoft 帐户。

然后,您需要在浏览器选项卡中导航到您想要与 Copilot Vision 聊天的网站、视频或 PDF 文件。 (请注意,人工智能将拒绝访问包含有害或成人内容的网站。)通过单击位于工具栏最右侧(三个点的右侧)的 Copilot 图标来启动 Copilot。

启用 Copilot Vision 后,您应该会看到这样的图片。截图:微软

接下来,单击 Copilot 侧面板右下角的麦克风图标。如果 Copilot Vision 可用,您需要单击“接受”,然后您将收到简短的语音说明,解释该功能的工作原理。 Copilot Vision 面板位于浏览器的中央,周围框架的颜色会发生变化,以表明 AI 功能处于活动状态。

这里有四个按钮:单击X退出 Copilot Vision,麦克风按钮可将麦克风静音和取消静音,眼镜图标可打开或关闭 Copilot Vision,齿轮图标可访问该工具的设置(目前只有一种设置可用 - 您可以选择 AI 的语音风格)。

您可以选择合作的声音。截图:微软

启动副驾驶视觉后,您只需开始说话即可。您可以像平常与 Copilot 一样讨论任何您喜欢的内容,也可以讨论页面上的任何内容。但你无法让人工智能为你采取行动——它不会滚动页面或点击链接,只是通过语音与你聊天。

目前,Copilot Vision 仍处于实验阶段,我自己的测试也证实了这一点。它在很多时候都是准确的,但它并不总是能完美地理解你所说的一切,或者在 100% 的情况下为你提供可靠的答案——就像这些人工智能机器人一样,你需要仔细检查任何重要的事情。

如何使用副驾驶视觉

现在您已经知道如何打开 Copilot Vision,那么实际如何使用它呢?假设您正在查看一个包含许多不同新闻报道的网页,例如:您可以要求人工智能总结所有标题并将其读给您听,以节省滚动和阅读的时间。然后,Copilot Vision 会询问您是否对某个故事特别感兴趣,以便您可以继续对话。

也许您正在查看某个场所、企业或组织的网页 - 摘要工具在这里也可以派上用场。您可能想询问某个地方是否适合儿童,或者查看开放时间,或者看看是否有任何可以利用的特别优惠。当然,您只需阅读页面即可完成所有这些操作,但是当需要处理大量文本和信息时,Copilot Vision 可以为您节省一些时间。

Copilot Vision 面板位于浏览器底部。截图:微软

另一种使用方法是识别图像,这是人工智能长期以来所擅长的。例如,您可以询问它您正在网上查看的植物种类,或者询问世界著名地标的位置(假设这些地标没有正确的标题,在这种情况下您已经知道了)。您甚至可以要求 Copilot Vision 就艺术、建筑或您正在查看的其他内容提供意见。

建议阅读:如何禁用 Microsoft Edge:有效的简单步骤

购物是另一个用例。如果您正在浏览屏幕上的大量选项,您可以让 Copilot Vision 根据其外观、规格或您的个人品味推荐某些内容(如果需要,人工智能会提示您这些内容)。但同样,它无法为您完成单击和滚动操作 - 您必须完成所有这些操作。

Copilot Vision 可以为您总结新闻报道。截图:微软

如果您在网络浏览器中玩轻量级游戏,Copilot Vision 甚至可以帮助您玩网络游戏。你可以询问提示和策略想法,或者如何玩游戏的说明,人工智能会帮助你。在某些网页游戏上,例如地理猜测器,副驾驶视觉可以引导您找到正确的答案。

根据我对 Copilot Vision 所做的测试,它的答案通常可以将页面上的内容与来自网络及其训练数据的更一般知识相结合,这样您就可以停下来询问有关屏幕上未显示的内容的问题。关闭 Copilot 后,您将返回到 Edge 侧面的标准 Copilot 面板。