如何使用 ChatGPT 的新图像和语音选项

Avilas

ChatGPT 目前很少消失在新闻中,其背后的工程师定期推出生成式 AI 聊天机器人的新功能和改进,包括最近的新语音和图像功能。

[ 有关的:ChatGPT 现在可以看到、听到并与某些用户交谈]

简单来说,根据 OpenAI博客文章,这些新功能意味着 ChatGPT 现在可以看、听和说话。与机器人交互时,您不再局限于文本提示,但值得注意的是,这些功能目前仍然是付费 ChatGPT Plus 用户独有的。起初,只有有限数量的用户在推出这些功能时获得了这些功能,但现在每个 ChatGPT Plus 用户都应该有权访问。 (11月21日,ChatGPT语音聊天功能已向所有免费用户推出.)

除了改变您与 ChatGPT 交互的方式之外,这些新功能还扩大了它的功能范围,例如给您读睡前故事。以下是新内容以及如何充分利用它。

您有五种语音选项可用于与 ChatGPT 交谈。 OpenAI/大卫·尼尔德

如果您是 ChatGPT Plus 用户并且想要与 ChatGPT 交谈,则需要使用移动应用程序和iOS系统(此功能尚未添加到 ChatGPT在网络上)。登录帐户并到达主提示屏幕后,点击耳机图标(右下角)即可开始与机器人进行语音对话。

您将看到一个闪屏,解释该功能的用途,然后您可以点击选择声音就是这样做。有五个可供选择,如果您选择其中任何一个,您都会听到简短的预览。轻敲确认当您决定要与哪一位交谈时,您就可以开始交谈了。

与 ChatGPT 交谈就像与手机交谈一样简单。当您停止说话时,应用程序将处理您所说的内容并生成响应。您经常会发现,当它说话时,ChatGPT 会以相关问题结束其响应,以保持对话继续,但您始终可以要求谈论其他内容,或点击左下角的暂停按钮开始新的聊天。

推荐阅读:2025 年创造这种声音的 5 个选项

如果 ChatGPT 不能完全听清您所说的内容或识别您说话时的停顿,您可以通过点击并按住屏幕,以对讲机的方式手动为其提供语音输入。说出您需要说的话,然后松开手指,聊天就会得到处理 - 这是一种更加谨慎的交谈方式,您可能会发现更容易。

考虑如何更好地进行口头回应:例如,您可以让 ChatGPT 给您讲一个睡前故事,或者一首关于您选择的主题的诗。与文本提示一样,您可以根据自己的喜好指定主题或语气。当您准备好返回 ChatGPT 主界面时,点击红白十字图标,您将看到以文本格式给出的回复。

图像输入和输出


ChatGPT 可以为您识别图像的内容。图片来源:大卫·尼尔德

您现在可以使用图像提示 ChatGPT,无论是在网络上或通过应用程序或者iOS系统。在网页上,单击输入框左侧的回形针图标,然后从计算机中选取图像;在应用程序中,点击图片图标从图库中选择图像,或点击相机图标拍摄新照片(如果看不到这些图标,请点击+输入框左侧的按钮)。

您将被邀请在图像旁边添加提示,并且您在这里的选项几乎是无限的。例如,您可以向 ChatGPT 询问图像内部的内容。您还可以拍摄问题的照片(例如漏水的水龙头)并询问解决问题的最佳方法,或者向 ChatGPT 展示冰箱中的物品并询问有关煮什么饭菜的建议。

如果您使用移动应用程序,则可以在添加附带提示之前点击图像,并在图像的特定部分周围乱涂乱画 - 这会将 ChatGPT 的注意力集中在图像的特定部分上,这对于解决问题或澄清特定内容非常有用。

图像生成器 DALL-E(同样由 OpenAI 开发)现在也集成在 ChatGPT 内。这意味着您可以要求生成新图像,也可以使用自己的图像作为提示:要求它生成连绵起伏的丘陵景观、肮脏的夜间街道场景,或者室内位置的卡通风格渲染。您还可以要求它修改或构建您提供的图像。

与文本提示一样,越具体越好 - 您可以非常精确地了解图片中的内容、使用的样式以及如何应用颜色和阴影。因此,您可能会说您想看到一幅卡通风格的田野图片,前景中有一口井。或者,您可能想要一张以黑白渲染的逼真的 CEO 型人物肖像。如果您对第一次尝试不满意,可以要求 ChatGPT 根据进一步提示进行更改。要保存您的创作,请单击或点击生成的图像以找到下载选项。