OpenAI更新了著名的ChatGPT对话AI工具,使其比以往任何时候都更具对话性。因此,它现在已经获得了语音和图像功能。所以,现在ChatGPT会和你交谈,甚至识别图像。以下是需要了解的详细信息。
添加了新的聊天GPT功能
ChatGPT 现在使用一种新的文本到语音转换模型,它将帮助您与它进行来回的口头对话。将生成类似人类的音频,OpenAI在专业演员的帮助下为ChatGPT创建了5种声音。此外,开源语音识别系统Whisper也为将语音转录为文本提供了一些帮助。
可以通过“设置”下的“新功能”选项启用此语音对话功能。完成后,您可以点击主屏幕左上角的麦克风图标以开始使用。
您还可以向 ChatGPT 显示图像以回答您的查询。例如,在旅行时,您可以显示任何地标图像以获取更多详细信息,或者可以在智能手机中显示一些问题以获取有关如何解决它的信息。这得到了多模式 GPT-3.5 和 GPT-4 的支持。您只需选择照片按钮(在Android和iOS上首先选择加号按钮)即可开始使用。
语音和图像功能目前面向Plus和Enterprise用户,并将在两周内推出。虽然语音聊天功能在Android和iOS上可用,但图像功能将在所有平台上提供。
据透露,ChatGPT的语音功能将被Spotify用于播客中的语音翻译,以帮助播客轻松吸引更多人。目前将进行试点。在图像方面,它与Be My Eyes合作,这是一款免费的应用程序,可帮助指导盲人和低视力人士。
这些最终可能会免费开放。OpenAI意识到这些功能可用于恶意活动,因此刚刚开放了聊天语音功能。甚至图像功能也已首先通过“红队”进行测试,以确保负责任的使用。
© 版权声明
文章版权归作者所有,未经允许请勿转载。