... 2024-05-14 03:40 .. 实时求解方程、做口译、分析图表、读取用户情绪GPT-4之前已经可以分析图像和文本,完成从图像中提取文本、以文本描述图像内容这类任务。
GPT-4o则是增加了语音功能。
Murati强调了GPT-4o在实时语音和音频功能方面必要的安全性,称OpenAI将继续部署迭代,带来所有的功能。
在演示中,OpenAI研究主管MarkChen掏出手机打开ChatGPT,用语音模式VoiceMode现场演示,向GPT-4o支持的ChatGPT征询建议。
GPT的声音听起来像一位美国女性,当它听到Chen过度呼气时,它似乎从中察觉到了他的紧张。
然后说“Mark,你不是吸尘器”,告诉Chen要放松呼吸。
如果有些大变化,用户可以中断GPT,GPT-4o的延迟通常应该不会超过两三秒。
另一项演示中,OpenAI的后训练团队负责人BarretZoph在白板上写了一个方程式3x+1=4,Chat .. UfqiNews ↓
1
本页Url
🤖 智能推荐