OpenAI推出新一代AI模型GPT-4o 音频视频理解能力尚无敌手

• 2024年5月14日下午3:10 • 发现 • 阅读 18.46w

【TechWeb】5月14日消息，据外媒报道，在今日凌晨1点开始的春季更新中，OpenAI宣布了他们新一代的旗舰模型GPT-4o，可以利用语音、视频和文本信息进行实时推理。

从OpenAI在官网上公布的信息来看，GPT-4o中的“o”源自“omni”，也就是全面、全能的意思，朝着更自然的人机交互又迈出了关键一步。

而GPT-4o也的确如名字中“omni”的全能一样，是一款能力更全面的大语言模型，打通了文本、音频和图像，接受任何文本、音频和视频的组合输入，并生成文本、音频和视频的组合输出。

OpenAI在官网上披露，GPT-4o在英文文本和代码中的表现与GPT-4 Turbo相当，但在非英文文本上的能力大幅提升，在视频和音频的理解上，GPT-4o要明显强于当前的其他模型。

在官网上，OpenAI提到，在GPT-4o之前，通过语音模式同ChatGPT对话时，有较长时间的延迟，GPT-3.5平均为2.8秒，GPT-4平均为5.4秒。而由三个独立模式组成的语音模式，也丢失了大量信息，无法直接识别音调、多个说话者或背景噪音，也无法输出笑声、歌唱或表达情感。

但在GPT-4o中，OpenAI训练一个跨文本、音频和视频的端到端新模型，所有的输入和输出都是由同一神经网络处理，GPT-4o也是他们首个整合了个文本、音频和视频模式的模型，

能力更全面的GPT-4o，响应速度也更快，最快232毫秒响应音频输入，平均响应时间为320毫秒，与人类在对话中的响应速度相当。

除了更强、更全面的能力，OpenAI也在推动GPT-4o更广泛的应用。GPT-4o的文本和图片功能自推出之日起就向ChatGPT推送，ChatGPT用户可免费使用，ChatGPT Plus用户的数据量上限将是免费用户的5倍，新版本的音频模式将在未来几周向ChatGPT Plus用户推送。

OpenAI周二凌晨1点开始的春季更新，是由CTO Mira Murati主持进行，登台的还有两位研发人员，公司CEO萨姆•奥特曼并未登场。

不过，未现身直播的萨姆•奥特曼，在社交媒体上对GPT-4o也进行了推广。他在社交媒体上就表示，他们最新的模型GPT-4o，是他们到目前为止最好的模型，它很聪明、速度很快，是天然的多模态。

萨姆•奥特曼在社交媒体上也提到，GPT-4o对所有的ChatGPT用户免费，而此前GPT-4级别的模型仅对按月付费的用户免费。

而值得注意的是，OpenAI在周二凌晨推出能力更全面的GPT-4o，无疑会给谷歌带来更大的压力，谷歌2024年度的I/O开发者大会，将在当地时间周二开始，外界预计他们会推出大量人工智能相关的产品。(海蓝)

原创文章，作者：，如若转载，请注明出处：https://knewsmart.com/archives/297807

0 0 打赏

微信扫一扫

关于作者

0 文章

0 评论

粉丝

国际可持续发展协进会（ICSD）创立CEPAR®五步方法协助企业处理ESG挑战

上一篇 2024年5月14日下午3:10

中国在德国投资项目数量同比增加42%

下一篇 2024年5月14日下午3:10

发现

ArkPro跻身今年最实用的节日礼品之列

深圳2025年12月12日 /美通社/ -- 随着节日送礼活动达到高潮，傲雷（Olight）的ArkPro脱颖而出，成为创作者、户外爱好者，以及寻求实用高端礼品的购物者的心头好。今年圣诞节，"具有真实价值的有用礼物"的兴起，正重…

新智派
16小时前
28.5K
全球首个"免化疗"：H药胃癌围手术适应症申报上市并被纳入优先审评

上市进程提速，有望成为全球首个获批用于胃癌围手术期治疗的抗PD-1单抗首个获CDE突破性疗法认定及首个被纳入优先审评的胃癌围手术期治疗药物全球首个胃癌围手术期以免疫单药取代术后辅助化疗的治疗方案，显著降低…

新智派
发现 18小时前
30.4K
30万客流、900万订单额见证科技破圈 ROBOT MALL合生汇快闪店圆满收官

北京2025年12月12日 /美通社/ -- 历经31天科技热潮，ROBOT MALL合生汇快闪店于11月30日圆满收官。作为首次进驻城市核心商圈的标杆实践，ROBOT MALL合生汇快闪店不仅成为热门科技打卡地，更实现了B端商业转化和C端认…

新智派
发现 19小时前
31.8K
卫材在CTAD 2025上公布抗Tau抗体Etalanetug（E2814）新数据

东京2025年12月12日 /美通社/ -- 卫材宣布，在第十八届阿尔茨海默病临床试验大会（Clinical Trials on Alzheimer's Disease Conference，CTAD）上公布了抗tau抗体Etalanetug（研发代号：E2814）的新数据。Etalanetu…

新智派
发现 19小时前
28.9K
Shake Shack北京大融城店开业，以科技美学打造社区灵感"食"光

上海2025年12月12日 /美通社/ -- 2025年12月12日，备受全球美食爱好者关注的Shake Shack在北京中关村大融城迎来了全新主题门店的盛大开业。新店坐落于北京科技创新核心地带，将纽约风味的招牌汉堡与中关村的科技氛…

新智派
发现 19小时前
30.2K
德华安顾人寿增资获批，安顾坚定履行在中国的长期发展承诺

北京2025年12月12日 /美通社/ -- 安顾于12月12日宣布，其在华合资公司德华安顾人寿保险有限公司（以下简称"德华安顾人寿"）15.45亿元人民币增资方案已获国家金融监督管理总局山东监管局正式批准。德国安顾集团股份…

新智派
发现 19小时前
29.4K
发现

英矽智能与太景达成管线授权合作，助力AI驱动的PHD抑制剂开发和商业化，用于慢性肾病（CKD）贫血治疗

英矽智能已授予太景在大中华区开发、商业化和分许可ISM4808的独家权利。这是一款AI驱动的潜在"同类最佳"口服PHD抑制剂，于2023年获得临床试验批件。此次合作将英矽智能的生成式AI发现平台能力与太景在临床和商业方…

新智派
19小时前
27.2K
从"建筑垃圾"到"城市矿产"：在TEDxShenzhen，一场关于循环建造的思想实验

深圳2025年12月12日 /美通社/ -- 2025年12月7日，以"涌现・Emerging"为主题的TEDxShenzhen年度大会在深圳G&G创意社区启幕。作为全球最负盛名的跨界思想平台TED的本地化实践，TEDxShenzhen始终致力于在深圳这座"…

新智派
发现 20小时前
31.3K
科技艺术跨界盛宴来袭《META THINKER 人机共生》机器人博览艺术展12月登陆黄浦

上海2025年12月12日 /美通社/ -- 2025年12月4日至7日，由META THINKER国际组委会、上海黄浦科创集团有限公司、上海外滩投资开发（集团）有限公司联合主办，上海麦塔鑫科文化传媒有限公司承办的《META THINKER 人机…

新智派
发现 20小时前
30.0K
发现

"与麟同行，共创美业"，中化化肥发布生物磷肥新品水溶美麟美、麟葆

北京2025年12月12日 /美通社/ -- 2025年12月10日，中化化肥"与麟同行，共创美业" 生物磷肥水溶新品上市发布会在西北地区举行。在近百位经销商、种植大户等客户代表的共同见证下，中化化肥发布水溶美麟美、水溶麟葆…

新智派
20小时前
34.6K

发表回复

登录后才能评论

OpenAI推出新一代AI模型GPT-4o 音频视频理解能力尚无敌手

关于作者

相关推荐

发表回复