OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本

【TechWeb】10月2日消息,美东时间10月1日OpenAI举行了年度开发者大会DevDay,推出系列新工具,包括四大创新:实时API(Realtime API)、视觉微调(Vision Fine-Tuning)、提示词缓存(Prompt Caching)、模型蒸馏(Model Distillation),为开发者带来在降低模型成本、提高模型视觉理解水平、提升语音AI功能和小模型性能的新选择。在OpenAI官网主要,上述功能介绍已经做了全面更新,一起看看。

实时 API(Realtime API)

OpenAI DevDay发布了Realtime API,目前处于公开测试beta阶段。

Realtime API 能够构建低延迟、多模式对话体验。它目前支持文本和音频作为输入和输出,以及函数调用。Realtime API 中的音频功能由新的 GPT-4o 模型“gpt-4o-realtime-preview”提供支持。

通过此更新,开发人员可以将任何文本或音频输入传递到 GPT-4o,并让模型以他们选择的文本、音频或两者做出响应。

本质上,Realtime API 简化了构建语音助手和其他对话式 AI 工具的过程,无需将多个模型拼接在一起进行转录、推理和文本到语音的转换。

Realtime API 定价方面,Realtime API 同时使用文本tokens和音频tokens。文本输入tokens的价格为5 美元/百万tokens,输出tokens的价格为20 美元/百万tokens。音频输入的价格为100 美元/百万tokens,输出的价格为200美元/百万tokens。这相当于每分钟音频输入约 0.06 美元,每分钟音频输出约 0.24 美元。

视觉微调(Vision Fine-Tuning)

OpenAI DevDay公布,OpenAI最新的大语言模型(LLM) GPT-4o 引入了视觉微调。此功能让开发人员可以自定义模型以获得更强大的图像理解能力,从而实现增强的视觉搜索功能、改进的自动驾驶汽车或智能城市的物体检测以及更准确的医学图像分析等应用。

视觉微调遵循与文本微调类似的过程——开发人员可以准备他们的图像数据集,然后将该数据集上传到Open AI的平台。他们可以用少至 100 张图像来提高 GPT-4o 在视觉任务中的性能,并使用更大量的文本和图像数据来提高性能。

OpenAI举例称,东南亚食品配送和拼车公司Grab已经利用这项技术改进其地图服务。仅使用 100 个示例进行视觉微调,教会 GPT-4o 正确定位交通标志并计算车道分隔线以优化其地图数据,结果,与基础 GPT-4o 模型相比,Grab 能够将车道计数准确度提高 20%,限速标志定位率提高13%。

价格方面,截至 2024年10月31日,OpenAI每天免费提供100万tokens,以使用图像微调 GPT-4o。2024 年 10 月 31 日之后,GPT-4o 微调训练将花费每 100 万tokens 25 美元,推理将花费每 100 万个输入tokens 3.75 美元和每 100 万个输出tokens 15 美元。图像输入首先根据图像大小进行标记,然后按与文本输入相同的每令牌费率定价。

提示词缓存(Prompt Caching)

提示词缓存被视为本次DevDay发布的最重要更新。该功能旨在降低开发者的成本、减少延迟。

许多开发人员在构建 AI 应用程序时,会在多个 API 调用中重复使用相同的上下文,例如在编辑代码库或与聊天机器人进行长时间的多轮对话时。今天,我们推出了提示词缓存(Prompt Caching),让开发人员可以降低成本和延迟。通过重复使用最近处理的输入token,开发人员可以获得 50% 的折扣和更快的提示词处理时间。

目前,提示词缓存(Prompt Caching)已自动应用于最新版本的 GPT-4o、GPT-4o mini、o1-preview 和 o1-mini,以及这些模型的微调版本。与未缓存的提示相比,缓存的提示可享受折扣。

模型蒸馏(Model Distillation)

OpenAI 推出了一款新的模型蒸馏产品,为开发人员提供集成的工作流程,以直接在 OpenAI 平台内管理整个蒸馏流程。

这让开发人员可以轻松使用前沿模型(如 o1-preview 和 GPT-4o)的输出来微调和提高更具成本效益的模型(如 GPT-4o mini)的性能,让小模型也可拥有尖端模型功能。

 这种方法让小公司也可能利用与尖端模型类似的功能,并且无需承担使用这类模型的计算成本。例如一家从事医疗技术的小型初创公司要为农村的诊所开发一种AI 驱动的诊断工具。使用模型蒸馏,该公司可以训练一个紧凑的模型,该模型可以捕捉大模型的大部分诊断能力,同时只需要在标准的笔记本电脑或平板电脑上运行。
 

原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/312178

(0)
上一篇 5天前
下一篇 5天前

相关推荐

  • 一年亏损超16亿元 大润发要被阿里抛弃了?

    【TechWeb】大润发真的要被阿里系卖掉了吗?近日,大润发母公司高鑫零售在港交所发布公告,公司股份已于2024年9月27日上午9时39分起在香港联合交易所有限公司短暂停止买卖,以待根据公司收购及合并守则发出载有公司…

    发现 12分钟前
    1.7K
  • Authentix每年标记1,500亿升燃料,助力打击非法贸易

    作为认证和信息服务领域的领导者,Authentix宣布了一个重要里程碑:作为全球燃料隐蔽标记市场的领导者已满25年,累计标记超过3万亿升燃料。如今,Authentix为超过20个不同领域的项目提供标记服务,每年处理的燃料量…

    发现 1小时前
    6.0K
  • 舍弗勒与纬湃科技合并生效

    舍弗勒集团成功完成对纬湃科技集团的合并。合并于当日进行商业登记,标志着双方合并正式生效。同时,舍弗勒无表决权普通股也全部转换为具有完全表决权的普通股。至此,舍弗勒成功按计划于2024年第四季度完成对纬湃…

    发现 1小时前
    6.3K
  • Cell Impact与Andritz Soutec AG达成合作,提升双极流板生产效率

    Cell Impact继续提升其产能和实力。该公司与瑞士Andritz Soutec AG签署了一项合作协议,内容涉及一种用于双极流板振镜焊接的机器。 该协议有助于简化Cell Impact生产流程中的后续工序,并优化大规模交付流板的条件…

    发现 1小时前
    6.6K
  • 阿斯利康达成临床前创新降脂药物授权许可,深化布局心血管疾病领域管线

    上海2024年10月7日 /美通社/ -- 阿斯利康和石药集团有限公司(以下简称:石药集团)达成独家授权协议,推进开发一款临床前创新小分子脂蛋白(a) (Lp(a)) 抑制剂。该化合物有潜力为血脂异常患者带来更多获益,并进一…

    发现 1小时前
    5.1K
  • 惠普再陷裁员风波:研发部门首次被刀,AI PC难解业绩焦虑

    国庆假期,远在台湾的惠普员工们传出裁员“噩耗”。据媒体报道称,惠普将在10月份将分两批次,在中国台湾地区进行人力调整。据悉,此次人力调整研发单位裁员达 20~30人,惠普副总裁高阶主管也将变动,是首次大规模针…

    发现 5小时前
    10.4K
  • Lee Spirer加入J.S. Held担任总裁兼COO

    全球咨询公司J.S. Held宣布Lee Spirer为公司新任总裁兼首席运营官(COO),向首席执行官Jonathon Held汇报工作。Lee Spirer是一位变革型领导者,专注于为客户开发创新服务,并建立吸引世界级专业人才的平台。他在Na…

    发现 7小时前
    11.0K
  • 完成历史任务的超级主播,正在被平台刻意抛弃

    在辛巴被封禁半个月之后,“广告发布者”的护身符终究没有成为三只羊的免死金牌。9月26日合肥市联合调查组发布通报,依据相关规定,拟决定对三只羊公司没收违法所得、罚款共计6894.91万元,责令三只羊公司暂停经营,…

    发现 1天前
    18.4K
  • Altman花了3个亿巨资,证明「国家发钱」没有用

    人工智能的风刮了两年,在AI普及之前,工作的“存在主义危机”先一步到来,互联网上关于人工智能何时能取代人的工作,能取代什么工作的讨论层出不穷。在人工智能的道德伦理边界的讨论上,“警惕人工智能大规模造成失业…

    发现 1天前
    20.8K
  • 邮轮,中产出境游的新标配

    今年国庆假期,出境游热度持续攀升。而在传统的飞机、高铁等出行方式之外,邮轮正逐渐赢得中国游客的青睐,成为出行旅游新方式。踏上一艘漂浮的“海上宫殿”,在精致服务下,享受一种无与伦比的奢华与放松体验——这可…

    发现 1天前
    20.4K

发表回复

登录后才能评论