OpenAI新年开出王炸,AI竞争升级

来源 | 伯虎财经(bohuFN)

作者 | 陈平安

OPEN AI又刷屏了。

2023年年初,OPEN AI就曾引爆全球科技圈。

因为其发布了一个全新的聊天机器人模型—— ChatGPT。和过去那些简单的聊天机器人相比,ChatGPT不仅可以回答人类的追问,承认自己回答中的错误,拒绝回答不适当的问题,还能写诗、编程、写论文等等。

连马斯克都忍不住感叹:“ChatGPT好得吓人,我们离强大到危险的人工智能不远了。”距离发布后仅两个月,ChatGPT月活用户就达到了1亿,为其母公司OpenAI拉来了微软100亿美元的下注。

2024年年初,相似的故事又在上演。

2 月 16 日凌晨,OpenAI 在 AI 生成视频领域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。

在 OpenAI 官网分享的演示视频中,Sora 可以直接输出有多个角色、多种场景和运镜的画面。这对比一年前 AI 生成的视频,简直是天差地别,其视频长度方面就“碾压”同行。

据了解,通过文本指令,Sora可以直接输出长达60秒的视频,且视频的精致程度远超大部分人的想象。

这意味着,继文本、图像之后,OpenAI将其先进的AI技术拓展到了视频领域。

马斯克也再次评价了 OpenAI 视频模型:“AI 增强的人类将在未来几年里创造出最好的作品。”

01 Sora让人惊艳的到底是什么?

一方面是技术上的突破。

Sora 能够生成长达 1 分钟的超长视频,远超Runway-gen2 的 18 秒和 Pika 的 3 秒。

更重要的是,相比之前AI视频明显的“AI感”不同,Sora制作的视频在逼真度和画面精致程度将整个AI视频行业提升到 next level。

从官网视频来看,人物脸上的黑痣粉刺,地面积水倒映的霓虹光影等等,其细节的精细度几乎已经做到了以假乱真。换句话来说,Sora 创作的视频质量,无论是高清度还是还原度,都是可圈可点的。

另一方面,同样引人关注的是,Sora理解长文本的能力。OpenAI在官方博客中写道,“Sora不仅可以理解用户的需求,还知道这些事物在现实世界如何存在。”

什么意思呢?只需要输入一段文本,Sora就能自动生成最长一分钟的高清视频。让人惊艳的是,Sora不仅可以准确把握用户文本中的复杂意思,并且还能分拆出不同的元素,将其转换为有具体创意构思的视频内容,看起来就像是专业导演、摄像和剪辑的作品。

比如 Sora以“色彩缤纷的鱼类和海洋生物充斥的,由纸艺精心构建的珊瑚礁世界”为主题的视频中, Sora 通过其摄影角度和拍摄时机,成功地推进了故事的发展。视频中实际上发生了多次镜头转换,这些没有特别指令它这么做,它却能自动完成。

据内行人士透露,像是Sora生成的视频,就算是头部动画制作公司都需要数日时间完成,而Sora只需要几分钟搞定。

国盛证券认为 Sora 相比此前其他文生视频模型,已经跨越到实用生产力工具,1 分钟长度有望大规模应用在短视频领域,扩展视频的能力也有望制作长视频,或将带来新一轮内容创作产业革命。

当然,Sora并不完美。OpenAI官网指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系,混淆提示的空间细节。

以此次发布的DEMO“与中国龙一起庆祝农历新年的视频”为例,Sora无法准确生成视频画面中的中文,还被网友调侃调侃“都怪中文太难了?”以及视频中老人生日蛋糕蜡烛,但蜡烛火苗前面却没有丝毫变化等等。

但OpenAI的团队,让AI能从最初的模糊分辨不清的图像,进步到目前足以生成长视频的阶段,可见其发展可怖。

B站一位网友是这么评价的:

“sora出之前我还在给gpt5心里打一个问号,到底能提升多少,openai还能继续领跑么,但现在我是真的服了,真的是比其他厂牛逼不止一点,一出手就是降维打击,sora也是transform架构,这不就是gpt5的一部分么,之前网上说gpt5看完了互联网的所有视频我还不信,现在我信了”。

02 竞争升级

Sora最直接的影响的肯定是对视频行业的冲击。作为一种视频生成工具,Sora仅需文字就可以生成60秒时长的精细视频,大大降低了视频制作的门槛和成本,特别是热点类等具备强烈时效性的内容。

不过Sora更深层的意义在于,这也意味着有关AI的竞争再度升级。

2023年,ChatGPT的发布引领全球进入AI热潮,光是中国公司就发布了超过130个大模型。起初,大家的目标都是朝着自研大模型进发——有钱的大厂研发基座模型,创业公司们则转向研发在开源模型基础上加入特定数据集做微调的行业模型、垂直模型。

但事实证明,大模型真正的门槛在于高昂的成本——海量的算力、能提供定制服务的数据服务商和顶尖的人才团队。

以算力为例,目前市场绝大部分被用于训练大模型的算力芯片都来自于英伟达。根据财经报道,2023年,英伟达A100的售价涨了约1倍。单单部署1000台服务器的电力成本就高达月20万元。

大厂们的优势在于,既拥有雄厚的财力去大规模购买、部署GPU,也能及时通过工程优化,利用大模型去实现效率提升。

根据晚点LatePost报道,11月,基于阿里的“通义千问”,跨境业务AI Business团队正式对外公布自己的产品 “Aidge”,兼具翻译、营销、设计、本地化服务等一系列功能。统计数据显示,11月经过AI优化后的商品,获得的海外询盘量比之前增加了15%。

字节则在推出了云雀大模型后,相继研发出了豆包、扣子、话炉等产品。以话炉为例,用户可以在其中与AI智能体一道,通过故事聊天、创作,获得互动体验。

Sora使用 transformer 架构,将视频和图像表示为称为 Patch 的较小数据单元的集合,类似于 GPT 中的 token。重要的是,它和GPT一样符合AI 缩尺律(Scaling Law),也就是说随着训练计算量的增加,样本质量明显提高。

有行业人士表示,目前Sora 暂未对外开放使用,仅OpenAI CEO Sam Altman 在X 平台上与评论互动生成视频,认为算力的限制可能是目前 Sora 暂未开放使用的重要因素。

算力已经成为了各家最为关注的资源之一。2018 年,Altman 个人投资了一家AI 芯片初创公司Rain Neuromorphics,2019 年,OpenAI 花费5100 万美元购买Rain 的芯片;去年 11 月,Altman 为一家代号为“Tigris”的芯片企业寻求数十亿美元的资金。

软银集团创始人孙正义则正寻求筹措1000亿美元资金成立一家芯片企业,与旗下半导体设计公司ARM的业务形成互补。

不过Sora的惊艳并不意味着其他人就没有机会。视频生成赛道此前的明星公司是Runway和Pika,尽管有许多人认为Sora很容易对两者进行降维打击,但Pika创始人郭文景在回应钛媒体时称,“我们觉得这是一个很振奋人心的消息,我们已经在筹备直接冲,将直接对标Sora。”

事实上,OpenAI也并非毫无对手。和Sora同一时期发布的还有谷歌的Gemini1.5 Pro,根据官方数据,其支持长达 100 万个 token,远超当前其他基础模型,可以一次性处理大量信息,如 1 小时的视频、11 小时的音频、超过3 万行代码或超过 70 万个单词。

Sora当然是OpenAI领先的有力证明,但更像是大模型这个“大力出奇迹”赛道竞争升级的信号。

*文章封面首图及配图,版权归版权所有人所有。若版权者认为其作品不宜供大家浏览或不应无偿使用,请及时联系我们,本平台将立即更正。

原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/237775

(0)
上一篇 2024年2月20日 下午10:40
下一篇 2024年2月20日 下午10:40

相关推荐

  • 张杰燃情演绎《海洋奇缘2》中文主题曲《勇气之歌》

    续写别开"声"面的海洋传奇 北京 2024年11月23日 /美通社/ --时间11月23日消息,华特迪士尼动画工作室现象级动画续作巨制《海洋奇缘2》(Moana 2)于今日正式发布中文主题曲《勇气之歌》(Can I Get a Chee Hoo?),…

    3小时前
    8.3K
  • 第32届古镇灯博会定档明年3月18-21日,预登记通道正式开启

    中山2024年11月23日 /美通社/ -- 春潮澎湃起,采购正当时。第32届中国•古镇国际灯饰博览会(下称:古镇灯博会)将于2025年3月18—21日在广东中山灯都古镇会议展览中心盛大启幕。秉承专业化、市场化、国际化的定位战…

    发现 5小时前
    10.4K
  • 盛况再现,2024 Fi收官之战顺利落幕 - 严冬虽至,热情"不降温"

    上海2024年11月23日 /美通社/ -- 作为全球食品和饮料行业极具影响力的盛会之一,也是2024年Fi全球食品配料展的年末收官之战,翘首期盼的Fi Europe欧洲食品配料展于2024年11月19-21日隆重举行,来自135+国家的行业精…

    5小时前
    10.4K
  • 亿珑能源控股有限公司与TMT Acquisition Corp完成合并

    亿珑能源控股有限公司股票已于2024年11月22日开始在纳斯达克证券交易所交易,股票代码"ELPW" 赣州 2024年11月22日 /美通社/ -- 亿珑能源控股有限公司(以下简称:"亿珑"或"公司")(纳斯达克股票代码:ELPW),一家…

    发现 14小时前
    14.2K
  • 2024年度英国商业大奖获奖名单公布

    彰显英中卓越商业成就 上海 2024年11月22日 /美通社/ -- 2024年度英国商业大奖颁奖晚宴于11月21晚在上海浦东嘉里大酒店举行。 2024年英国商业大奖颁奖晚宴现场 作为英中商界备受关注的一项盛事,英国商业大奖自2008…

    15小时前
    14.5K
  • 大家保险集团荣获四项金融科技发展奖

    北京2024年11月22日 /美通社/ -- 近日,中国人民银行公示的"2023年度金融科技发展奖"获奖名单中,大家保险四个项目同时斩获三等奖殊荣。 金融科技发展奖(简称"金发奖"),是我国金融业唯一的部级科技奖项,由中国人…

    发现 16小时前
    15.6K
  • 欧盟驻华代表团"环保好骑心2024"圆满落幕

    赞许中欧合作助力绿色转型 北京 2024年11月22日 /美通社/ -- 2024年11月22日,欧盟驻华代表团在京成功举办了"环保好骑心2024"活动的闭幕式。这项活动旨在赞许中欧在可持续合作项目上取得的重要成果。 "环保好骑心20…

    发现 16小时前
    13.6K
  • 大家资产再次蝉联金鼎奖"年度卓越保险资管公司"

    北京2024年11月22日 /美通社/ -- 2024年11月19日,由《每日经济新闻》主办的2024金融发展年会暨金融金鼎奖颁奖典礼在北京成功举行。大家资产荣获中国金鼎奖"年度卓越保险资管公司",这也是公司自2020年以来,第5次…

    发现 16小时前
    15.4K
  • 美通社与中经社联手 助力企业提升品牌权威影响力

    北京2024年11月22日 /美通社/ -- 2024年11月15日下午,美通社与中国经济信息社(以下称为"中经社")联合举办媒体开放日活动。活动以提升企业的品牌权威影响力为议题,与邀约的70余位企业代表一起,走进中经社,围绕…

    16小时前
    13.5K
  • 勃林格殷格翰和MTM Vision宣布长期合作

    勃林格殷格翰和Mary Tyler Moore Vision Initiative(MTM Vision)共同宣布开始长期合作,勃林格殷格翰将成为首家加入MTM Vision联盟的制药公司。(美通社)

    发现 17小时前
    16.3K

发表回复

登录后才能评论
联系我们
联系我们
分享本页
返回顶部