AI开始为数字人注入灵魂

• 2023年5月15日上午9:57 • 发现 • 阅读 66

这几天，国内“冷门歌手”凭借AI翻唱再度走红。

B站网友用AI模型生成了歌手孙燕姿的AI分身，其实跟车载导航上的“林志玲”、“郭德纲”类似。拿歌手本人的音频去训练，生成一个音色一模一样的“孙燕姿”。

然后，让偶像唱自己喜欢的歌的心愿，就以这样一种诡异的方式实现了。

海外的玩法更加离谱。

美国一个拥有180万粉丝的23岁女网红，通过用GPT-4复刻了自己的AI分身，然后同时与1000多个网友谈恋爱，每分钟收费1美元。

仅一周，她就狂赚了7.16万美元。

并且还远不止如此，现在她的“男友”还在急速增加中，目前已经增加到了近万人，排队等待与她“谈恋爱”时间已经长达96小时。

有分析认为，按照趋势，她月入500万美元没有任何难度，如果不是技术限制，她赚到的钱，将可能是一个天文数字。

这些现象已经可以充分说明，一个由AI+带来的新技术红利时代，正在被急速到来。

01 数字人军团涌入直播间

直播带货是虚拟IP变现最具潜力的场景。

Z世代对社交、视频、网购等工具的使用深度遥遥领先于全网平均水平，数字人和虚拟空间结合的新玩法给他们带来了体验感和交互性，虚拟IP的核心粉丝大多来自18-24岁的年轻群体。

这一趋势让品牌方看到了让产品打破圈层的机会。

2020年，虚拟歌手洛天依和乐正绫等来到淘宝直播间，为博士伦、美的、欧舒丹等品牌带货。这场直播观看人数高达270万，有近200万人打赏互动。

这在当时一度掀起巨大的讨论，虚拟数字人直播的时代已经来了。

而随着今年由chatGPT掀起的人工智能大模型热潮，虚拟数字人领域又迎来一轮更加磅礴的爆发。

一大批量的虚拟数字人开始扎堆涌进直播间。

今年4月份，天娱数科旗下的虚拟数字人“朏朏”已完成 ChatGPT 模型接入，并完成直播首秀，不仅能够实时响应顾客的提问，还能根据不同问题进行自主回答。

在短视频上，出现过很多这样的场景：一家公司的整个办公室里空无一人，只有一排排办公桌上有数十台电脑屏幕里的AI美女们正在直播......

这家公司，只靠2D超写实的虚拟形象，提前准备好的话术和背景，就可以直播一天，虽然单个效果不如真人直播，但成本低到令人发指，而且还可以超低成本复制，胜在以量取胜，真正是做到躺着让AI挣钱也并非不可能。

这一切，在说明，一场基于“AI+”的内容效率革命，正在数字人领域爆发。

虚拟数字人根据制作技术、应用场景、形象特点分为很多种。

与3D人气偶像不同，现在大多数直播间里说话的根据真人原型复刻声音、表情的2D写实数字人，你根本分辨不出是真是假，但制作成本远低于勇闯娱乐圈的A-Soul IP们。

一个虚拟主播可以进行7*24全天候的直播工作，随叫随到，也不用担心人设翻车的问题，减少了直播运营中的人工成本。

这背后，是AIGC在重新塑造数字人的生产流程。

2D数字人的制作用上了深度学习，只需要确定形象设计，图文音频数据经过采集、预处理后上传到模型训练，制作方式相对3D更简单，更标准化，制作效能不断提升。

这种工厂流水线的方式，使数字人的制作门槛、成本和周期得到了大幅缩短。

同时，随着行业制作端的技术迭代和成本骤降，针对小型客户的数字人解决方案也开始涌现。

在4月份，腾讯云发布的数字人生产平台，需要生成真人形象的数字分身可以在平台上采购服务，只需上传图像音视频即可实现定制，根据不同音色、视频时长收费。

除了制作数字人，还可以提供整套数字人直播解决方案，功能包括了真人音频接管直播间，获取用户评论智能回复，定价仅需要千元级别。

而有些渠道商，打包售卖AI主播的定价甚至只要200元以内。

这些主播形象大多来自模特经纪公司的授权，投放质量虽然粗糙，抠图痕迹明显，声音也没有特点。

但对普通的中小企业来说，没有大V带货，花不起上百万定制高端IP，想要压缩运营成本，快速起量，几千块的数字人已经够香了。

企业如果想要自己修改代码，产出不同的数字人，还可以向技术提供商购买源码，售价要比直接买AI主播更贵，不仅能自用，还可以使用源码发展代理，甚至比自己做数字人直播还赚钱。

但AI数字人的故事，还没有讲完。

02 AI注入灵魂

IDC在《中国AI数字人市场现状与机会分析》报告中将数字人分为五个等级，目前数字人发展经历从手工制作到AI建模的阶段，初步具备人的外形，但还只能做简单的交互决策。

当智能化水平来到L4、L5级别时，AI驱动的数字人能够接管大多数场景决策，支持更多模态的实时交互，类似钢铁侠的私人AI管家“贾维斯”。

虚拟数字人过去三十年的发展，技术发展和市场需求基本围绕着两点在演变，一是视觉效果；二是交互体验。

虚拟数字人最早出现在游戏、动漫、电影里，对新潮事物的情感连接和IP价值的延伸遥相呼应。

早期的角色型IP使用手绘，动作要一张一张地画。1982年，日本动画《超时空要塞》的女主角林明美成为了首个发行音乐专辑的虚拟歌手。

在电影里，形象可以用计算机建模，但动作还得让人来做，CG技术和动作捕捉等技术逐渐普及，依靠绿幕，捕捉设备，演员可以成为任何角色。

千禧年后，从02年的《指环王》到去年的《阿凡达2》，角色的渲染效果已经细致入微，为艺术创作带来了巨大便利。

到这里，数字人技术的发展围绕更像“人”的极限一步步逼近，不仅仅要求外观、服装上的视觉效果趋近真实，还包括驱动（呈现真实细腻的表情和动作）和渲染（让画面更加精细实时）。

不过，总觉得还是缺了点什么。

1970 年，日本机器人专家森昌弘提出“恐怖谷”理论，由于机器人与人类在外表、动作上相似，所以人类会对机器人产生正面的情感。

当机器人与人类的相似程度达到一个特定程度的时候，一点点的差别都会被放大，并带来负面和反感情绪。而当机器人与人类的相似度继续上升，人类对其情感会再度回到正面。

与电影不同，社交属性更强的应用场景对数字人实时交互的要求更高，不只是满足于制作一个好看的“花瓶”而已。

在交互方面，自然语言模型填补了这一空缺。

文本生成能力已经惊艳众人的GPT，给数字人的“智商”加上了两道杠。

NLP大模型是AI驱动虚拟人的技术基石，简单来讲就是让虚拟数字人能说会道，减少标准化内容的制作成本，被训练来担任智能客服、主持人、导游等角色。长期来看，随着个性化和情感理解的能力提高，为老人提供陪伴关怀，成为小孩子的”私人教师“也将实现。

此外，嘴型动作也可以由AI驱动，建立起与文本的映射关系，随着写实程度的提高，微表情也就更丰富，说话的时候表情、口型能够对得上，这样的数字人不仅“形似人”，而且“神似人”。

Midjourney是基于diffusion model扩散模型的爆款产品，在去年7月发布，通过文本输入指令训练AI绘画。

有机构测算过，目前其年收入就已经能够达到1亿美元的规模。

有B站up主用Midjourney复原了奶奶的写实形象，从外观上看，衰老的皮纹和白头发细节感十足，加上过去的音频重现奶奶的声音，最后通过D-ID生成了奶奶的数字分身。

为了弥补未与奶奶好好告别的小遗憾，孙子和眼前的数字“奶奶”开启了对话，而“奶奶”亲切地回应，其实是ChatGPT提供的回答素材。

正是通过这些用户端的越来越多的尝试，反过来为AI的“人格化”不断添加海量训练素材，加速丰富AI模型数据，最终让AI为数字人注入灵魂，带来更大可能。

03 尾声

对虚拟分身的探索至今持续了三十余年，从手绘到真人驱动，再到AI驱动，拟真感和交互性的体验进步打开了广阔的应用场景，涓流汇成大海。

AIGC帮助将普通人的外观、声音等特征全面数字化，更低的制作门槛打开了市场的想象空间。

IDC预计，到2026年中国AI数字人市场规模将达到102.4亿元人民币，但能够给我们带来多么良好的体验，决定了数字人最终的命运。

同时，AI数字人具备下一代人机交互入口的潜质，未来我们面对的或不再是冰冷的屏幕，而是生动活泼的数字人类，越能够挖掘最深层次的情感需求，成为我们生活里的参与者。

或许正如AI教父所言，人类只是智慧演化的过渡阶段，以便创造出数字智能，如今我们终于有一个长得像人类的数字分身，像我们一样说话，以后或许还能像我们一样思考。

原创文章，作者：，如若转载，请注明出处：https://knewsmart.com/archives/146525

0 0 打赏

微信扫一扫

关于作者

0 文章

0 评论

粉丝

手机市场季度考：苹果赚走超8成利润，国产品牌困在价格战中

上一篇 2023年5月15日上午9:57

iPhone 15核心细节抢先看：全系灵动岛+2.5D弧边硬件区别明显

下一篇 2023年5月15日上午9:57

发现

第三代元PLUS 11.99万元起正式上市全系搭载第二代刀片电池及闪充技术

5月21日，比亚迪第三代元PLUS正式上市，官方指导价11.99万-14.99万。新车定位元力智趣闪充SUV，凭借全能产品力契合元气青年、年轻家庭与科技实用派的多元出行需求，以全球车品质与年轻姿态解锁高品质纯电出…

新智派
2026年5月21日
9.3K
发现

人均16本？2026全国职场人阅读调查来了！

本雅明在一百年前写下过一个诊断：我们生活在一个体验超载的时代，但内心却感到贫乏，似乎没什么能真正沉淀下来。他把那种可传承、能生根的深厚经验称为“Erfahrung”，而把那些孤立的、转瞬即逝的刺激称为“Erlebnis…

新智派
2026年4月27日
14.8K
发现

田涛对话马拉比：在AI浪潮中破解“上帝密码”与人类命运

一壶武夷岩茶，升腾起连接东西方的氤氲热气。近日，《哈萨比斯：谷歌AI之脑》作者塞巴斯蒂安·马拉比，与华为管理顾问田涛展开了一场深度对话，整整2个小时，围绕人类“重构巴别塔”的雄心与野心，两位观察家在茶香中…

新智派
2026年4月20日
11.6K
发现

为什么我们还要读书？世界总有答案

OpenClaw能打开浏览器、查资料、写邮件、填表格——像一个不睡觉的实习生。 Gemini CLI能一口气吞下整个代码库，三秒钟给你一份精准的优化建议。 MGIE动动嘴就能修图，连软件都不用打开。 2026年，这些AI智能体不再是…

新智派
2026年4月20日
8.2K
发现

博世舒适科技日立冷热科技亮相中国制冷展，以绿色与智能引领行业升级

北京2026年4月17日 /美通社/ -- 在2026中国制冷展期间，博世舒适科技集团日立冷热科技集中展示了覆盖压缩机、空调系统及大型机组在内的全系列产品与解决方案。围绕绿色低碳与智能化发展趋势，公司正加快由单一设备…

新智派
2026年4月17日
3.9K
新智•新速•新未来｜OCS 2.0-SPE工业控制系统新品发布暨OCS@NIICA生态合作伙伴签约仪式圆满举行

北京2026年4月17日 /美通社/ -- 2026年4月16日，"OCS 2.0-SPE工业控制系统新品发布暨OCS@NIICA生态合作伙伴签约仪式"圆满举行。本次会议汇聚行业认证机构、核心技术伙伴及生态厂商，共同见证新一代工业控制技术的诞…

新智派
发现 2026年4月17日
6.2K
以责任赋能发展以初心传递温度 -- 中通快递正式发布 2025 年度可持续发展报告

上海2026年4月17日 /美通社/ -- 2026年4月17日，中国行业领先且快速成长的快递公司中通快递（开曼）有限公司（纽交所代码：ZTO及香港联交所代号：2057）（"中通"或"公司"）正式发布了2025年度可持续发展报告。这是…

新智派
发现 2026年4月17日
11.3K
水隐之触悦然心生 GROHE SPA水悦淋浴系统耀世登场

设计美学：采用高特朗水悦恒温控制面板，内嵌式按钮设计让科技隐于无形。核心技术：模块化创新设计搭配SmartControl控温技术，一键精准调控个性化组合。感官体验：宽大的顶洒与情绪调频式手持花洒结合，打造沉浸…

新智派
发现 2026年4月17日
3.6K
雅诗兰黛集团连续第六年参展中国国际消费品博览会，彰显深耕海南的长期承诺

海口2026年4月17日 /美通社/ -- 作为世界领先的优质护肤品、彩妆、香水和护发产品的制造商与营销商，雅诗兰黛集团连续第六年亮相中国国际消费品博览会（以下简称"消博会"）。围绕"重塑美妆新境，焕启致美之旅"的主…

新智派
发现 2026年4月17日
3.9K
发现

毛源昌眼镜亮相消博会，向世界讲述中华老字号新故事

杭州2026年4月17日 /美通社/ -- 4月13日-18日，第六届中国国际消费品博览会在海南海口举行。毛源昌眼镜作为商务部首批认定的"中华老字号"受邀参展，在老字号"镇店之宝"专题展示区，向全球客商呈现百年品牌的文化底…

新智派
2026年4月17日
3.4K

发表回复

登录后才能评论

AI开始为数字人注入灵魂

关于作者

相关推荐

发表回复