罗永浩数字人26分钟碾压真人1小时!百度开始用A

互联网资讯
本条新闻为单纯事实消息的时事新闻,转载自第一财经资讯,版权归源站所有,如有侵权,烦请联系我们

6.18的前一天,在百度科技园一间报告厅里,两段罗永浩直播带货的视频片段正在大屏幕的两侧依次播放。其中一条棉柔巾的视频里,罗永浩调侃着男性用户也可以跟着媳妇用上棉柔巾了;另一条视频里,他吐槽了评论里让他打开瘦脸功能的建议,说自己不是颜值主播。

这两条视频哪个是数字人?百度副总裁、百度电商总经理平晓黎让在场的媒体猜猜看,现场的投票几乎是平手。不过,最终的结果出乎大家预料——两段视频其实都来自罗永浩的数字人。


从标志性的“罗氏幽默”,到语气停顿节奏和微表情的精准捕捉,数字人对罗永浩的复刻几乎达到以假乱真的突破。以至于当百度随后播放了一段关于罗永浩谈数字人直播感受的真人视频时,不少人仍下意识怀疑这是AI生成的内容。

6月15日,罗永浩数字人在百度电商完成首场直播,吸引超 1300 万人次观看。GMV 突破5500万元,部分3C、食品等核心品类商品带货单量超罗永浩 5 月真人首秀同期数据,创下数字人直播带货新纪录。

在电商这个讲究“即时转化”的残酷战场,能卖货的 AI 才是真实力。这场直播不仅验证了百度数字人技术的商业价值,更揭示了AI大模型正从技术秀场转身走向价值创造场。

罗永浩数字人是怎样炼成的?

百度与罗永浩的合作始于今年上半年,首场以真人直播形式在百度电商平台创下4小时GMV破5000万元的成绩。随后双方于6月15日推出第二场数字人直播首秀,这场由百度慧播星技术驱动的直播实现近7个小时不间断带货,数字人罗永浩用26分钟就超越真人1小时GMV,最终GMV突破5500万元,观看人次达1300万,部分核心品类单量甚至超越真人直播同期数据。

平晓黎告诉第一财经记者,百度为此准备了三周的时间,罗永浩对自己的数字人有着较高的要求,复刻他的外表形象并不难,但对于各种细节难点,还需要AI仔细打磨。

从罗永浩直播看,他和老搭档朱萧木之间的你来我往,默契度满分,而过去大家见过的都是单数字人,双人数字人还能互动,这是第一个难点。个人风格是超级头部主播的灵魂,罗永浩有很多名场面,怎么让数字人还原他的风格、且有梗有趣,是第二个难点。

此外,老罗作为超级头部IP,又有着极强的用户号召力,动辄上千万的围观、几万人同时在线,其中问价格问商品的、调侃老罗的、在直播间抖包袱等各种情况都有出现,数字人要面临前所未有复杂的任务场景;更别说交个朋友作为头部MCN机构,有着多样化的玩法,扎实的脚本,专业的运镜。这些都对AI技术提出了很高挑战。

百度尝试用AI拆解 罗永浩“卖货” 的每个毛孔,最终实现了体验、内容、视觉、效果的四大突破,使得数字人带货能力媲美真人。

首先是体验突破,通过复刻罗永浩跟朱萧木的丝滑配合,两个人同时讲话,或者互相打断这种这种复杂场景,目前已经做到非常自然。双数字人互动直播间给营销转化和C端体验,打开了新的想象空间。

在内容突破上,得益于文心4.5T的升级,通过深度训练,使数字人做到了“懂创作”,带货时塑品专业度更高,数字人可以“有个性”,甚至能“玩梗”, 对于当下的时事热点也是信手拈来,比如近期大热的“苏超”,为数字人注入灵魂。

围绕视觉,一个细节是,当老罗数字人口头提到抬头纹、法令纹、颈纹的时候,配合手部动作指出了相应的位置,做到了动作、表情、语调等贴合话术,同时也符合老罗本身的行为特点,让人感觉非常真实。这次的罗永浩数字人直播,是业内首个多模态高度融合的数字人应用场景,实现了在直播实时环境下的超长演绎。

在效果上,5500万GMV是最好的证明。AI大脑基于直播间信号灵活控场,数字人可以主动邀评、高频互动,极大提升用户沉浸感;通过多智能体实时调度,在数字人直播间实现了和真人直播间一样的互动玩法,如抽奖、发福袋等;强大的运营场控能力、多样化营销手段,有效提升用户转化。

除了超长待机24小时,数字人的另一大优点就是千人千面。未来,数字人主播还可能通过实时翻译功能对接海外客户。

“可以说,从互动到转化,数字人直播的效果已经实现了质的飞跃。”平晓黎对第一财经记者说,“数字人超越真人指日可待。”

AI硬实力的一场综合实践

“不要卷模型了,要去卷应用。”过去几年,百度董事长李彦宏不断为AI应用发声。数字人技术正是百度大模型在多模态上一场综合实践,GMV数据也在一定程度上验证了李彦宏的行业预判。

当行业还在争论文生视频的逼真度时,百度用实践证明,AI已经创造GMV了。这意味着真正的AI革命,不只在于制造更逼真的虚拟形象,更在于用技术重构商业的本质逻辑。

事实上,相比通用视频生成模型,数字人聚焦特定垂直领域,可以更精准地优化模型、追求极致人机交互体验,同时还具备实时交互能力、技术门槛相对较低、应用场景清晰、更容易形成可复制商业模式等优势。此次罗永浩数字人直播的战绩背后,正是百度将大模型能力锚定在 “卖货” 这一具体场景下的突破。

罗永浩数字人直播GMW超5500万外,还有一组数据揭示出技术与商业的化学反应:整场直播 AI 调用知识库 1.3 万次,生成 9.7 万字产品讲解内容,双数字人配合完成超 8300 个动作。

在这背后,得益于文心大模型4.5的发布、人像视觉大模型、语音大模型的精进,以及多智能体协同架构的上线,高说服力数字人不仅语言脚本质量实现了质的提升,可以使数字人出口成章,脚本到剧本模型的升级能够实现表情、动作、语言的协调一致;同时数字人还拥有能够自主思考决策的AI大脑,不仅可以与直播用户实时互动,还可以调度多智能体完成特定任务。


以外界十分关注的罗永浩数字人的剧本为例,百度集团副总裁吴甜介绍,基于文心大模型4.5 Turbo生成的剧本,充分展现了主播的个人特色,具备典型的罗氏幽默风格,并能够实现双人主播的内容协同,动态实现丰富的实时互动。

通过文本自控的语音合成大模型,实现高复原的语音合成能力,再结合直播台词及发音人特征,合成风格恰当、自然流畅的声音。为解决罗永浩数字人直播双人声音配合的难点,百度采用对话上下文编码器,将对话历史输入和当前对话进行语音合成的统一推理计算,最终实现流畅、自然的双人对话效果。

在数字人形象生成以及驱动方面,通过结合多模态视频理解、跨模态信号生成、视频生成等技术,克服了高可控交互,高精度、长时间一致性保持等难点,实现了高一致性超拟真罗永浩数字人长视频生成。

吴甜表示,百度在今年4月发布了最新的文心 4.5 Turbo和文心X1 Turbo,罗永浩数字人是基于文心大模型的最佳实践。 百度在大模型技术的持续探索和创新,将为用户带来更优质的体验、为行业带来更具创新力的业务模式。

罗永浩数字人可复制吗?

“这几天来联系我们的商家、达人很多。”平晓黎告诉第一财经记者。当被问及罗永浩模式是否可以大规模复制,她称“势必是要市场化的”。换句话说,“人人可播” 的 AI 时代正在加速到来。

罗永浩所属机构交个朋友代表、公司副总裁吴加录也在现场表示,百度的AI能力与交个朋友的直播运营经验和供应链资源实现了技术与场景的完美结合,这类“技术+IP”的协同模式也将为行业探索智能化转型提供实践样本。

平晓黎透露,罗永浩数字人成本是可接受的,单个数字人的成本控制在千元左右,预计从产品能力落地到实现市场化规模化需要三个月到半年的时间,包括提升内容生成效率,以及通过在线生成模式逐步降低整体成本。如果客户无需达到罗永浩数字人那样的极致细节程度,当前已能实现高说服力数字人的快速交付。

在这一推进过程中,百度团队核心思考聚焦于:今年需先将产品能力打磨至优秀水准,继而实现技术成本优化与规模化落地。

技术的最终目的是服务于人,服务于商业。百度并没有将目光局限在打造一个“超级应用”上,而是选择了一条更为开放、更为包容的道路——帮助更多人、更多企业打造出数百万“超级有用”的应用。数字人正是这样一个“超级有用”的应用。

而老罗数字人直播的破局,本质上是 AI 从 “技术展示” 向 “产业赋能” 的范式转移。百度透露,接下来罗永浩将正式担任百度慧播星首席体验官,罗永浩在入驻百度优选进行真人直播带货外,其数字人也将不定期开播、常态化为用户带来更多福利。

随着百度电商与交个朋友战略持续落地,未来,罗永浩作为超头主播,也将发挥引领作用,吸引更多主播加入。

这种效率提升正在改写中小商家的生存逻辑。广芸堂陈皮的案例颇具代表性。商家过去困于真人主播的差旅成本和时间调配,数字人直播却让他们实现了“全天候产地直播”——AI 主播不仅能 24 小时展示陈皮的色泽纹理、触感细节,直观呈现原料生长的真实环境,将传统电商难以呈现的 “产地优势” 转化为可视化体验,最终推动 GMV 增长 160%。

从 “技术供应商” 到 “生态构建者”,百度的智能电商野心远不止于技术输出。今年推出的 “梦蝶计划” 与 “繁星计划”,正在构建数字人直播的商业闭环—— 前者通过流量与预算扶持打造超头主播数字人,后者则再次追加10万个慧播星数字人和1 亿元数字人消费补贴等帮助中小企业开启直播。

而未来数字人的落地场景不只直播带货,它还能够拓展到教育、医疗、娱乐等多个领域。例如,教育领域,数字人可以作为虚拟教师,为学生提供个性化的辅导;在医疗领域,数字人可以作为虚拟助手,帮助医生进行远程诊疗;在娱乐领域,数字人可以作为虚拟偶像,与粉丝进行互动。这种跨领域的应用潜力,让数字人成为了一个真正的“万能钥匙”,打开人工智能商业化新的想象空间。

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论