百度数字人：前沿技术赋能多元场景

2025/8/17 9:04:18

吾爱

【百度数字人：前沿技术赋能多元场景】

百度数字人在AI浪潮中展现强大实力，技术创新与应用拓展成果显著。据IDC报告，2024年中国AI数字人市场规模约41.2亿元，百度以9.8%市场份额位居榜首。

百度智能云曦灵是其核心产品，构建大模型驱动全模态数字人应用平台，能一站式生成2D真人、3D超写实数字人，广泛应用于电商、金融、教育等20多个行业。在数字人生成上，首创文生3D超写实数字人平台，10分钟即可生成3D数字人，2D数字人分身生成缩短至小时级，大幅降低应用成本。

在数字人交互方面，曦灵数字人提供高保真声音克隆，唇形驱动准确率达98.5%，搭配大模型智能对话系统，实现秒级响应与智能互动。多模态交互技术落地AI手语数字人，为听障群体打破沟通障碍。在内容生产上，提供大模型视频脚本智能创作，3步生成专业级视频；“123数字人”组件实现10秒视频输入到分身口播视频输出，降低创作门槛。

2025年4月，百度发布高说服力数字人，由慧播星平台打造，基于文心4.5大模型，结合多种先进技术，实现“超拟真、能思考、会协同”。引入“剧本模式”，让数字人表情、语气、动作随台词自然调整。慧播星平台已生成超10万个数字人主播，整体转化率提升31%。其具备自主感知和多智能体协同能力，可根据直播间反馈自动决策，如发优惠券、切换商品等。已广泛应用于法律、教育、金融等行业，如汽车经销商用其介绍车型、图书直播中引经据典、健康产品带货结合专业数据个性化推荐。为降低门槛，推出“手机端一键开播”，上传2分钟视频即可启动24小时直播，月均成本千元以内，相较传统直播节省约80%。

百度NOVA数字人系统在2025WAIC大会亮相，实现“多模态认知引擎+情感计算框架”双核架构，“烛龙”大模型支持下，对话响应延迟低至300毫秒内，微表情生成精度达0.1毫米级，提升交互自然度，已赋能3000+企业客户。百度数字人凭借前沿技术，持续拓展应用边界，为各行业智能化转型注入强大动力。

对不起，会员才可查看！请注册！

已注册，请登录！