百度数字人:前沿技术赋能多元场景
吾爱
2025/8/17 9:04:18
•
12,543 阅读
配套教学视频
【百度数字人:前沿技术赋能多元场景】
百度数字人在AI浪潮中展现强大实力,技术创新与应用拓展成果显著。据IDC报告,2024年中国AI数字人市场规模约41.2亿元,百度以9.8%市场份额位居榜首。
百度智能云曦灵是其核心产品,构建大模型驱动全模态数字人应用平台,能一站式生成2D真人、3D超写实数字人,广泛应用于电商、金融、教育等20多个行业。在数字人生成上,首创文生3D超写实数字人平台,10分钟即可生成3D数字人,2D数字人分身生成缩短至小时级,大幅降低应用成本。
在数字人交互方面,曦灵数字人提供高保真声音克隆,唇形驱动准确率达98.5%,搭配大模型智能对话系统,实现秒级响应与智能互动。多模态交互技术落地AI手语数字人,为听障群体打破沟通障碍。在内容生产上,提供大模型视频脚本智能创作,3步生成专业级视频;“123数字人”组件实现10秒视频输入到分身口播视频输出,降低创作门槛。
2025年4月,百度发布高说服力数字人,由慧播星平台打造,基于文心4.5大模型,结合多种先进技术,实现“超拟真、能思考、会协同”。引入“剧本模式”,让数字人表情、语气、动作随台词自然调整。慧播星平台已生成超10万个数字人主播,整体转化率提升31%。其具备自主感知和多智能体协同能力,可根据直播间反馈自动决策,如发优惠券、切换商品等。已广泛应用于法律、教育、金融等行业,如汽车经销商用其介绍车型、图书直播中引经据典、健康产品带货结合专业数据个性化推荐。为降低门槛,推出“手机端一键开播”,上传2分钟视频即可启动24小时直播,月均成本千元以内,相较传统直播节省约80%。
百度NOVA数字人系统在2025WAIC大会亮相,实现“多模态认知引擎+情感计算框架”双核架构,“烛龙”大模型支持下,对话响应延迟低至300毫秒内,微表情生成精度达0.1毫米级,提升交互自然度,已赋能3000+企业客户。百度数字人凭借前沿技术,持续拓展应用边界,为各行业智能化转型注入强大动力 。