如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
IndustryObservation产业观察DCWAI虚拟数字人技术在融合媒体生产中的运用陈芳(南京广播电视集团,江苏南京210001)摘要:重大活动无线电安全保障肩负着贯彻国家安全战略,维护社会稳定,维护国家形象的重要使命。通过对重大活动无线电安全保障工作内容的梳理,深化对无线电保障工作的认识,更好地服务于今后的重大活动无线电保障工作。关键词:AI虚拟数字人;多模态交互;自然语言处理技术;语音识别;语音合成doi:10.3969/J.ISSN.1672-7274.2021.01.009中图分类号:TN94;TP3文献标示码:A文章编码:1672-7274(2020)01-0021-03TheApplicationofAIVirtualDigitalHumanTechnologyintheMediaConvergenceOperationCHENFang(NanjingBroadcastingGroup,Nanjing21001,China)Abstract:StartingfromthetheoryofAIvirtualdigitalhumantechnology,thisarticleanalyzesthevariousapplicablescenariosofthetechnology,andcombinedwiththeactualapplication,introducestheapplicationofAIvirtualdigitalhumantechnologyintheMediaConvergenceoperationofNanjingBroadcastingGroup.Keywords:AIvirtualdigitalhuman;multimodalinteraction;naturallanguageprocessing;automaticspeechrecognition;testtospeech0引言和制作方面都有着丰富的应用场景,提供了一种更自然当前,在物联网、大数据、传感网、脑科学等新理的内容交互方式。AI虚拟数字人分为Avatar型、内容生成型、交互对论新技术以及经济社会发展强烈需求的驱动下,人工智能加速发展,与各领域各行业进行深度融合,呈现出深话型三大类,三种类型对应了三种不同的技术路径,实度学习、跨界融合、人机协同、群智开放、自主操控等现难易程度也不同。新特征。借助人工智能,推动新闻播报与先进技术结合,1.1Avatar型推动媒体生成内容科技化的展示水平,是广电行业融媒本质是真人表演,通过算法换成另外一张脸,例如体新闻生产发展创新的迫切需要。某些好莱坞电影特效,还有一些美妆直播APP,都是这南京广电集团突破性地将AI虚拟数字人技术引入融类技术。该类型以真人表演作为原型,声音也需要真人合媒体新闻生产平台,采用栏目真实主持人为原型制作声音,因此,并不是真正意义上的虚拟数字人。虚拟主播的形象和声音,打造出虚拟真人形象“牛博士”;运用前沿的人工智能多模态交互技术,借助公有云问答数据库、互联网大数据信息,创造出互动对话式3D卡通人物“牛咔宝宝”。AI虚拟数字人技术在融合媒体中的运用,响应了国家对融媒体在内容传播手段和方式上的创新需求,是AI图2Avatar型数字人实现流程技术在广电融媒体技术领域一次创新应用。1.2内容生成型1AI虚拟数字人技术介绍图1虚拟数字人技术组成部分图3内容生成型数字人实现流程AI虚拟数字人技术,是用语音或文字内容实时驱动通过TTS语音合成技术将输入的文本合成为语音,虚拟形象口唇动作及面部表情的技术,在内容动态呈现再驱动虚拟数字人生成人脸表情、唇形、肢体动作等。数字通信世界212021.01产业IGITCW观察IndustryObservation内容生成式数字人,主要采用离线合成的方式,实时性⊙采用栏目真实主持人为原型制作虚拟主播的形象要求不高,技术难度一般。和声音,表情生动自然,口型精准度高;合成声音音质1.3交互对话型清晰、音色饱满、自然流畅,播报专业感强,可与真人媲美。交互对话型数字人,即多模态对话机器人。用户对⊙不需要复杂的后期制作工序,即可便捷高效地生话的语音经过语音识别技术ASR转换为文本,输入到成海量可复用的播报内容,满足一次采集、多种生成、对话机器人;对话机器人返回应答的文本经过语音合成多元传播的需求。TTS得到语音,再通过语音驱动技术合成视觉效果。这⊙播报形式新颖,响应了国家对新媒体内容传播手类数字人“看得见”、“听得懂”、“会说话”,是自然语言段和方式创新的需求。处理、语音识别、视觉合成三大技术的综合,复杂度最高。