让“无声世界”感受赛场魅力!带你看看冬奥手语数字人有哪些奥秘******
2022年2月4日,第24届冬季奥林匹克运动会在北京举行,让世界目光再次聚焦中国。本届北京冬奥会秉持绿色、共享、开放、廉洁的办赛理念,凝聚中国科技力量,面向世界、面向未来,向全球奉献了一场精彩、非凡、卓越的奥运盛会。
本届冬奥会运用最新科技手段,为全世界观众提供了惊艳的现场转播和全方位覆盖报道,北京冬奥会也成一场上科技含量高的奥运会。赛事活动期间,为了让各类人群都能平等地享受本届冬奥盛会,北京电视台上线了智能手语播报数字人,在《北京新闻》和《北京您早》等节目中进行冬奥专题手语播报,为听障人士带来精彩赛事报道。
最新数据显示,我国听障人群超过2700万,这部分人群与健听人一样,他们对教育、社交、娱乐等信息获取都有巨大的需求。但长期以来,传统人工手语翻译工作量大,且主持人和手语主持人配合难度极高。手语动作表情复杂,语序与正常语序差异大,正常情况下想要熟练掌握手语大约需要2年左右的时间,还要结合语境进行猜测。
受北京市科委科技冬奥专班委托,北京电视台联合凌云光、智谱AI等业内科技公司,在北京市残疾人联合会和市残联聋人协会等支持下,用3个多月时间,让手语播报数字人完成了近10万条手语语料学习,且翻译准确率高达90%。
在如此短的时间内实现这项高难度动作,智能手语数字人是如何做到,在这背后又有哪些技术创新难点?
在多位业内人士看来,近年来人工智能体系建设重点布局在算法层和应用层,数据层建设远远不足,并且针对数字人相关产业,底层数据库的数量、质量和开源程度还明显不足。尤其是国内现有的手语语料数据库数量少,且多以图像、视频等二维平面为主,无法满足AI(人工智能)训练的需求。
同时,因手语语序与中文语序差异大,方言分化更加复杂,且需要通过表情、口型、动作等方式来传达信息。除了传统的二维平面图像、视频采集,三维肢体运动、表情信息数据采集及结构化参数表达外,手语语料数据库建设对三维运动信息捕捉也十分重要。
凌云光手语数字人产品相关负责人介绍,在建设高质量手语语料库的同时,他们充分调研了2022北京冬奥专用手语术语,并联合北京市残联、聋人协会等相关组织机构,进行数据标注,建设手语语义映射关系,不仅完善了国内手语数据库的建设,也为手语推广和AI研究留下了宝贵的数据资产。
该负责人举例说,基于“悟道2.0”超大规模人工智能模型的技术支撑,手语数字脑用计算机模仿听障人士的大脑,将看到的中文文本信息转换成手语词汇序列,包括中文语义蒸馏模型和AI手语分词快编算法的研究。中文语义蒸馏模型用于从输入的文稿或文本中提取出关键的语义信息,将中文文本语义提炼和精简,形成精准匹配适合手语表达的文本;AI手语分词快编算法则用于将蒸馏得到的中文文本,根据冬奥手语语料库划分成相应的手语词汇序列,供数字人做表达输入。
该负责人还提到,数字人是冬奥手语播报的载体和展现形式,通过高精度写实数字人全流程制作方案,可实现一键数字建模,高度还原真人发肤,重新毛孔等细节,更加真实亲切。同时,通过跨模态拟人生成算法,还可以将手语词汇序列,生成相应的动作信息,驱动数字人模型做出相应的动作、手势和表情。(姚坤森)
探寻数字时代“科技之魅”******
【乌镇聚焦】
探寻数字时代“科技之魅”
——2022年世界互联网领先科技成果发布
光明网记者 李政葳 李飞
11月9日下午,作为2022年世界互联网大会乌镇峰会重要板块之一,世界互联网领先科技成果发布活动在乌镇互联网国际会展中心举行。
发布厅内,蓝色弧形大屏幕搭配四周蓝绿交融的灯光,再有激光、3D等技术加持,现场科技感十足。观众席座椅上放置的“科技之魅”手册,介绍了15项世界互联网领先科技成果概况。这批成果重点聚焦全球互联网前沿技术与应用发展,并更加关注互联网基础理论创新和技术应用创新。
“以互联网为代表的信息技术日新月异,日益成为创新驱动的先导力量。成果发布活动为全球互联网创新科技成果展示、交流、推广搭建了国际化平台,通过发掘全球科技示范成果,共同探寻网络空间发展的新趋势。”专家推荐委员会中方主任、中国工程院院士邬贺铨说。
5G已来,6G不远
自从2016年首次举办世界互联网领先科技成果发布活动以来,5G的身影几乎历年都不缺席。近年来,随着5G建设的持续深化、创新应用的不断扩展,业界更多考虑如何充分挖掘5G潜能,为用户提供更为极致的体验。
来自高通公司的“全球首个集成5G AI处理器的调制解调器及射频系统”——骁龙X70便入选其中。“它将开启5G智能连接的新时代。”高通公司全球副总裁侯明娟介绍了骁龙X70具备的技术首创、特性丰富、应用广泛等三大领先优势,期待该技术为智能网联带来行业领先的5G连接体验,推动行业变革。
爱立信带来了“5G时间关键型通信使能远程操控”成果,重点瞄准以远程操控、XR(增强现实)等为代表的时延敏感类应用。爱立信中国区总裁方迎介绍,通过这项技术可以实时监控网络和终端的状态,预测潜在卡顿,为用户提供流畅的体验。
5G已来,6G还有多远?北京邮电大学教授、鹏城实验室研究员陶小峰现场给出答案。鹏城实验室联合北京邮电大学等推出了“EAGLE 6G:面向6G无线高速接入原型系统及测试环境”。他表示,6G新一代无线通信技术已成为全球研究热点,“未来我们将不断提升6G创新生态体系实力”。
备受关注的IPv6相关成果也榜上有名。中国联通副总经理梁宝俊在发布“‘IPv6+’标准制定、设备研制、组网设计及规模应用”时表示,在IPv6规模商用的基础上,不断面向5G、工业互联网和算力网络新需求,积极开展“IPv6+”技术和应用创新,不断增强IPv6网络的融合承载能力,在提升用户体验的同时,也可以保障网络安全。
走向智能,走向安全
近年来,“数字孪生”成为热词。经过4年的研究和创新,微软公司的“微软第一方数字孪生产品”不断走向应用。发布仪式上,微软中国副总经理赵军讲解了微软“数字孪生”:这是一个由点到线构成的知识图谱,不仅具有数字孪生技术服务能力,而且能与不同的数字化平台相结合,进而构成跨行业端到端的解决方案。“开发者可以利用‘数字孪生’定义语言,对物理世界进行定义,跟踪和追测现实与历史的环境数据,并支持多系统的数据投入。”赵军说。
辨别一条信息的真伪需要多久?中科院计算所给出的答案是:“动一动手指,只需一秒钟。”近年来,中科院计算所数字内容合成与伪造检测实验室主任、中科睿鉴创始人曹娟的团队一直在与网络谣言斗智斗勇。“面对信息谣言这一风险与挑战,数字内容伪造检测技术便应运而生。”曹娟在发布“睿鉴数字内容虚假伪造检测系统和设备”时表示,该成果集大数据底座、硬件设备、AI平台、应用场景于一体,并在此基础上研制出虚假信息检测系统“睿鉴识谣”。“它可以辨别取证伪造痕迹,让虚假文本、虚假图片、虚假视频无处遁形。”
在过去7次世界领先科技成果发布中,来自卡巴斯基的代表3次站上舞台。本次他们发布的科技成果依旧与网络安全密切相关。在介绍“卡巴斯基安全远程工作空间(基于卡巴斯基操作系统)”时,卡巴斯基大中华区总经理郑启良讲述了“网络免疫”的概念。“我们将方法、理念、安全架构融入操作系统中,实现操作系统的‘免疫’。”郑启良介绍,该解决方案的创新性在于不仅将端点安全性提高到了以往难以达到的水平,还改进了IT端点的生命周期。
科技强“芯”,数据驱动
毋庸置疑,芯片技术是科技领域中最为重要的技术之一。本次成果发布中,龙芯中科的“龙芯3A5000/3C5000处理器芯片”也位列其中。“两个处理器(3A5000/3C5000处理器)的性能逼近或达到市场主流产品的水平,可满足行业信息化及云数据中心等应用需求。”龙芯中科董事长胡伟武说。
据了解,该成果已广泛应用于电子政务、能源、金融、电信、教育等领域。比如,在国内,统信、麒麟等操作系统,欧拉、鸿蒙等操作系统社区,办公软件、微信、QQ、钉钉等基础应用,均推出了“龙架构版本”。
在本次发布的15项领先科技成果中,有三家国内高校机构代表发布成果,这也彰显了高校在互联网科技研发领域发挥的重要作用。其中,清华大学发布了“大规模知识图表示学习的体系化基础算法及开源工具”,北京大学发布了“基于数字对象架构的数联网及大数据互操作技术”,浙江大学发布了“大规模图神经网络模型端云协同计算平台和应用示范”。
在领先科技成果评选过程中,世界互联网大会前期征集到来自中国、俄罗斯、美国、英国、瑞典等国家的近300项优秀成果,近40位来自全球互联网领域的知名专家组成推荐委员会,申报成果也涵盖了5G/6G、基础操作系统、图计算、人工智能等互联网前沿技术领域。
“在全球领先科技人才和企业的广泛参与下,一批又一批领先科技成果在互联网技术创新的征程上熠熠生辉,为国际交流互鉴和科技成果转化照亮前行之路。”邬贺铨说。
《光明日报》( 2022年11月10日 10版)
(文图:赵筱尘 巫邓炎)