最近啊,国家出了个叫《信息技术 客服型虚拟数字人通用技术要求》的标准,这可是咱国家在虚拟数字人这块头一个国家标准。这标准出来了,直接把客服型数字人研发和应用的技术规范给填起来了。你看现在,客服型数字人在金融、政务、教育这些地方用得可广了,几乎成了商家服务的主力。 这个新标准给全链条定了规矩,把形象怎么弄、视觉交互咋搞、语音咋说、情感咋流露、动作咋驱动还有维护这块都写得清清楚楚。哪怕是那种特别复杂的情感反馈,不管是啥类型、啥场景的数字人,都得照着做。 在形象这块,2D数字人必须得五官细节特别清楚,3D超写实的那个模型面数可不能低于20万。交互功能上也挺多讲究的,得支持语音、手势、肢体动作这些多模互动。平时维护也得跟上,关键词得有人看住,语料还得时不时更新一下。 最重要的是要让人觉得有温度。国家标准里直接说了口型驱动准确率不低于90%,这样你说话的时候嘴型才能对上号。手势动作成功率也得在90%以上。至于情感交互成功率得达到80%,这就把“能回应”变成了“会共情”。 为了做到这点,数字人得能采集表情、识别人的姿态和分析语音里的情绪。高兴、难过、着急这些它都得懂,然后通过做表情或者调整说话的口气给出合适的反馈。还有语音响应时间不能超过2秒,理解对的概率得有85%。这样服务才既有温度又有效率。 这个标准不光是为了现在的企业指明路劲儿大了去了。它既适用于现有的2D和3D产品升级换代,也给那些用人工智能生成内容的新技术留了后门。以后配套的测试方法出来了,企业就能照着标准快速找出问题优化产品了。 标准里还给系统搭了个完整的参考架构,形象生成、怎么交互、怎么驱动这些关键的地方都有了规定。驱动方式上还支持文本、语音、真人动作捕捉、视频这些模式,企业可以根据不同的场景随便选。 总之这次发布让虚拟数字人行业的发展有了个明确的方向和规范,真是给创新发展加了一把大油!