ai 科技资讯,李未可会成为主流吗?

AI资讯3周前发布 逍遥
9 0 0

对于虚拟人物的应用ai 科技资讯,并不只停留于娱乐。前段时间,央视也宣布会在冬奥会上用虚拟主播播报新闻。

尤其是在元宇宙这把虚火的加温下,虚拟人更是一下子涌进了现实世界。

李未可背后的团队,杭州李未可科技有限公司,打造的终极产品是AR眼镜。公司旗下数字人零下、小柯等都将最终落地在眼镜产品中,与用户进行智能化交互。今年6月,在一年一度的苹果全球开发者大会(WWDC22)上苹果的AR眼镜并未如约而至,而公众对于消费级AR产品的期待和呼声已经越来越高。根据此前媒体报道,李未可的AR眼镜产品将于今年下半年推出,届时“李未可”也将成为首个在AR领域中应用的AI数字人。

AI实时翻译现在已经达到一个什么样的水平了?

当前AI翻译模块是能够实时的,但是由于每个人说话的断句【停顿】以及语音的不标准以及重复冗余字符【比如额,嗯等等】等等各种因素,导致语音识别需要一定语音量缓冲和上下文环境理解,才能够识别字、词、短句正确,而语音翻译需要根据识别后的文字进行翻译,一旦文字识别错误,【特别是同音不同字也不同义的】进行翻译后,会错的很离谱,当然翻译本身也是非常复杂的。所以识别模型、文字处理模型、翻译模型都需要针对特定场景进行针对性训练但是模型本身的计算不会引入多少延迟的,而另外两个延迟的引入是在字、音、画同步以及二次编码上,同时为了兼容某些语速较快的人,确保字符能够显示一定的时长,需要加些延迟。
综上所述AI翻译处理在整条直播链路中额外会引入500ms~2s的延迟.
所以可以看看整个链路延迟来看,AI翻译直播的端到端理论延迟可以在 1s左右。而此次阿里速卖通的跨境直播上推出的就是一个实时直播的场景,延迟在5-10s, 属于实时直播范畴,其中AI翻译引入的额外延迟可忽略不计。
而且不仅仅是电商直播,包括游戏直播也可以加入实时字幕和翻译的,比如今年S10赛事,某就采用了阿里云的实时字幕功能进行了实时字幕大型游戏赛事直播的尝试。

© 版权声明

相关文章