(资料图片)
在 I/O 开发者大会上,谷歌今天宣布它正在进行一项名为Universal Translator 的实验。顾名思义,该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该实用程序不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情。没错,输出的人说话视频会根据目标语言的发音同步嘴唇的动作。
考虑到此工具可能被滥用来创建有问题的 deepfakes,谷歌正在限制对 Universal Translator 的访问。因此,只有授权合作伙伴才能将其权力用于建设性项目,而一般用户将被排除在外。虽然此举限制了 Universal Translator 的潜力,但它有助于阻止不良行为者。
如上图所示,Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的嘴唇。
除了 Universal Translator,谷歌今天还推出了其他人工智能工具,包括改进的地图导航、更智能的谷歌搜索等。值得注意的是,该公司还推出了一些备受期待的硬件,例如Pixel 7a、Pixel Fold 和 Pixel Tablet。然而,考虑到当前围绕人工智能的趋势,该公司在其主题演讲中用了很大一部分时间来预览其人工智能工具,而不是主要关注其硬件和即将推出的 Android 操作系统功能。
有兴趣查看主要主题演讲的人可以在直播结束后通过 Google 的官方 YouTube 频道重新观看直播。
上一篇:长沙高速广福中心站:暴雨来袭,长沙高速人以“迅”治“汛”
下一篇:最后一页
北京这个司机真会玩:把建筑垃圾扔在马路边,然后悲剧了
为什么数模转换器需要缓冲?-数模转换器(DAC)的模拟输出可以是电压输出,也可以是电流输出。输出阻抗是任何
天津北方网讯:明天,天津天后宫将举行皇会展演。皇会展演是天津独具地域特色的表现形式,距今已经有300多
【给您提个醒】◎本报记者雍黎 通讯员黄琪奥立夏之后,随着气温一起升高的还有人们跑马拉松的热情。近一个
连日来,为进一步增强乡镇学生交通安全意识和自我安全防范意识,预防和减少涉及学生道路交通事故的发生,苏
X 关闭
X 关闭