在 Google I/O 2019 的开幕主题演讲中,这家美国巨头比往年更频繁地发表演讲,表示其人工智能研究是为用户服务的,同时由于所开展的运营,越来越多地尊重用户的隐私在智能手机上。
除了演示之外,谷歌在演示中还给出了人工智能“为善”的各种用途(测量水位、在医学图像上尽早检测癌症等),还有另外三个例子日常的有形功能引起了人们的关注。
实时字幕,像书写一样理解每个单词
第一个版本足够先进,可以集成到下一版本的 Android Q 中,该版本将于明年夏末发布。它既适用于世界上 4.66 亿听力障碍者,也适用于有时需要字幕以确保他们理解所说内容的人们……
只需轻按智能手机屏幕即可激活实时字幕。从那时起,它将为设备上播放声音的所有媒体添加字幕。这可以是视频、音频消息、播客,甚至是您自己制作的录音。由于该功能内置于 Android 中,因此可在所有应用程序中使用。
最重要的是,该功能在本地运行,不需要访问互联网即可工作。因此,不会有数据传输到 Google 服务器。您的私生活先验是安全无害的。
https://www.youtube.com/watch?v=YL-8Xfx6S5o
Live Relay,为静音者和听力障碍者提供电话沟通便利
去年,谷歌的 Duplex 技术给人留下了深刻的印象,这项技术将机器学习和真实的语音合成相结合,可以自动进行预约或在餐厅预订餐桌。
今年,工程师们推出了 Live Relay,这是一种能够在接到电话时接听的电话助理,告诉对话者他是一名助理,他会在阅读呼叫者所说的内容时以书面形式抄录所有内容。被呼叫的人将在键盘上输入。
为了使呼叫者不必等待太久,输入完成功能使他们能够通过相关且经过调整的建议键入文本来更快地做出响应。在这种情况下,谷歌正在利用其已经推出的技术,这些技术似乎运行得越来越好,证明其算法正在改进。
从技术上讲,文本到语音和语音到文本转录的响应能力和准确性似乎令人难以置信。但最令人着迷的是,这个功能将为大多数沟通困难的人提供一个工具,使他们的日常生活更加轻松,并减少他们可能的孤立。
Project Euphonia,让 Google Assistant 能够理解我们所有人
Google Assistant 是迄今为止西方市场上最先进的基于语音的智能助手。他通常非常清楚对他说的话。当您使用的语言有很重的口音时,事情有时会变得有点复杂。当用户患有严重的言语问题时,例如中风后或患有退行性疾病时,这些问题就会变得更加复杂。
为了吸引这些人并为他们提供功能助理,谷歌推出了 Euphonia 项目。基本上,它包括要求有口语问题的人发音标准句子,例如你今天怎么样?或者打电话给妈妈。然后,这些样本将用于训练谷歌的算法,以便其助手能够理解这些以不同方式发音的公式。
但《Euphonia》并不仅仅停留在歌词上。谷歌研究人员一直致力于确保他们的人工智能能够识别某些声音或动作,以便产生相应的动作。该功能可以让严重残疾或无法说话的人更轻松地进行交流,无论是使用特殊设备、通过 Google Home 还是只是发送短信。
Opera One - AI 驱动的网络浏览器
作者:歌剧