亚马逊最新一代Echo设备中的新处理器正在为Alexa助理吸引人的功能,该公司称,该功能为消费者提供了基于语音的互动的自然体验。还有大量的科学研究,这些科学研究已经进入了良好的本地化和计算机愿景,可以提供新功能,而无需创建新的生物识别数据存储和隐私问题,而设备边缘处理是关键。
在2020年秋季的设备和服务上公告从亚马逊(Amazon)飞行到家里的无人机和新的在线游戏服务引起了很多关注。公司的首次亮相然而,在与生物识别相关的开发方面,新的回声设备更为重要。
在全球形状的Echo和全新的Echo Show 10中,AZ1神经边缘处理器的任务是运行新的和更新的语音和计算机视觉算法。
“在演讲处理中,毫秒很重要,”亚马逊Echo副总裁Miriam Daniel在产品推出活动期间说。 “想象一下,要求Alexa打开灯光,并且灯光的延迟略有延迟,这会使客户真正不耐烦。
丹尼尔说:“我们的团队非常努力地从Alexa的响应时间中刮掉数百毫秒,因此他们发明了全新的AZ1 Neural Edge处理器。”她指出,该硅模块是专门建造的,可以在边缘运行机器学习算法。
((4的内部ThGen Echo。资料来源:亚马逊)
Alexa的副总裁兼科学家Rohit Prasad说:“ Alexa的目标是使与人类交谈的自然互动。”并进一步指出,AI的进步使亚马逊更加接近该愿景。当前功能包括使用反馈搜索算法来获取用户反馈(“ Alexa,这是错误的”),并使用交互来纠正行动中的错误。一个新的能力是直接通过语音来教Alexa助手,而不是通过移动应用或在线门户来教授新功能。
在新的Echo Show 10上,显示屏和相机能够改变方向并将其瞄准房间中的当前扬声器,以期在视频通话过程中进行更自然的互动。当某人在谈话或观看视频时在房间周围移动时,这很有用,但是事实证明,在不存储生物识别数据或以面孔和声音的形式存储生物识别数据或个人身份信息的情况下进行此操作非常具有挑战性。
亚马逊设备和服务高级副总裁戴夫·林普(Dave Limp)解释说:“我们不是在面部识别方面做到这一点;我们正在这样做,只是了解人类的样子和对此进行三角调节的形式。”他补充说:“这项技术的很酷的事情是所有这些都在本地运行。因此,这一切都不属于云;所有这些都在当地在该神经处理器上完成,并且永远不会离开设备。”
((非可逆过程的可视化回声10用于将图像转换为更高级别的抽象以支持运动。资料来源:亚马逊)
AZ1处理器以一种新颖的方式使用,以了解声音来自的方向,并决定调整相机的何时,何时何地。根据亚马逊科学的帖子博客,Echo Show 10使用声源本地化(SSL)计算机视觉(简历)在视野中识别对象和人类,并找出哪些声音来自人,哪些声音只是从墙壁上反射出来的声音。
亚马逊新芯片的详细信息
该芯片是与Mediatek合作设计的。根据Mediatek的说法,Mediatek的MT8512构成了处理器的基础,是“高端音频处理和语音助手应用程序”的设计。
MT8512集成了2GHz双核CPU,支持用于超高质量音频处理的各种外围连接,以及蓝牙5.0和Wi-Fi 5双波段连接性。 MediAtek指出,包括高性能的语音DSP(数字信号处理器),以进行声乐命令中的快速,准确的唤醒字和关键字检测; Mediatek表示,DSP与AZ1神经边缘处理器“提供最响应的Alexa体验”一起工作。
另外,使用12纳米(NM)过程制成芯片;为了进行比较,绝对的最新技术为5nm,而在笔记本电脑和台式电脑中使用的Intel的许多主流处理器都是用14NM工艺制成的。一般而言,较小的晶体管是,更多的晶体管可以包装到相同的“包装”空间中,并提供提高的能源效率。换句话说,为了在低成本独立设备中使用,Mediatek Chip的芯片旨在在功率,效率和单位成本之间提供良好的平衡。