Amazon มีจุดมุ่งหมายเพื่อปรับปรุงคุณสมบัติทางชีวภาพและความเป็นส่วนตัวด้วยชิป AI Edge ใหม่ในอุปกรณ์ Echo

โปรเซสเซอร์ใหม่ในอุปกรณ์ Echo รุ่นล่าสุดของ Amazon กำลังให้ความสามารถที่น่าสนใจแก่ Alexa Assistant ที่ บริษัท กล่าวว่าให้ผู้บริโภคได้รับประสบการณ์ที่เป็นธรรมชาติมากขึ้นในการโต้ตอบด้วยการพูด นอกจากนี้ยังมีการวิจัยทางวิทยาศาสตร์มากมายที่เข้าสู่การแปลเสียงและการมองเห็นคอมพิวเตอร์เพื่อนำเสนอคุณสมบัติใหม่โดยไม่ต้องสร้างการจัดเก็บข้อมูลไบโอเมตริกซ์ใหม่และปัญหาความเป็นส่วนตัวและการประมวลผลขอบอุปกรณ์เป็นกุญแจสำคัญ

ที่อุปกรณ์และบริการในฤดูใบไม้ร่วงปี 2020ประกาศจากอเมซอนโดรนบินไปรอบ ๆ บ้านและบริการเกมออนไลน์ใหม่ได้รับความสนใจอย่างมาก บริษัทการเปิดตัวอย่างไรก็ตามอุปกรณ์สะท้อนแสงใหม่มีความสำคัญมากกว่าในแง่ของการพัฒนาที่เกี่ยวข้องกับชีวภาพ

ภายใน Echo ที่มีรูปทรงกลมและ Echo Echo ใหม่แสดง 10 โปรเซสเซอร์ Neural Edge AZ1 ได้รับมอบหมายให้ใช้งานอัลกอริทึมการพูดและการมองเห็นคอมพิวเตอร์ใหม่และอัปเดต

“ ในการประมวลผลคำพูดมิลลิวินาที” Miriam Daniel รองประธานของ Amazon Echo กล่าวในระหว่างการเข้าร่วมการเปิดตัวผลิตภัณฑ์ “ ลองนึกภาพการขอให้ Alexa เปิดไฟและมีความล่าช้าเล็กน้อยในแสงที่เกิดขึ้น - นั่นจะทำให้ลูกค้าใจร้อนจริงๆ

“ ทีมงานของเราทำงานอย่างหนักเพื่อโกนหนวดหลายร้อยมิลลิวินาทีจากเวลาตอบสนองของ Alexa [ดังนั้น] พวกเขาคิดค้นโปรเซสเซอร์ AZ1 Neural Edge ใหม่ทั้งหมด” Daniel กล่าว โมดูลซิลิคอนได้รับการสร้างขึ้นเพื่อเรียกใช้อัลกอริทึมการเรียนรู้ของเครื่องบนขอบเธอตั้งข้อสังเกต

-การตกแต่งภายในของ 4^ไทยGen Echo ที่มา: Amazon-

Rohit Prasad รองประธานและหัวหน้านักวิทยาศาสตร์ของ Alexa กล่าวว่า“ เป้าหมายของ Alexa คือการมีปฏิสัมพันธ์กับมันเป็นธรรมชาติเหมือนที่จะพูดคุยกับมนุษย์” และกล่าวเพิ่มเติมว่าความก้าวหน้าใน AI กำลังนำ Amazon เข้าใกล้วิสัยทัศน์นั้น ในบรรดาความสามารถในปัจจุบันคือการใช้อัลกอริทึมการค้นหาข้อเสนอแนะเพื่อรับคำติชมจากผู้ใช้ (“ Alexa นั่นผิด”) และใช้การโต้ตอบเพื่อแก้ไขข้อผิดพลาดในการดำเนินการ ความสามารถใหม่คือการสอนผู้ช่วย Alexa โดยตรงโดยการพูดมากกว่าผ่านแอพมือถือหรือพอร์ทัลออนไลน์เพื่อตั้งค่าฟังก์ชั่นใหม่

ในการแสดง Echo ใหม่ 10 จอแสดงผลและกล้องสามารถเปลี่ยนทิศทางและเล็งไปที่ลำโพงปัจจุบันในห้องเพื่อพยายามโต้ตอบที่เป็นธรรมชาติมากขึ้นในระหว่างการโทรวิดีโอ สิ่งนี้มีประโยชน์เมื่อมีคนย้ายไปอยู่ในห้องขณะพูดคุยหรือดูวิดีโอ แต่กลับกลายเป็นว่ามันค่อนข้างท้าทายที่จะทำสิ่งนี้โดยไม่ต้องจัดเก็บข้อมูลไบโอเมตริกซ์หรือข้อมูลที่สามารถระบุตัวตนได้ในรูปแบบของใบหน้าและเสียง

“ เราไม่ได้ทำ [สิ่งนี้] ด้วยการจดจำใบหน้าเรากำลังทำเช่นนั้นเพียงแค่เข้าใจรูปแบบของสิ่งที่มนุษย์มีลักษณะและเป็นรูปสามเหลี่ยมในเรื่องนั้น” เดฟปวกเปียกรองประธานอาวุโสฝ่ายอุปกรณ์และบริการที่อเมซอนอธิบาย “ สิ่งที่ยอดเยี่ยมเกี่ยวกับเทคโนโลยีคือทุกอย่างทำงานได้ในพื้นที่ดังนั้นจึงไม่มีสิ่งใดที่จะเกิดขึ้นกับคลาวด์มันทำทุกอย่างในท้องถิ่นบนโปรเซสเซอร์ประสาทนั้นและมันก็ไม่เคยออกจากอุปกรณ์” เขากล่าวเสริม

-การสร้างภาพข้อมูลของกระบวนการที่ไม่สามารถย้อนกลับได้ Echo 10 ใช้เพื่อแปลงภาพให้เป็นนามธรรมระดับสูงกว่าเพื่อรองรับการเคลื่อนไหว ที่มา: Amazon-

โปรเซสเซอร์ AZ1 ถูกใช้ในรูปแบบใหม่เพื่อทำความเข้าใจทิศทางที่เสียงมาจากไหนและตัดสินใจว่าจะปรับกล้องเมื่อใดและเร็วแค่ไหน ตามโพสต์เกี่ยวกับวิทยาศาสตร์อเมซอนบล็อก, echo show 10 ใช้การแปลแหล่งเสียง (SSL) ด้วยคอมพิวเตอร์วิสัยทัศน์ (CV)เพื่อระบุวัตถุและมนุษย์ในมุมมองและคิดออกว่าเสียงใดมาจากผู้คนและเป็นเพียงเสียงที่สะท้อนผนัง

รายละเอียดของชิปใหม่ของ Amazon

ชิปได้รับการออกแบบโดยความร่วมมือกับ Mediatek MT8512 ของ MediaTek เป็นพื้นฐานสำหรับโปรเซสเซอร์โดยได้รับการออกแบบสำหรับ“ การประมวลผลเสียงระดับสูงและแอปพลิเคชันผู้ช่วยเสียง” ตาม MediaTek

MT8512 รวมซีพียูคู่ 2GHz รองรับการเชื่อมต่ออุปกรณ์ต่อพ่วงที่หลากหลายซึ่งอุทิศให้กับการประมวลผลเสียงที่มีคุณภาพสูงเป็นพิเศษเช่นเดียวกับการเชื่อมต่อแบบ Dual-Band Bluetooth 5.0 และ Wi-Fi 5 MediaTek ตั้งข้อสังเกตว่า DSP เสียงที่มีประสิทธิภาพสูง (ตัวประมวลผลสัญญาณดิจิตอล) รวมอยู่ในการตรวจจับ WAWED และคำหลักที่รวดเร็วและแม่นยำในคำสั่ง VOCAL; DSP ทำงานร่วมกับโปรเซสเซอร์ Neural Edge AZ1“ เพื่อมอบประสบการณ์ Alexa ที่ตอบสนองได้มากที่สุด” Mediatek กล่าว

นอกจากนี้ชิปทำโดยใช้กระบวนการ 12 นาโนเมตร (NM); สำหรับการเปรียบเทียบงานศิลปะที่สมบูรณ์แบบคือ 5nm ในขณะที่โปรเซสเซอร์กระแสหลักจำนวนมากจาก Intel ที่ใช้ในแล็ปท็อปและพีซีเดสก์ท็อปทำด้วยกระบวนการ 14nm โดยทั่วไปแล้วทรานซิสเตอร์ขนาดเล็กก็ยิ่งสามารถบรรจุลงในพื้นที่“ แพ็คเกจ” เดียวกันและให้ประสิทธิภาพการใช้พลังงานที่ดีขึ้น กล่าวอีกนัยหนึ่งสำหรับการใช้งานในอุปกรณ์สแตนด์อโลนต้นทุนต่ำชิป MediaTek มองหาสมดุลระหว่างพลังงานประสิทธิภาพและต้นทุนต่อหน่วย