ลำโพงหรือเสียงการรับรู้เป็นวิธีการไบโอเมตริกซ์ที่ใช้เสียงของแต่ละบุคคลเพื่อจุดประสงค์ในการรับรู้ (มันเป็นเทคโนโลยีที่แตกต่างจาก "การรู้จำเสียงพูด" ซึ่งตระหนักถึงคำที่เป็นข้อต่อซึ่งไม่ได้เป็นไบโอเมตริกซ์) กระบวนการรู้จำลำโพงขึ้นอยู่กับคุณสมบัติที่ได้รับอิทธิพลจากโครงสร้างทางกายภาพของทางเดินเสียงของแต่ละบุคคลและลักษณะพฤติกรรมของแต่ละบุคคล
เป็นตัวเลือกยอดนิยมสำหรับการตรวจสอบระยะไกลเนื่องจากความพร้อมใช้งานของอุปกรณ์สำหรับการรวบรวมตัวอย่างคำพูด (เช่นเครือข่ายโทรศัพท์และไมโครโฟนคอมพิวเตอร์) เนื่องจากความสะดวกในการบูรณาการการจดจำลำโพงนั้นแตกต่างจากวิธีการไบโอเมตริกซ์อื่น ๆ ในตัวอย่างคำพูดนั้นจะถูกจับแบบไดนามิกหรือในช่วงระยะเวลาหนึ่งเช่นไม่กี่วินาที การวิเคราะห์เกิดขึ้นกับแบบจำลองที่มีการตรวจสอบการเปลี่ยนแปลงเมื่อเวลาผ่านไปซึ่งคล้ายกับชีวภาพเชิงพฤติกรรมอื่น ๆ เช่นลายเซ็นแบบไดนามิกการเดินและการรับรู้การกดแป้น
องค์ประกอบทางสรีรวิทยาของการจดจำเสียงนั้นเกี่ยวข้องกับรูปร่างทางกายภาพของทางเดินเสียงของแต่ละบุคคลซึ่งประกอบด้วยทางเดินหายใจและช่องว่างของเนื้อเยื่ออ่อนซึ่งเสียงของเสียงเกิดขึ้น เพื่อสร้างคำพูดส่วนประกอบเหล่านี้ทำงานร่วมกับการเคลื่อนไหวทางกายภาพของกรามลิ้นและกล่องเสียงและเสียงสะท้อนในทางเดินจมูก รูปแบบเสียงของการพูดมาจากลักษณะทางกายภาพของทางเดินหายใจ
การเคลื่อนไหวของปากและการออกเสียงเป็นองค์ประกอบพฤติกรรมของไบโอเมตริกซ์นี้ การจดจำลำโพงมีสองรูปแบบ: ขึ้นอยู่กับข้อความ (โหมด จำกัด ) และข้อความอิสระ (โหมดที่ไม่มีข้อ จำกัด )
ในระบบที่ใช้คำพูด“ ขึ้นอยู่กับข้อความ” แต่ละคนนำเสนอวลีคงที่หรือได้รับแจ้งที่ตั้งโปรแกรมไว้ในระบบและสามารถปรับปรุงประสิทธิภาพโดยเฉพาะกับผู้ใช้ที่ร่วมมือกัน
ระบบ“ ข้อความอิสระ” ไม่มีความรู้ล่วงหน้าเกี่ยวกับการใช้ถ้อยคำของผู้นำเสนอและมีความยืดหยุ่นมากขึ้นในสถานการณ์ที่บุคคลที่ส่งตัวอย่างอาจไม่ทราบถึงคอลเลกชันหรือไม่เต็มใจที่จะให้ความร่วมมือซึ่งนำเสนอความท้าทายที่ยากขึ้น
ตัวอย่างคำพูดเป็นรูปคลื่นที่มีเวลาบนแกนแนวนอนและความดังในการเข้าถึงแนวตั้ง ระบบการจดจำลำโพงวิเคราะห์เนื้อหาความถี่ของคำพูดและเปรียบเทียบคุณสมบัติเช่นคุณภาพระยะเวลาการเปลี่ยนแปลงความเข้มและระดับเสียงของสัญญาณ
ในระบบ“ ขึ้นอยู่กับข้อความ” ระหว่างขั้นตอนการรวบรวมหรือการลงทะเบียนบุคคลนั้นกล่าวว่าคำหรือวลีสั้น ๆ (คำพูด) โดยทั่วไปจะถูกจับโดยใช้ไมโครโฟนที่สามารถทำได้ง่ายเหมือนโทรศัพท์ ตัวอย่างเสียงจะถูกแปลงจากรูปแบบอะนาล็อกเป็นรูปแบบดิจิตอลคุณสมบัติของเสียงของแต่ละบุคคลจะถูกสกัดและจากนั้นสร้างโมเดล ระบบตรวจสอบลำโพง“ ขึ้นอยู่กับข้อความ” ส่วนใหญ่ใช้แนวคิดของโมเดล Markov ที่ซ่อนอยู่ (HMMs) แบบจำลองแบบสุ่มที่ให้การแสดงทางสถิติของเสียงที่ผลิตโดยบุคคล HMM แสดงถึงการเปลี่ยนแปลงพื้นฐานและการเปลี่ยนแปลงทางโลกเมื่อเวลาผ่านไปที่พบในสถานะการพูดโดยใช้คุณภาพระยะเวลา / การเปลี่ยนแปลงความเข้ม / ความเข้ม / พิทช์ที่กล่าวถึงข้างต้น
อีกวิธีหนึ่งคือโมเดลผสมแบบเกาส์เซียนซึ่งเป็นรูปแบบการทำแผนที่ของรัฐที่เกี่ยวข้องกับ HMM ซึ่งมักใช้สำหรับแอปพลิเคชัน“ ข้อความอิสระ” ที่ไม่มีข้อ จำกัด เช่น HMM วิธีนี้ใช้เสียงเพื่อสร้าง "สถานะ" เวกเตอร์จำนวนหนึ่งซึ่งแสดงถึงรูปแบบเสียงต่าง ๆ ซึ่งเป็นลักษณะของสรีรวิทยาและพฤติกรรมของแต่ละบุคคล
วิธีการเหล่านี้ทั้งหมดเปรียบเทียบความเหมือนและความแตกต่างระหว่างเสียงอินพุตและเสียงที่เก็บไว้“ สถานะ” เพื่อสร้างการตัดสินใจรับรู้ หลังจากการลงทะเบียนในระหว่างขั้นตอนการรับรู้คุณสมบัติคุณภาพ / ระยะเวลา / เสียงดัง / พิทช์ที่เหมือนกันจะถูกสกัดจากตัวอย่างที่ส่งและเปรียบเทียบกับแบบจำลองของตัวตนที่อ้างสิทธิ์หรือตั้งสมมติฐานและโมเดลจากลำโพงอื่น ๆ โมเดลลำโพงอื่น ๆ (หรือ“ ต่อต้านลำโพง”) มี“ สถานะ” ของบุคคลที่หลากหลายไม่รวมถึงตัวตนที่อ้างหรือตั้งสมมติฐาน ตัวอย่างเสียงอินพุตและโมเดลที่ลงทะเบียนจะถูกนำมาเปรียบเทียบกับการสร้าง“ อัตราส่วนความน่าจะเป็น” ซึ่งบ่งบอกถึงความเป็นไปได้ที่ตัวอย่างอินพุตมาจากลำโพงที่อ้างสิทธิ์หรือตั้งสมมติฐาน หากการป้อนข้อมูลเสียงเป็นของตัวตนที่อ้างหรือตั้งสมมติฐานคะแนนจะสะท้อนตัวอย่างที่คล้ายคลึงกับโมเดลของตัวตนที่อ้างสิทธิ์หรือตั้งสมมติฐานมากกว่าโมเดล "ต่อต้านลำโพง"
การใช้งานระบบการจดจำลำโพงที่ดูเหมือนง่ายมีส่วนช่วยในกระบวนการจุดอ่อนที่สำคัญและความอ่อนแอต่อช่องสัญญาณส่งและความแปรปรวนของไมโครโฟนและเสียงรบกวน
ระบบอาจเผชิญกับปัญหาเมื่อผู้ใช้ลงทะเบียนโทรศัพท์โทรศัพท์พื้นฐานที่สะอาดและพยายามตรวจสอบโดยใช้โทรศัพท์มือถือที่มีเสียงดัง การไร้ความสามารถในการควบคุมปัจจัยที่มีผลต่อระบบอินพุตสามารถลดประสิทธิภาพได้อย่างมีนัยสำคัญ ระบบตรวจสอบลำโพงยกเว้นผู้ที่ใช้วลีที่ได้รับแจ้งนั้นมีความอ่อนไหวต่อการโจมตีด้วยการใช้เสียงที่บันทึกไว้ มาตรการป้องกันการตบที่ต้องใช้คำพูดของคำหรือวลีที่ระบุและสุ่มกำลังถูกนำไปใช้เพื่อต่อสู้กับจุดอ่อนนี้
ตัวอย่างเช่นระบบอาจขอวลีที่สร้างขึ้นแบบสุ่มเพื่อป้องกันการโจมตีจากตัวอย่างเสียงที่บันทึกไว้ล่วงหน้า ผู้ใช้ไม่สามารถคาดการณ์ตัวอย่างแบบสุ่มที่จะต้องใช้และดังนั้นจึงไม่สามารถพยายามโจมตี“ การเล่น” การโจมตีในระบบได้สำเร็จ
การวิจัยในปัจจุบันในพื้นที่ของการจดจำลำโพง“ ข้อความอิสระ” ส่วนใหญ่มุ่งเน้นไปที่การย้ายเกินการวิเคราะห์สเปกตรัมระดับต่ำที่กล่าวถึงก่อนหน้านี้ แม้ว่าระดับข้อมูลสเปกตรัมยังคงเป็นแรงผลักดันที่อยู่เบื้องหลังการรับรู้ แต่การหลอมรวมลักษณะระดับสูงขึ้นด้วยข้อมูลสเปกตรัมระดับต่ำกำลังกลายเป็นเทคนิคห้องปฏิบัติการยอดนิยม
ลักษณะการจดจำลำโพงเช่นจังหวะความเร็วการมอดูเลตและน้ำเสียงขึ้นอยู่กับประเภทบุคลิกภาพและอิทธิพลของผู้ปกครอง และความหมาย idiolects การออกเสียงและนิสัยแปลก ๆ เกี่ยวข้องกับบ้านเกิดสถานะทางเศรษฐกิจและสังคมและระดับการศึกษา
ลักษณะระดับสูงสามารถรวมกับข้อมูลสเปกตรัมระดับต่ำพื้นฐานเพื่อปรับปรุงประสิทธิภาพของระบบการจดจำลำโพง“ ข้อความอิสระ”
แหล่งที่มา:สภาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (NSTC)
หัวข้อบทความ
การฉ้อโกง-การพิสูจน์ตัวตน-การรับรองความถูกต้องจากระยะไกล-เสียงชีวภาพ-การจดจำเสียง