ได้เข้าสู่เขตแดนใหม่ของชีววิทยาพื้นฐาน: ช่วยให้นักวิทยาศาสตร์เข้าใจโปรตีนได้ดีขึ้นผู้ทำงานของเซลล์ที่มีชีวิต
นักวิทยาศาสตร์ได้พัฒนาเครื่องมือ AI ใหม่สองตัวในการถอดรหัสโปรตีนมักจะพลาดโดยวิธีการตรวจจับที่มีอยู่นักวิจัยรายงาน 31 มีนาคมในข่าวกรองเครื่องธรรมชาติ- การเปิดเผยโปรตีนที่ไม่รู้จักเหล่านี้ในตัวอย่างทางชีวภาพทุกประเภทอาจเป็นกุญแจสำคัญในการสร้างการรักษาโรคมะเร็งที่ดีขึ้นปรับปรุงความเข้าใจของแพทย์เกี่ยวกับโรคและการค้นพบกลไกที่อยู่เบื้องหลังความสามารถของสัตว์ที่ไม่สามารถอธิบายได้
หาก DNA แสดงถึงแผนแม่บทของสิ่งมีชีวิตโปรตีนจะเป็นโครงสร้างสุดท้ายให้ห่อหุ้มสิ่งที่เซลล์จริงๆ แล้วทำและทำ การเบี่ยงเบนจากพิมพ์เขียว DNA สำหรับการทำโปรตีนเป็นเรื่องธรรมดา: โปรตีนอาจได้รับการเปลี่ยนแปลงหรือตัดหลังการผลิตและมีหลายกรณีที่มีบางอย่างผิดปกติในท่อนำไปสู่โปรตีนที่แตกต่างจากแผนผังทางพันธุกรรมเริ่มต้น โปรตีน“ ซ่อนเร้น” ที่ไม่คาดคิดเหล่านี้เป็นเรื่องยากในอดีตสำหรับนักวิทยาศาสตร์ในการระบุและวิเคราะห์ นั่นคือสิ่งที่เครื่องมือการเรียนรู้ของเครื่องเข้ามา
แบบจำลอง AI ที่เรียกว่า Instanovo และ Instanovo+เป็นก้าวสู่“ Holy Grail” ของการวิจัยโปรตีน: เพื่อคลี่คลายเอกลักษณ์ทางพันธุกรรมของโปรตีนที่ยังไม่ได้ศึกษาก่อนหน้านี้ Benjamin Neely นักเคมีและนักวิทยาศาสตร์โปรตีนจากสถาบันมาตรฐานและเทคโนโลยีแห่งชาติใน Gaithersburg
ด้วยความก้าวหน้าและการทดสอบอย่างต่อเนื่องเครื่องมือเหล่านี้หรือเครื่องมือที่คล้ายกัน“ จะมีพลังมันจะให้ฉันเห็นสิ่งที่ฉันไม่สามารถมองเห็นได้” นีลีกล่าวซึ่งไม่ได้มีส่วนร่วมในการศึกษากล่าว สิ่งมีชีวิตที่ไม่ใช่โมเดลจำนวนมากยังไม่ได้รับการศึกษาอย่างดีและโปรตีนของพวกเขาได้รับการจัดหมวดหมู่ไม่ดี ในฐานะที่เป็นสมมุติฐาน Neely แนะนำเครื่องมือใหม่ที่สามารถใช้ในการค้นหาโปรตีนไตที่คลุมเครือซึ่งทำให้ปลากระเบนเคลื่อนที่ระหว่างน้ำกร่อยและมหาสมุทร
AI ได้เปลี่ยนแปลงวิธีการที่นักวิจัยด้วยเครื่องมือที่เรียกว่า Alphafold และการเรียนรู้ของเครื่อง - กำลังได้รับรางวัลโนเบลในปี 2567 การเติมช่องว่างที่ยืนยาวในการจัดลำดับโปรตีนนั้นพร้อมที่จะกระโดด AI ครั้งต่อไปในสนาม Neely แนะนำ
Instanovo (IN) มีโครงสร้างคล้ายกับโมเดลหม้อแปลง GPT-4 ของ OpenAI และได้รับการฝึกฝนให้แปลยอดเขาและหุบเขาของ "ลายนิ้วมือ" ของโปรตีนที่พล็อตผ่านสเปคตรัมมวลเป็นสายของกรดอะมิโนที่เป็นไปได้ ลำดับกรดอะมิโนเหล่านี้สามารถใช้ในการสร้างและระบุโปรตีนที่ซ่อนอยู่ Instanovo+ (in+) เป็นรูปแบบการแพร่กระจายที่ทำงานได้ดีขึ้นเช่นเครื่องกำเนิดภาพ AI และได้รับการเตรียมไว้เพื่อใช้ข้อมูลเริ่มต้นเดียวกันและลบเสียงรบกวนเพื่อสร้างภาพโปรตีนที่ชัดเจน
ในและใน+ คือไม่ใช่ความพยายามครั้งแรกในการใช้การเรียนรู้ของเครื่องจักรกับการจัดลำดับโปรตีน แต่การศึกษาใหม่แสดงให้เห็นว่าเทคโนโลยีมีมานานแค่ไหนในช่วงไม่กี่ปีที่ผ่านมาการขยายฐานข้อมูลการวิเคราะห์โปรตีนเช่นเครื่องมือ Proteome ซึ่งสามารถใช้ในการฝึกอบรมโมเดล AI นี่คือข้อมูลที่ใช้ในการพัฒนาและฝึกอบรมในและใน+แต่การวิเคราะห์ของแบบจำลองขยายเกินกว่าโปรตีนในฐานข้อมูลที่มีอยู่ พวกเขาสามารถแนะนำกลุ่มโปรตีนที่เป็นไปได้ที่ยังไม่ได้จัดทำรายการ
เครื่องมือทั้งสองแสดงสัญญาเป็นรายบุคคลในการทดสอบเมื่อเทียบกับผลลัพธ์จากตัวถอดรหัสโปรตีนหม้อแปลง AI ที่ปล่อยออกมาก่อนหน้านี้เรียกว่า Casanovo และจากส่วนใหญ่ใช้เป็น ID โปรตีนที่ไม่รู้จัก ในการทดสอบการเรียงลำดับโปรตีนที่ตรงไปตรงมาแบบจำลองจะไม่ดีกว่าการค้นหาฐานข้อมูล แต่ดูเหมือนว่าพวกเขาจะเก่งในการทดลองที่ซับซ้อนมากขึ้น
งานที่ท้าทายอย่างยิ่งหนึ่งคือการจัดลำดับโปรตีนภูมิคุ้มกันของมนุษย์ซึ่งเป็นเรื่องยากที่จะวิเคราะห์ด้วยวิธีมาตรฐานเนื่องจากขนาดเล็กและองค์ประกอบของกรดอะมิโน นักวิจัยรายงานว่าในการค้นหาประมาณสามเท่าของกลุ่มโปรตีนผู้สมัครจำนวนมากเช่นการค้นหาฐานข้อมูลคลาสสิกไปจากเปปไทด์ที่ระบุประมาณ 10,000 คนไปจนถึงมากกว่า 35,000 และใน+ พบอีกประมาณหกเท่า ใช้ร่วมกันประสิทธิภาพที่รวมกันของโมเดลให้การเพิ่มที่ยิ่งใหญ่ขึ้น
จากการตรวจสอบอย่างละเอียดที่นำเสนอในการศึกษา Amanda Smythers ซึ่งเชี่ยวชาญด้านการวิเคราะห์โปรตีนกล่าวว่าเธออยากลองใช้เครื่องมือ นักเคมีที่ Dana-Farber Cancer Institute ในบอสตัน Smythers จินตนาการถึงการใช้แบบจำลอง AI เพื่อตอบคำถามเช่นทำไมมะเร็งตับอ่อนมักจะกระตุ้นการสูญเสียกล้ามเนื้ออย่างรวดเร็วและความเหนื่อยล้า โปรตีนที่ทำโดยเซลล์มะเร็งหรือการหยุดชะงักของการทำงานของโปรตีนปกติในเซลล์ที่ไม่ใช่มะเร็งอาจเป็นความผิดพลาด “ มันเป็นชีววิทยาที่สำคัญมากที่เรายังไม่เข้าใจ” Smythers กล่าว
การนำลำดับโปรตีนที่คลุมเครือมาสู่พื้นผิว (ไม่ว่าจะมาจากเซลล์มะเร็งหรือไตปลากระเบน) สามารถเปิดใช้งานได้หรือควบคุมคนที่มีประโยชน์ในการรักษาโรค
ถึงกระนั้นรุ่นใหม่ก็มีข้อ จำกัด
ความเป็นไปได้ของผลบวกที่ผิดพลาดซึ่งผู้เขียนการศึกษาประเมินประมาณ 5 เปอร์เซ็นต์หมายถึงผลลัพธ์ของ AI จำเป็นต้องมีการตรวจสอบเพิ่มเติม Konstantinos Kalogeropoulos ผู้เขียนร่วมกล่าวว่านักวิศวกรรมชีวภาพการคำนวณที่มหาวิทยาลัยเทคนิคของเดนมาร์กใน Lyngby กล่าว และวิธีการประเมินเครื่องมือ AI เหล่านี้ที่ดีที่สุดยังคงเป็นคำถามที่เปิดกว้าง William Noble นักพัฒนา Casanovo และนักวิทยาศาสตร์คอมพิวเตอร์และนักวิจัยโปรตีโอมิกส์ที่มหาวิทยาลัยวอชิงตันในซีแอตเทิล
ในที่สุดการจัดลำดับ AI ไม่ได้เป็นการแทนที่การค้นหาฐานข้อมูล Smythers กล่าว มันเป็นอาหารเสริม “ ไม่มีเครื่องมือเดียวที่ดีสำหรับทุกงาน” เธอกล่าว “ อย่างไรก็ตามมันเป็นเครื่องมือเช่นนี้ที่ช่วยให้เราก้าวหน้าต่อไปในสนามต่อไป”