![](https://assets.iflscience.com/assets/articleNo/77838/aImg/81799/close-up-photograph-of-green-glowing-bubble-tip-anemone-entacmaea-quadricolor-m.jpg)
การจับคู่ที่ใกล้เคียงที่สุดของลำดับมาจากโปรตีนที่ได้มาจากดอกไม้ทะเลบับเบิลปลาย (ในภาพ)
เป็นความคิดที่ว่าโปรตีนปรากฏตัวครั้งแรกบนโลกเมื่อประมาณ 3.7 พันล้านปีก่อนและตั้งแต่นั้นมาธรรมชาติได้ปลอมแปลงพวกเขาเป็นโมเลกุลที่มีอยู่ในปัจจุบัน แต่ถ้ามีวิธีที่เราสามารถเลียนแบบกระบวนการนั้นได้ - เร็วกว่ามาก?
นั่นคือสิ่งที่กลุ่มนักวิจัยจาก บริษัท EvolutionaryScale อ้างว่าได้ทำด้วยพลังของปัญญาประดิษฐ์ (AI) สร้างรหัสสำหรับโปรตีนเรืองแสงใหม่ล่าสุดในการบูต
โปรตีนเกิดจากสายยาวของ- คำศัพท์ทางเทคนิคสำหรับเรื่องนี้คือลำดับและความแตกต่างในลำดับดังกล่าวกำหนดโครงสร้างและฟังก์ชั่นในที่สุดของโปรตีน
นักวิจัยเขียนในบทความของพวกเขาว่า“ [A] ฉันทามติกำลังพัฒนาว่าพื้นฐานของลำดับเหล่านี้เป็นภาษาพื้นฐานของชีววิทยาโปรตีนที่สามารถเข้าใจได้โดยใช้แบบจำลองภาษา” หากเป็นเช่นนั้นอาจเป็นไปได้ที่จะสร้างลำดับสำหรับโปรตีนใหม่เอี่ยมซึ่งอาจแตกต่างกันอย่างดุเดือดในโครงสร้างและฟังก์ชั่นจากที่มีอยู่แล้ว
ความพยายามของพวกเขาในการทำความเข้าใจภาษานี้คือ ESM3 ซึ่งเป็นรูปแบบภาษาที่เกิดขึ้นหลายรูปแบบ ในแง่ที่ชัดเจนมันเป็นประเภทของ AI กำเนิด - เช่น- แต่แทนที่จะกระตุ้นให้มันเขียนการบ้านของคุณเช่นกับ CHATGPT รุ่นนี้คายรหัสสำหรับโปรตีน
ได้รับการฝึกอบรมเกี่ยวกับโทเค็นที่ไม่ซ้ำกัน 771 พันล้าน - คำ AI สำหรับหน่วยข้อมูล - นำมาจากฐานข้อมูลของลำดับโปรตีนและโครงสร้างธรรมชาติรวมถึงลำดับสังเคราะห์ที่สร้างขึ้น โดยรวมแล้วข้อมูลนี้มีลำดับโปรตีน 3.15 พันล้านตัวโครงสร้างโปรตีน 236 ล้านตัวและโปรตีน 539 ล้านโปรตีนที่มีคำอธิบายประกอบฟังก์ชั่น
ขั้นตอนต่อไปคือการดูว่ามันสามารถสร้างลำดับโปรตีนใหม่ได้หรือไม่ ในกรณีนี้ทีมขอให้โมเดลสร้างโปรตีนเรืองแสงใหม่กระตุ้นให้มีสูตรที่ไม่สมบูรณ์และงานเติมเต็มช่องว่าง
และมันก็สร้างลำดับและโครงสร้างสำหรับตัวแปรที่ไม่รู้จักก่อนหน้านี้ของโปรตีนฟลูออเรสเซนต์สีเขียว (GFP) - ซึ่งมักใช้ในการวิจัยเซลล์และชีววิทยาโมเลกุล - ขนานนาม ESMGFP
ตามEvolutionaryScaleโปรตีนใหม่นี้“ เป็นวิวัฒนาการที่กว้างใหญ่จากโปรตีนฟลูออเรสเซนต์ธรรมชาติ” การแบ่งปันความคล้ายคลึงกันเพียง 53 เปอร์เซ็นต์ตามลำดับเมื่อเทียบกับโปรตีนที่มีอยู่ใกล้เคียงที่สุด EQFP578 พบได้ในสมเด็จดอกไม้ ทีมวิจัยอ้างว่าในบทความของพวกเขาว่าความแตกต่างนี้“ เทียบเท่ากับระดับที่เทียบเท่ากับการจำลองวิวัฒนาการมากกว่า 500 ล้านปี”
ไม่ใช่ทุกคนที่แน่ใจว่า - ศาสตราจารย์ด้านนิเวศวิทยาจุลินทรีย์และวิวัฒนาการที่มหาวิทยาลัยบา ธ ทิฟฟานี่เทย์เลอร์ซึ่งไม่ได้มีส่วนร่วมในการศึกษาเขียนในวิทยาศาสตร์สดในปี 2024 (เมื่อการศึกษายังคงเป็น preprint) ว่า "วิศวกรรมโปรตีนที่ขับเคลื่อนด้วย AI นั้นน่าสนใจ แต่ฉันไม่สามารถรู้สึกได้ว่าเราอาจมีความมั่นใจมากเกินไปในการสมมติว่าเราสามารถเอาชนะกระบวนการที่ซับซ้อนได้โดยการคัดเลือกโดยธรรมชาติหลายล้านปี "
อย่างไรก็ตามอย่างที่เทย์เลอร์กล่าวว่ามันเป็นแนวคิดที่น่าสนใจ - แต่มันจะมีประโยชน์อะไรบ้าง? เว็บไซต์ของ EvolutionaryScale กล่าวว่าแบบจำลองของมันคือ“ เครื่องมือสำหรับนักวิทยาศาสตร์ในการจินตนาการถึงโปรตีนในการจับคาร์บอน […] เอนไซม์ที่สลายพลาสติก [และ] ยาใหม่”
ถึงกระนั้นก็ยังไม่มีการรับประกันว่าสิ่งนี้จะแปลเป็นความจริงในที่สุด สำหรับตอนนี้โปรตีนที่ค้นพบใหม่ยังคง“ สร้าง” ในความรู้สึกของ AI เท่านั้น
การศึกษาถูกตีพิมพ์ในวารสารศาสตร์-