ขณะนี้นักวิจัยสามารถรับ AI ช่วยสังเคราะห์โปรตีนได้ (KO_FEJA/E+/GETTY Images)
การสังเคราะห์โปรตีนใหม่ -ของชีวิตชีวภาพ - เป็นสาขาวิทยาศาสตร์ที่มีศักยภาพมหาศาลและแบบจำลอง AI ที่พัฒนาขึ้นใหม่สัญญาว่าจะสร้างคำแนะนำสำหรับวิธีการโปรตีนใหม่ที่เกินกว่าที่พบในธรรมชาติ
นักวิทยาศาสตร์ในสหรัฐอเมริกาได้ใช้ EvolutionaryScale Model 3 (ESM3) เพื่อสังเคราะห์โปรตีนใหม่ที่เรียกว่า ESMGFP (โปรตีนเรืองแสงสีเขียว) ซึ่งมีเพียง 58 เปอร์เซ็นต์ของวัสดุที่มีญาติธรรมชาติใกล้เคียงที่สุดtagrfp-
นั่นเทียบเท่ากับวิวัฒนาการ 500 ล้านปีที่ถูกประมวลผลโดย AI ทีมวิจัยประมาณการและเปิดวิธีการสร้างโปรตีนที่ทำเองซึ่งสามารถออกแบบสำหรับการใช้งานเฉพาะหรือปลดล็อคฟังก์ชั่นเพิ่มเติมจากโปรตีนที่มีอยู่
"วิวัฒนาการมากกว่าสามพันล้านปีได้สร้างภาพของชีววิทยาที่เข้ารหัสเข้าไปในพื้นที่ของโปรตีนธรรมชาติ"เขียนนักวิจัยนำโดย Thomas Hayes ผู้ก่อตั้ง EvolutionaryScale ในนิวยอร์กในบทความที่ตีพิมพ์
"ที่นี่เราแสดงให้เห็นว่าแบบจำลองภาษาที่ได้รับการฝึกฝนในระดับข้อมูลวิวัฒนาการสามารถสร้างโปรตีนที่ใช้งานได้ซึ่งห่างไกลจากโปรตีนที่รู้จัก"
ฉันตื่นเต้นมากที่จะแบ่งปันสิ่งที่เราทำอยู่@evoscaleai- ESM3 เป็นแบบจำลองภาษาที่สวมหน้ากากหลายรูปแบบสำหรับชีววิทยาการเขียนโปรแกรม นี่คือหัวข้อสั้น ๆ เกี่ยวกับสถาปัตยกรรมที่อยู่เบื้องหลัง ESM3https://t.co/jldhyrapny
- Thomas Hayes (@thayes427)25 มิถุนายน 2567
ESM3 ได้รับการฝึกอบรมเกี่ยวกับลำดับโปรตีน 3.15 พันล้านที่น่าประทับใจ (คำสั่งของกรดอะมิโนในโปรตีน) โครงสร้างโปรตีน 236 ล้าน (รูปร่าง 3 มิติของพวกเขา) และคำอธิบายประกอบโปรตีน 539 ล้านรายการ (ฉลากเชิงพรรณนา)
ด้วยการจำรูปแบบในข้อมูลที่กว้างใหญ่เหล่านั้นโมเดล AI สามารถเข้าใจสิ่งที่ได้ผลและสิ่งที่ไม่ได้อยู่ในการสร้างโปรตีนและฟังก์ชั่น - ในทำนองเดียวกับที่ CHATGPT สามารถเขียนบทกวีใหม่ที่คล้องจองหลังจากอ่านบทกวีนับล้านที่เขียนโดยมนุษย์
สิ่งที่ทำให้ ESMGFP พิเศษพิเศษคือมันใช้งานได้: มันเป็นฟลูออเรสเซนต์เหมือนกับ TAGRFP ที่สัมพันธ์กัน โปรตีนเรืองแสงให้สิ่งมีชีวิตในมหาสมุทร, และมีใน-
"เราเลือกฟังก์ชั่นการเรืองแสงเพราะมันยากที่จะบรรลุง่ายในการวัดและหนึ่งในกลไกที่สวยที่สุดในธรรมชาติ"เขียน-
AI นำการทดลองและข้อผิดพลาดจำนวนมากออกไปในขณะที่เพิ่มความสามารถในการสำรวจห่างไกลจากโปรตีนที่เรารู้อยู่ในปัจจุบัน
"โปรตีนสามารถมองเห็นได้ว่ามีอยู่ภายในพื้นที่จัดระเบียบซึ่งโปรตีนแต่ละตัวจะอยู่ใกล้เคียงกันซึ่งเป็นเหตุการณ์การกลายพันธุ์หนึ่งครั้ง"เขียนนักวิจัย "โครงสร้างของวิวัฒนาการปรากฏเป็นเครือข่ายภายในพื้นที่นี้เชื่อมต่อโปรตีนทั้งหมดด้วยเส้นทางที่วิวัฒนาการสามารถใช้ระหว่างพวกเขาได้"
เพื่อให้วิวัฒนาการเกิดขึ้นทีมบอกว่าโปรตีนแต่ละตัวจะต้องเปลี่ยนเป็นรุ่นต่อไปโดยไม่มีระบบที่มันเป็นส่วนหนึ่งที่สูญเสียการทำงานโดยรวม แบบจำลองภาษาจดจำโปรตีนในพื้นที่นี้
โปรตีนที่ออกแบบโดย ESM3 ยังคงต้องได้รับการตรวจสอบสังเคราะห์และทดสอบซึ่งต้องใช้เวลา แต่ทีมมีความมั่นใจในการดำเนินการต่อไปที่นี่ ในอนาคตที่ไม่ไกลเกินไปเราสามารถผลิตโปรตีนสำหรับทุกสิ่งตั้งแต่ยาไปจนถึงวัสดุชีวภาพด้วยการกระตุ้นด้วย AI ที่ชาญฉลาด
"แบบจำลองภาษาโปรตีนไม่ได้ทำงานอย่างชัดเจนภายใต้ข้อ จำกัด ทางกายภาพของวิวัฒนาการ แต่สามารถสร้างแบบจำลองของวิวัฒนาการเส้นทางที่มีศักยภาพมากมายโดยปริยาย"อธิบาย-
การวิจัยได้รับการตีพิมพ์ในศาสตร์-