หนึ่งแบบจำลอง (AI) จำลองการวิวัฒนาการระดับโมเลกุลครึ่งปีเพื่อสร้างรหัสสำหรับโปรตีนที่ไม่รู้จักก่อนหน้านี้ตามการศึกษาใหม่ โปรตีนที่เรืองแสงซึ่งคล้ายกับที่พบในแมงกะพรุนและปะการังอาจช่วยในการพัฒนายาใหม่นักวิจัยกล่าว
โปรตีนเป็นหนึ่งในหน่วยการสร้างชีวิตและทำหน้าที่ต่าง ๆ ในร่างกายเช่นและการต่อสู้กับโรค โปรตีนจำลองที่มีชื่อว่า ESMGFP มีอยู่เป็นรหัสคอมพิวเตอร์เท่านั้น แต่มีพิมพ์เขียวสำหรับโปรตีนเรืองแสงสีเขียวชนิดที่ไม่รู้จักก่อนหน้านี้ ในธรรมชาติโปรตีนเรืองแสงสีเขียวให้แมงกะพรุนเรืองแสงและปะการังเรืองแสง
ลำดับของตัวอักษรที่สะกดคำแนะนำที่จะทำให้ ESMGFP มีเพียง 58% คล้ายกับโปรตีนฟลูออเรสเซนต์ที่รู้จักกันมากที่สุดซึ่งเป็นโปรตีนที่ได้รับการดัดแปลงจากมนุษย์ในโปรตีนที่พบในสมเด็จทะเลqundrical enjo) - สัตว์ทะเลสีสันสดใสที่ดูเหมือนว่าพวกเขามีฟองอากาศที่ปลายหนวดของพวกเขา ส่วนที่เหลือของลำดับนั้นไม่เหมือนใครและจะต้องมีการกลายพันธุ์ทางพันธุกรรมที่แตกต่างกันทั้งหมด 96 ครั้ง การเปลี่ยนแปลงเหล่านี้จะใช้เวลามากกว่า 500 ล้านปีในการพัฒนาตามธรรมชาติตามการศึกษา
นักวิจัยใน บริษัท ที่เรียกว่าEvolutionaryScale และโมเดล AI ที่ใช้ในการสร้าง ESM3 ในการศึกษา preprint เมื่อปีที่แล้ว นักวิทยาศาสตร์อิสระได้ตรวจสอบการค้นพบเหล่านั้นซึ่งตีพิมพ์เมื่อวันที่ 16 มกราคมในวารสารศาสตร์-
ESM3 ไม่ได้ออกแบบโปรตีนภายในข้อ จำกัด ของวิวัฒนาการตามปกติ แต่เป็นตัวแก้ปัญหาที่เติมเต็มช่องว่างของรหัสโปรตีนที่ไม่สมบูรณ์ที่นักวิจัยจัดทำขึ้นและในการออกแบบสิ่งที่อาจมีอยู่บนพื้นฐานของวิวัฒนาการเส้นทางที่อาจเกิดขึ้นทั้งหมด
"เราพบว่า ESM3 เรียนรู้ชีววิทยาพื้นฐานและสามารถสร้างโปรตีนที่ใช้งานได้นอกพื้นที่ที่สำรวจโดยวิวัฒนาการ" ผู้เขียนร่วมการศึกษาAlex Rivesผู้ร่วมก่อตั้งและหัวหน้านักวิทยาศาสตร์ของ EvolutionaryScale บอกกับ Live Science ในอีเมล
ที่เกี่ยวข้อง:
การศึกษาใหม่สร้างจากการวิจัยที่ Rives และเพื่อนร่วมงานของเขาบริษัท แม่ของ Facebook และ Instagram ก่อนที่จะเริ่ม EvolutionaryScale ในปี 2024 ESM3 เป็นรุ่นล่าสุดของรูปแบบภาษารุ่นใหม่ที่คล้ายกับ GPT-4 ของ OpenAI ซึ่งทำงาน CHATGPT แต่ขึ้นอยู่กับชีววิทยา
โปรตีนประกอบด้วยโซ่ของโมเลกุลที่เรียกว่ากรดอะมิโนซึ่งเป็นลำดับที่จัดทำโดยยีน โปรตีนที่แตกต่างกันมีลำดับกรดอะมิโนที่แตกต่างกัน พวกเขายังแตกต่างกันโครงสร้างแต่ละพับเป็นรูปร่างที่ไม่ซ้ำกันที่ช่วยให้พวกเขาปฏิบัติงานได้ตาม- เพื่อให้ ESM3 เข้าใจโปรตีนนักวิจัยป้อนข้อมูลแบบจำลองเกี่ยวกับคุณสมบัติหลักของลำดับโปรตีน - กรดอะมิโนโครงสร้างและฟังก์ชั่น - เป็นชุดของตัวอักษร
ทีมฝึกอบรม ESM3 เกี่ยวกับข้อมูลจากโปรตีน 2.78 พันล้านโปรตีนที่พบในธรรมชาติ จากนั้นนักวิจัยจะซ่อนบางส่วนของพิมพ์เขียวโปรตีนและมีปลั๊ก ESM3 ในช่องว่างเพื่อกรอกรหัสตามสิ่งที่ได้เรียนรู้
"วิธีเดียวกับที่คน ๆ หนึ่งสามารถเติมลงในช่องว่างใน soliloquy" ถึง _ หรือไม่ถึง _ นั่นคือ _ "เราสามารถฝึกแบบจำลองภาษาเพื่อเติมเต็มช่องว่างในโปรตีน" Rives กล่าว "งานวิจัยของเราแสดงให้เห็นว่าการแก้ปัญหาง่ายๆนี้ข้อมูลเกี่ยวกับโครงสร้างที่ลึกของชีววิทยาโปรตีนเกิดขึ้นในเครือข่าย"
นักวิทยาศาสตร์ปรับเปลี่ยนโปรตีนธรรมชาติและวิศวกรใหม่เพื่อวัตถุประสงค์ที่หลากหลาย ตัวอย่างเช่นโปรตีนเรืองแสงสีเขียวถูกนำมาใช้อย่างกว้างขวางในห้องปฏิบัติการวิจัย รหัสพันธุกรรมของพวกเขามักจะถูกเพิ่มเข้าไปในปลายของลำดับดีเอ็นเออื่น ๆ เพื่อเปลี่ยนโปรตีนที่พวกเขาเข้ารหัสสีเขียว สิ่งนี้ช่วยให้นักวิทยาศาสตร์สามารถติดตามโปรตีนและกระบวนการโทรศัพท์มือถือได้อย่างง่ายดาย Rives ตั้งข้อสังเกตว่าความสามารถของ ESM3 สามารถเร่งการใช้งานที่หลากหลายสำหรับวิศวกรรมโปรตีนรวมถึงการช่วยออกแบบยาใหม่
นักชีววิทยาวิวัฒนาการที่มหาวิทยาลัยบา ธ ในสหราชอาณาจักรซึ่งไม่ได้มีส่วนร่วมในการวิจัยรายงานเกี่ยวกับการศึกษาเพื่อการศึกษาเพื่อวิทยาศาสตร์การใช้ชีวิตในปี 2567 ในการวิเคราะห์ของเธอเทย์เลอร์เขียนว่าโมเดล AI เช่น ESM3 จะเปิดใช้นวัตกรรมในโปรตีน วิศวกรรมที่วิวัฒนาการไม่สามารถทำได้ อย่างไรก็ตามเธอยังตั้งข้อสังเกตอีกว่าการเรียกร้องของนักวิจัยในการจำลองวิวัฒนาการ 500 ล้านปีนั้นเพ่งความสนใจไปที่โปรตีนแต่ละตัวเท่านั้นและไม่ได้คำนึงถึงขั้นตอนต่าง ๆ ของการคัดเลือกโดยธรรมชาติที่สร้างชีวิตในที่สุด
“ วิศวกรรมโปรตีนที่ขับเคลื่อนด้วย AI นั้นน่าสนใจ แต่ฉันไม่สามารถช่วยรู้สึกได้ว่าเราอาจมีความมั่นใจมากเกินไปในการสมมติว่าเราสามารถเอาชนะกระบวนการที่ซับซ้อนได้ด้วยการคัดเลือกโดยธรรมชาติหลายล้านปี” เทย์เลอร์กล่าว