พายุในโลกใบเล็กของ generative AI DeepSeek แชทบอทสัญชาติจีนที่ไม่รู้จักได้พุ่งขึ้นสู่อันดับต้น ๆ ของการจัดอันดับ App Store ด้วยเทคโนโลยีโอเพ่นซอร์สซึ่งมีค่าใช้จ่ายในการพัฒนา 6 ล้านดอลลาร์… สำหรับผลลัพธ์ที่ใกล้เคียงกับ ChatGPT
เกิดความตื่นตระหนกในโลกของ AI ของอเมริกา “ช่วงเวลาของสปุตนิก", เคยเป็นกังวลMarc Andreessen นักลงทุนและที่ปรึกษาใกล้ชิดของ Donald Trump กล่าวถึงดาวเทียมดวงแรกที่สหภาพโซเวียตเปิดตัวในปี 1957 ซึ่งทำให้สหรัฐฯ ประหลาดใจ แชทบอทจีนดีพซีคอยู่ในอันดับต้นๆ ของแอปพลิเคชั่นฟรียอดนิยมทั่วโลกมาหลายวันแล้ว
เดวิดกับโกลิอัท
โมเดลภาษาที่ทันสมัยที่สุด (LLM) ที่บอทนำเสนออย่าง DeepSeek-R1 นั้นทำได้ดีกว่ารุ่น o1 ที่ทันสมัยที่สุดของ OpenAIเกี่ยวกับปัญหาทางคณิตศาสตร์และการให้เหตุผล ตามเกณฑ์มาตรฐานที่ดำเนินการโดย DeepSeek ตามค่าเริ่มต้น แชทบอทจะทำงานบน DeepSeek-V3 ซึ่งมีรายงานว่ามีค่าใช้จ่ายในการพัฒนาไม่ถึง 6 ล้านเหรียญสหรัฐ การลดลงของจำนวนหลายร้อยพันล้านที่จำเป็นในการออกแบบ LLM ที่มีประสิทธิภาพสูง ยักษ์ใหญ่ของอเมริกาในสาขานี้ได้รับการเตือนอยู่ตลอดเวลา - ผ่านโครงการ Stargate เป็นต้น
ลีร์Stargate: รูปทรงที่คลุมเครือมากสำหรับโครงการมูลค่า 500 พันล้านดอลลาร์ของ OpenAI
DeepSeek มี David ตัวน้อยที่เอาชนะฝ่าย Goliath ซึ่งอาจสั่นคลอนความแน่นอนของอุตสาหกรรมของสหรัฐอเมริกา (และยุโรป): ด้วยโมเดลโอเพ่นซอร์สที่คำนวณด้วยชิปที่มีประสิทธิภาพน้อยกว่าของแชมป์เปี้ยนจากตะวันตก บอทของจีนจึงทำได้ดีกว่า... และแม้แต่ที่รักก็น้อยลงด้วยซ้ำ . จากข้อมูลของ Epoch AI โมเดลของ DeepSeek จะมีประสิทธิภาพมากจนการฝึกอบรมนั้นต้องใช้พลังการประมวลผลเพียงหนึ่งในสิบของโมเดล Llama 3.1 ของ Meta
บอทของจีนยังแสดงถึงข้อจำกัดสำหรับคำขอที่ “ละเอียดอ่อน” บางอย่างด้วย ตัวอย่างเช่น เป็นไปไม่ได้ที่จะถามคำถาม DeepSeek ที่เกี่ยวข้องกับการจลาจลในจัตุรัส Tien Anmen หรือเกี่ยวกับ Xi Jinping
ตั้งแต่ปี 2021 การจัดหาซิลิคอนอเมริกันที่ทันสมัยที่สุดในประเทศจีนนั้นมีความซับซ้อนมาก เนื่องจากข้อจำกัดของทำเนียบขาว เพื่อให้สามารถทำงานได้ต่อไป นักพัฒนา AI ชาวจีนจึงแชร์ผลงานระหว่างกันและลองแนวทางใหม่ๆ -DeepSeek มุ่งเน้นไปที่การเพิ่มประสิทธิภาพทรัพยากรผ่านโซลูชันซอฟต์แวร์» อธิบายให้ฟังแบบมีสายมารินา จาง รองศาสตราจารย์จากมหาวิทยาลัยเทคโนโลยีซิดนีย์
ผู้เชี่ยวชาญด้านเทคโนโลยีของจีนกล่าวต่อไปว่า “DeepSeek ได้นำวิธีการแบบโอเพ่นซอร์สมาใช้ โดยรวบรวมความเชี่ยวชาญร่วมกัน และส่งเสริมนวัตกรรมการทำงานร่วมกัน แนวทางนี้ไม่เพียงแต่เอาชนะข้อจำกัดด้านทรัพยากรเท่านั้น แต่ยังเร่งการพัฒนาเทคโนโลยีล้ำสมัย ซึ่งทำให้ DeepSeek แตกต่างจากคู่แข่งที่ปิดตัวกว่า-
DeepSeek ก่อตั้งขึ้นในปี 2023 โดย Liang Wenfeng ในหางโจว วิศวกรอิเล็กทรอนิกส์รายนี้ประกอบแบตเตอรี่ชิป Nvidia H100 จำนวน 10,000 ชิป ซึ่งขณะนี้ถูกห้ามไม่ให้นำเข้าไปยังประเทศจีน โครงสร้างพื้นฐานนี้จะมีการเพิ่มชิปที่มีประสิทธิภาพน้อยกว่าที่ยังคงมีสำหรับการนำเข้า และการปรับให้เหมาะสมเพื่อจำกัดต้นทุนและลดพลังการประมวลผลที่จำเป็นสำหรับการฝึกอบรม LLM
ความสำเร็จของ DeepSeek สร้างความตกตะลึงให้กับอุตสาหกรรม AI ตะวันตกอย่างแท้จริง ตัวอย่างของจีนอาจจะผลักดันให้ทำงานร่วมกันมากขึ้นและแสวงหาประสิทธิภาพที่มากขึ้นด้วยโครงสร้างพื้นฐานที่มีอยู่
🔴 เพื่อไม่พลาดข่าวสาร 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-
แหล่งที่มา : แบบมีสาย