กลายเป็นประเด็นร้อนในวงการเทคโนโลยีโลก เมื่อ DeepSeek สตาร์ทอัพ AI จากจีน สร้างความฮือฮาด้วยการเปิดตัวโมเดล DeepSeek-R1 ที่มีประสิทธิภาพเหนือกว่าโมเดลชั้นนำอย่าง OpenAI o1 ในด้านการแก้ปัญหาคณิตศาสตร์และการให้เหตุผล ทั้งยังเป็นโอเพนซอร์สที่เปิดโอกาสให้วงการวิจัยทั่วโลกเข้าถึงและพัฒนาต่อได้
การเปิดตัวครั้งนี้เกิดขึ้นท่ามกลางความตึงเครียดระหว่างจีนและสหรัฐฯ ที่เพิ่มสูงขึ้น โดยเฉพาะในแง่ของการแข่งขันทางเทคโนโลยีและ AI ซึ่งก่อนหน้านี้รัฐบาลโจ ไบเดนได้เดินหน้าควบคุมการส่งออกชิปขั้นสูงและเทคโนโลยี AI ไปยังประเทศที่ถือเป็นคู่แข่งอย่างจีนและรัสเซีย ด้วยเหตุผลด้านความมั่นคงและเพื่อรักษาอิทธิพลของสหรัฐฯ ในการกำหนดทิศทางการพัฒนา AI ของโลก
เรียกได้ว่าเป็นการ "กระตุกหนวดเสือ" ครั้งใหญ่และกลายเป็นกระแสใน Silicon Valley ทันที เพราะความก้าวหน้าของ AI จีนครั้งนี้ทำให้ทั้งวงการต้องหันมาถามว่า “จีนมาไกลขนาดนี้แล้วเหรอ?” ในบทความนี้เราจึงอยากพาคุณไปรู้จักโมเดลที่ทำให้โลกตะลึง และย้อนดูเหตุผลว่าทำไมการเปิดตัวครั้งนี้ถึงสร้างแรงกระเพื่อมได้ขนาดนี้
โมเดล DeepSeek-R1 จาก DeepSeek คืออะไร ?
DeepSeek-R1 คือโมเดล AI สุดล้ำจากบริษัท DeepSeek ที่เปิดตัวอย่างเป็นทางการเมื่อวันที่ 20 มกราคม 2025 หลังจากมีข่าวลือเกี่ยวกับการพัฒนาโมเดลนี้ตั้งแต่เดือนพฤศจิกายน 2024 โดย DeepSeek ยืนยันว่าโมเดลนี้จะเป็น โอเพ่นซอร์ส และเปิด API ให้ผู้ใช้งานทั่วไปสามารถเข้าถึงและใช้งานเทคโนโลยี AI ขั้นสูงได้อย่างง่ายดาย
DeepSeek-R1 โดดเด่นด้วยประสิทธิภาพที่เหนือกว่าโมเดลชั้นนำอย่าง OpenAI o1 ในการแก้ปัญหาคณิตศาสตร์และการให้เหตุผล พร้อมเปิดโอกาสให้ชุมชนวิจัยทั่วโลกนำไปต่อยอดเพื่อพัฒนาเทคโนโลยี AI ใหม่ๆ ได้ โมเดล DeepSeek-R1-Lite-Preview ยังแสดงให้เห็นศักยภาพที่สามารถเทียบเคียงกับ OpenAI o1-preview ในการทดสอบมาตรฐานอย่าง AIME และ MATH ซึ่งใช้วัดความสามารถของ AI
อย่างไรก็ตาม DeepSeek-R1 ยังมีจุดที่ต้องปรับปรุง เช่น การแก้ปัญหาเกมง่ายๆ อย่าง tic-tac-toe ซึ่งเป็นจุดอ่อนที่คล้ายกับ OpenAI o1 แต่ในภาพรวมถือว่าเป็นก้าวสำคัญของ AI ฝั่งจีน
ทำไม DeepSeek-R1 ถึงสะเทือนทั้ง Silicon Valley ?
ความสำเร็จของ DeepSeek-R1 ไม่ได้เป็นเพียงการเปิดตัวโมเดล AI ใหม่ แต่ยังเป็นบทพิสูจน์ถึงความสามารถในการพัฒนาภายใต้ข้อจำกัดที่ใหญ่หลวง มาตรการควบคุมการส่งออกของสหรัฐฯ ตั้งแต่ปี 2022 ที่ห้ามขายชิปประมวลผลขั้นสูงให้บริษัทจีน กดดันให้ DeepSeek ต้องคิดค้นวิธีการใหม่ในการฝึกโมเดล AI โดยมุ่งเน้นการใช้ทรัพยากรที่มีอยู่ให้เกิดประโยชน์สูงสุด เช่น Multi-head Latent Attention (MLA) และ Mixture-of-Experts มาประยุกต์ใช้ ทำให้สามารถลดการใช้พลังประมวลผลได้อย่างมาก
นี่คือ 3 เหตุผลที่ DeepSeek-R1 สร้างแรงสั่นสะเทือนใน Silicon Valley:
1. ประสิทธิภาพเหนือคู่แข่งในต้นทุนที่ต่ำกว่า
- DeepSeek-R1 สามารถเทียบชั้นหรือเหนือกว่าโมเดล OpenAI o1 ในบางเกณฑ์ เช่น การแก้ปัญหาคณิตศาสตร์และการให้เหตุผล
- ใช้ต้นทุนการฝึกเพียง 5.6 ล้านดอลลารสหรัฐฯ ซึ่งต่ำกว่าหลายร้อยล้านดอลลาร์ที่บริษัทในสหรัฐฯ ใช้
- โมเดลใช้ทรัพยากรเพียง 1 ใน 10 ของโมเดล Llama 3.1 ของ Meta ในการฝึก นี่ถือเป็นจุดพลิกเกมสำคัญที่สร้างความทึ่งให้กับทั้งวงการ
2. การสนับสนุนโอเพ่นซอร์ส
- DeepSeek-R1 เปิดโอเพ่นซอร์สและ API ให้ใช้งาน ทำให้วงการวิจัยทั่วโลกสามารถเข้าถึงและพัฒนาต่อได้
- Yann LeCun หัวหน้าฝ่ายวิจัย AI ของ Meta ชี้ให้เห็นว่า ความสำเร็จของ DeepSeek เป็นผลมาจากการใช้ประโยชน์จากงานวิจัยโอเพ่นซอร์ส
3. ประสบความสำเร็จได้ ท่ามกลางข้อจำกัด
- สหรัฐฯ ใช้มาตรการควบคุมการส่งออกชิปขั้นสูง ทำให้บริษัทจีนไม่สามารถเข้าถึงทรัพยากรที่จำเป็นได้
- DeepSeek เลือกพัฒนาเทคโนโลยีที่เน้น ประสิทธิภาพสูงสุด โดยใช้ทรัพยากรที่มี เช่น ชิป Nvidia A100 จำนวน 10,000 ตัว โดยไม่ต้องพึ่งพาทรัพยากรระดับมหาศาลแบบบริษัทในตะวันตก
นี่จึงเป็นเหตุผลว่าทำไม DeepSeek-R1 ถึงกลายเป็นประเด็นที่ทำให้ Silicon Valley ต้องหันมาจับตามอง นอกจากนี้นักลงทุนและผู้มีชื่อเสียงในวงการเทคโนโลยีก็ต่างออกมาแสดงความคิดเห็นมากมาย
นักวิเคราะห์และผู้เชี่ยวชาญคิดอย่างไร ?
- Marc Andreessen นักลงทุนชื่อดัง ยกย่อง DeepSeek ผ่านโพสต์บน X ว่าเป็น "หนึ่งในความก้าวหน้าที่น่าทึ่งที่สุดเท่าที่เคยเห็น" โดยชี้ว่าโมเดล R1 สามารถเทียบชั้นหรือเหนือกว่าโมเดล o1 ของ OpenAI ในบางเกณฑ์สำคัญ ทั้งยังใช้ต้นทุนในการฝึกเพียง 5.6 ล้านดอลลาร์สหรัฐฯ ซึ่งต่ำกว่าหลายร้อยล้านดอลลาร์ที่บริษัท AI ชั้นนำในสหรัฐฯ ต้องจ่าย
- MIT Technology Review มองว่าความสำเร็จของ DeepSeek แสดงให้เห็นว่าการคว่ำบาตรจากสหรัฐฯ กลับกลายเป็นแรงผลักดันให้สตาร์ทอัพจีนต้องคิดค้นวิธีที่เน้น ประสิทธิภาพ การรวมทรัพยากร และความร่วมมือ เพื่อเอาชนะข้อจำกัด อย่างไรก็ตาม Liang Wenfeng ผู้ก่อตั้ง DeepSeek ยอมรับว่าการควบคุมการส่งออกของสหรัฐฯ ยังคงเป็นอุปสรรคสำคัญต่อการพัฒนาในระยะยาว
- Neal Khosla ซีอีโอของ Curai แสดงความเห็นว่า DeepSeek อาจเป็น "ปฏิบัติการจิตวิทยาของรัฐบาลจีน" โดยกล่าวหาว่าบริษัทตั้งราคาต้นทุนต่ำเพื่อทำลายความสามารถในการแข่งขันของ AI ในสหรัฐฯ อย่างไรก็ดี ข้อกล่าวหานี้ถูกวิจารณ์อย่างหนัก เพราะ Khosla ไม่มีหลักฐานสนับสนุน อีกทั้งพ่อของเขาเป็นนักลงทุนใน OpenAI ซึ่งอาจก่อให้เกิดความขัดแย้งทางผลประโยชน์
- Holger Zschaepitz ผู้สื่อข่าวด้านเศรษฐกิจ ชี้ว่า DeepSeek อาจกลายเป็นภัยคุกคามต่อบริษัทในตลาดหุ้นสหรัฐฯ หากบริษัทจีนสามารถพัฒนาโมเดลระดับโลกในต้นทุนต่ำได้โดยไม่พึ่งพาชิปขั้นสูง ความสำเร็จนี้อาจทำให้เกิดคำถามถึงความคุ้มค่าของการลงทุนมหาศาลในอุตสาหกรรม AI ของฝั่งตะวันตก
- Garry Tan ซีอีโอของ Y Combinator มองในแง่ดี โดยเชื่อว่าความสำเร็จของ DeepSeek จะส่งผลดีต่อคู่แข่งในสหรัฐฯ เพราะต้นทุนการฝึกโมเดลที่ลดลงจะกระตุ้นความต้องการใช้งาน AI ในชีวิตจริงมากขึ้น ซึ่งเป็นการขยายตลาดโดยรวม
- Yann LeCun หัวหน้าฝ่ายวิจัย AI ของ Meta เสนออีกมุมมองว่า ความสำเร็จของ DeepSeek ไม่ควรถูกมองผ่านเลนส์ของการแข่งขันระหว่างจีนกับสหรัฐฯ แต่ควรมองว่าเป็นบทพิสูจน์ถึง พลังของโอเพนซอร์ส LeCun ชี้ว่า DeepSeek ได้รับประโยชน์จากงานวิจัยโอเพนซอร์ส เช่น PyTorch และ Llama ของ Meta ซึ่งช่วยให้บริษัทสามารถต่อยอดได้อย่างมีประสิทธิภาพ พร้อมเน้นว่าการแบ่งปันความสำเร็จนี้กลับคืนสู่ชุมชนวิจัยทั่วโลกถือเป็นหัวใจสำคัญของความก้าวหน้าใน AI
ท่ามกลางกระแสวิพากษ์วิจารณ์นี้ โมเดลของ DeepSeek กำลังดึงดูดความสนใจจากผู้ใช้ โดยในช่วงสุดสัปดาห์ที่ผ่านมา แอป AI ของ DeepSeek ขึ้นแท่นเป็นแอปฟรีอันดับ 1 ใน Apple App Store แซงหน้า ChatGPT ไปแล้ว
อ่านบทความที่เกี่ยวข้อง
อ้างอิง: techcrunch , bloomberg , wired