ทำไม DeepSeek-R1 ถึงสะเทือนทั้ง Silicon Valley รู้จัก AI จีนที่โหดกว่า OpenAI-o1 | Techsauce

ทำไม DeepSeek-R1 ถึงสะเทือนทั้ง Silicon Valley รู้จัก AI จีนที่โหดกว่า OpenAI-o1

กลายเป็นประเด็นร้อนในวงการเทคโนโลยีโลก เมื่อ DeepSeek สตาร์ทอัพ AI จากจีน สร้างความฮือฮาด้วยการเปิดตัวโมเดล DeepSeek-R1 ที่มีประสิทธิภาพเหนือกว่าโมเดลชั้นนำอย่าง OpenAI o1 ในด้านการแก้ปัญหาคณิตศาสตร์และการให้เหตุผล ทั้งยังเป็นโอเพนซอร์สที่เปิดโอกาสให้วงการวิจัยทั่วโลกเข้าถึงและพัฒนาต่อได้

การเปิดตัวครั้งนี้เกิดขึ้นท่ามกลางความตึงเครียดระหว่างจีนและสหรัฐฯ ที่เพิ่มสูงขึ้น โดยเฉพาะในแง่ของการแข่งขันทางเทคโนโลยีและ AI ซึ่งก่อนหน้านี้รัฐบาลโจ ไบเดนได้เดินหน้าควบคุมการส่งออกชิปขั้นสูงและเทคโนโลยี AI ไปยังประเทศที่ถือเป็นคู่แข่งอย่างจีนและรัสเซีย ด้วยเหตุผลด้านความมั่นคงและเพื่อรักษาอิทธิพลของสหรัฐฯ ในการกำหนดทิศทางการพัฒนา AI ของโลก

เรียกได้ว่าเป็นการ "กระตุกหนวดเสือ" ครั้งใหญ่และกลายเป็นกระแสใน Silicon Valley ทันที เพราะความก้าวหน้าของ AI จีนครั้งนี้ทำให้ทั้งวงการต้องหันมาถามว่า “จีนมาไกลขนาดนี้แล้วเหรอ?” ในบทความนี้เราจึงอยากพาคุณไปรู้จักโมเดลที่ทำให้โลกตะลึง และย้อนดูเหตุผลว่าทำไมการเปิดตัวครั้งนี้ถึงสร้างแรงกระเพื่อมได้ขนาดนี้

โมเดล DeepSeek-R1 จาก DeepSeek คืออะไร ?

DeepSeek-R1 คือโมเดล AI สุดล้ำจากบริษัท DeepSeek ที่เปิดตัวอย่างเป็นทางการเมื่อวันที่ 20 มกราคม 2025 หลังจากมีข่าวลือเกี่ยวกับการพัฒนาโมเดลนี้ตั้งแต่เดือนพฤศจิกายน 2024 โดย DeepSeek ยืนยันว่าโมเดลนี้จะเป็น โอเพ่นซอร์ส และเปิด API ให้ผู้ใช้งานทั่วไปสามารถเข้าถึงและใช้งานเทคโนโลยี AI ขั้นสูงได้อย่างง่ายดาย

DeepSeek-R1 โดดเด่นด้วยประสิทธิภาพที่เหนือกว่าโมเดลชั้นนำอย่าง OpenAI o1 ในการแก้ปัญหาคณิตศาสตร์และการให้เหตุผล พร้อมเปิดโอกาสให้ชุมชนวิจัยทั่วโลกนำไปต่อยอดเพื่อพัฒนาเทคโนโลยี AI ใหม่ๆ ได้ โมเดล DeepSeek-R1-Lite-Preview ยังแสดงให้เห็นศักยภาพที่สามารถเทียบเคียงกับ OpenAI o1-preview ในการทดสอบมาตรฐานอย่าง AIME และ MATH ซึ่งใช้วัดความสามารถของ AI

อย่างไรก็ตาม DeepSeek-R1 ยังมีจุดที่ต้องปรับปรุง เช่น การแก้ปัญหาเกมง่ายๆ อย่าง tic-tac-toe ซึ่งเป็นจุดอ่อนที่คล้ายกับ OpenAI o1 แต่ในภาพรวมถือว่าเป็นก้าวสำคัญของ AI ฝั่งจีน

ทำไม DeepSeek-R1 ถึงสะเทือนทั้ง Silicon Valley ?

ความสำเร็จของ DeepSeek-R1 ไม่ได้เป็นเพียงการเปิดตัวโมเดล AI ใหม่ แต่ยังเป็นบทพิสูจน์ถึงความสามารถในการพัฒนาภายใต้ข้อจำกัดที่ใหญ่หลวง มาตรการควบคุมการส่งออกของสหรัฐฯ ตั้งแต่ปี 2022 ที่ห้ามขายชิปประมวลผลขั้นสูงให้บริษัทจีน กดดันให้ DeepSeek ต้องคิดค้นวิธีการใหม่ในการฝึกโมเดล AI โดยมุ่งเน้นการใช้ทรัพยากรที่มีอยู่ให้เกิดประโยชน์สูงสุด เช่น Multi-head Latent Attention (MLA) และ Mixture-of-Experts มาประยุกต์ใช้ ทำให้สามารถลดการใช้พลังประมวลผลได้อย่างมาก

นี่คือ 3 เหตุผลที่ DeepSeek-R1 สร้างแรงสั่นสะเทือนใน Silicon Valley:

1. ประสิทธิภาพเหนือคู่แข่งในต้นทุนที่ต่ำกว่า

  • DeepSeek-R1 สามารถเทียบชั้นหรือเหนือกว่าโมเดล OpenAI o1 ในบางเกณฑ์ เช่น การแก้ปัญหาคณิตศาสตร์และการให้เหตุผล
  • ใช้ต้นทุนการฝึกเพียง 5.6 ล้านดอลลารสหรัฐฯ ซึ่งต่ำกว่าหลายร้อยล้านดอลลาร์ที่บริษัทในสหรัฐฯ ใช้
  • โมเดลใช้ทรัพยากรเพียง 1 ใน 10 ของโมเดล Llama 3.1 ของ Meta ในการฝึก นี่ถือเป็นจุดพลิกเกมสำคัญที่สร้างความทึ่งให้กับทั้งวงการ

2. การสนับสนุนโอเพ่นซอร์ส

  • DeepSeek-R1 เปิดโอเพ่นซอร์สและ API ให้ใช้งาน ทำให้วงการวิจัยทั่วโลกสามารถเข้าถึงและพัฒนาต่อได้
  • Yann LeCun หัวหน้าฝ่ายวิจัย AI ของ Meta ชี้ให้เห็นว่า ความสำเร็จของ DeepSeek เป็นผลมาจากการใช้ประโยชน์จากงานวิจัยโอเพ่นซอร์ส

3. ประสบความสำเร็จได้ ท่ามกลางข้อจำกัด

  • สหรัฐฯ ใช้มาตรการควบคุมการส่งออกชิปขั้นสูง ทำให้บริษัทจีนไม่สามารถเข้าถึงทรัพยากรที่จำเป็นได้
  • DeepSeek เลือกพัฒนาเทคโนโลยีที่เน้น ประสิทธิภาพสูงสุด โดยใช้ทรัพยากรที่มี เช่น ชิป Nvidia A100 จำนวน 10,000 ตัว โดยไม่ต้องพึ่งพาทรัพยากรระดับมหาศาลแบบบริษัทในตะวันตก 

นี่จึงเป็นเหตุผลว่าทำไม DeepSeek-R1 ถึงกลายเป็นประเด็นที่ทำให้ Silicon Valley ต้องหันมาจับตามอง นอกจากนี้นักลงทุนและผู้มีชื่อเสียงในวงการเทคโนโลยีก็ต่างออกมาแสดงความคิดเห็นมากมาย

นักวิเคราะห์และผู้เชี่ยวชาญคิดอย่างไร ?

  1. Marc Andreessen นักลงทุนชื่อดัง ยกย่อง DeepSeek ผ่านโพสต์บน X ว่าเป็น "หนึ่งในความก้าวหน้าที่น่าทึ่งที่สุดเท่าที่เคยเห็น" โดยชี้ว่าโมเดล R1 สามารถเทียบชั้นหรือเหนือกว่าโมเดล o1 ของ OpenAI ในบางเกณฑ์สำคัญ ทั้งยังใช้ต้นทุนในการฝึกเพียง 5.6 ล้านดอลลาร์สหรัฐฯ ซึ่งต่ำกว่าหลายร้อยล้านดอลลาร์ที่บริษัท AI ชั้นนำในสหรัฐฯ ต้องจ่าย
  2. MIT Technology Review มองว่าความสำเร็จของ DeepSeek แสดงให้เห็นว่าการคว่ำบาตรจากสหรัฐฯ กลับกลายเป็นแรงผลักดันให้สตาร์ทอัพจีนต้องคิดค้นวิธีที่เน้น ประสิทธิภาพ การรวมทรัพยากร และความร่วมมือ เพื่อเอาชนะข้อจำกัด อย่างไรก็ตาม Liang Wenfeng ผู้ก่อตั้ง DeepSeek ยอมรับว่าการควบคุมการส่งออกของสหรัฐฯ ยังคงเป็นอุปสรรคสำคัญต่อการพัฒนาในระยะยาว
  3. Neal Khosla ซีอีโอของ Curai แสดงความเห็นว่า DeepSeek อาจเป็น "ปฏิบัติการจิตวิทยาของรัฐบาลจีน" โดยกล่าวหาว่าบริษัทตั้งราคาต้นทุนต่ำเพื่อทำลายความสามารถในการแข่งขันของ AI ในสหรัฐฯ อย่างไรก็ดี ข้อกล่าวหานี้ถูกวิจารณ์อย่างหนัก เพราะ Khosla ไม่มีหลักฐานสนับสนุน อีกทั้งพ่อของเขาเป็นนักลงทุนใน OpenAI ซึ่งอาจก่อให้เกิดความขัดแย้งทางผลประโยชน์
  4. Holger Zschaepitz ผู้สื่อข่าวด้านเศรษฐกิจ ชี้ว่า DeepSeek อาจกลายเป็นภัยคุกคามต่อบริษัทในตลาดหุ้นสหรัฐฯ หากบริษัทจีนสามารถพัฒนาโมเดลระดับโลกในต้นทุนต่ำได้โดยไม่พึ่งพาชิปขั้นสูง ความสำเร็จนี้อาจทำให้เกิดคำถามถึงความคุ้มค่าของการลงทุนมหาศาลในอุตสาหกรรม AI ของฝั่งตะวันตก
  5. Garry Tan ซีอีโอของ Y Combinator มองในแง่ดี โดยเชื่อว่าความสำเร็จของ DeepSeek จะส่งผลดีต่อคู่แข่งในสหรัฐฯ เพราะต้นทุนการฝึกโมเดลที่ลดลงจะกระตุ้นความต้องการใช้งาน AI ในชีวิตจริงมากขึ้น ซึ่งเป็นการขยายตลาดโดยรวม
  6. Yann LeCun หัวหน้าฝ่ายวิจัย AI ของ Meta เสนออีกมุมมองว่า ความสำเร็จของ DeepSeek ไม่ควรถูกมองผ่านเลนส์ของการแข่งขันระหว่างจีนกับสหรัฐฯ แต่ควรมองว่าเป็นบทพิสูจน์ถึง พลังของโอเพนซอร์ส LeCun ชี้ว่า DeepSeek ได้รับประโยชน์จากงานวิจัยโอเพนซอร์ส เช่น PyTorch และ Llama ของ Meta ซึ่งช่วยให้บริษัทสามารถต่อยอดได้อย่างมีประสิทธิภาพ พร้อมเน้นว่าการแบ่งปันความสำเร็จนี้กลับคืนสู่ชุมชนวิจัยทั่วโลกถือเป็นหัวใจสำคัญของความก้าวหน้าใน AI

ท่ามกลางกระแสวิพากษ์วิจารณ์นี้ โมเดลของ DeepSeek กำลังดึงดูดความสนใจจากผู้ใช้ โดยในช่วงสุดสัปดาห์ที่ผ่านมา แอป AI ของ DeepSeek ขึ้นแท่นเป็นแอปฟรีอันดับ 1 ใน Apple App Store แซงหน้า ChatGPT ไปแล้ว

อ่านบทความที่เกี่ยวข้อง

อ้างอิง: techcrunch , bloomberg , wired 

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

สรุปการเสวนา India's Economic Blueprint อินเดียมีแนวคิดแบบไหนถึง ‘เศรษฐกิจโตไวสุดในโลก’

เจาะลึกแนวคิดเศรษฐกิจอินเดียใน "พิมพ์เขียวเศรษฐกิจอินเดีย" จาก World Economic Forum 2025 ชู 4 เสาหลักขับเคลื่อนเศรษฐกิจโตไวสุดในโลก สู่เป้าหมายประเทศพัฒนาแล้วปี 2047...

Responsive image

AGI คืออนาคต สรุปมุมมอง AI ขั้นต่อไปจากงาน World Economic Forum

ในงานประชุม World Economic Forum ที่ดาวอส หัวข้อเรื่อง AGI หรือปัญญาประดิษฐ์ทั่วไป ได้รับความสนใจอย่างมาก โดยผู้เชี่ยวชาญหลายท่านมองว่า AGI คือขั้นต่อไปของการพัฒนา AI และเป็นเป้าหม...

Responsive image

ใครจะซื้อ TikTok สหรัฐฯ รวมรายชื่อมหาเศรษฐีและบริษัททีสนใจ ByteDance

ค้นพบรายชื่อมหาเศรษฐีและบริษัทที่สนใจซื้อ TikTok สหรัฐฯ จาก ByteDance พร้อมข้อมูลเชิงลึกเกี่ยวกับมูลค่า TikTok บุคคลสำคัญ และดีลที่อาจเกิดขึ้น...