DeepSeek คืออะไร ทำไม R1 ถึงสะเทือนทั้ง Silicon Valley รู้จัก AI จีนที่โหดกว่า OpenAI-o1

มกราคม 27, 2025 | By Techsauce Team

กลายเป็นประเด็นร้อนในวงการเทคโนโลยีโลก เมื่อ DeepSeek สตาร์ทอัพ AI จากจีน สร้างความฮือฮาด้วยการเปิดตัวโมเดล DeepSeek-R1 ที่มีประสิทธิภาพเหนือกว่าโมเดลชั้นนำอย่าง OpenAI o1 ในด้านการแก้ปัญหาคณิตศาสตร์และการให้เหตุผล ทั้งยังเป็นโอเพนซอร์สที่เปิดโอกาสให้วงการวิจัยทั่วโลกเข้าถึงและพัฒนาต่อได้

การเปิดตัวครั้งนี้เกิดขึ้นท่ามกลางความตึงเครียดระหว่างจีนและสหรัฐฯ ที่เพิ่มสูงขึ้น โดยเฉพาะในแง่ของการแข่งขันทางเทคโนโลยีและ AI ซึ่งก่อนหน้านี้รัฐบาลโจ ไบเดนได้เดินหน้าควบคุมการส่งออกชิปขั้นสูงและเทคโนโลยี AI ไปยังประเทศที่ถือเป็นคู่แข่งอย่างจีนและรัสเซีย ด้วยเหตุผลด้านความมั่นคงและเพื่อรักษาอิทธิพลของสหรัฐฯ ในการกำหนดทิศทางการพัฒนา AI ของโลก

เรียกได้ว่าเป็นการ "กระตุกหนวดเสือ" ครั้งใหญ่และกลายเป็นกระแสใน Silicon Valley ทันที เพราะความก้าวหน้าของ AI จีนครั้งนี้ทำให้ทั้งวงการต้องหันมาถามว่า “จีนมาไกลขนาดนี้แล้วเหรอ?” ในบทความนี้เราจึงอยากพาคุณไปรู้จักโมเดลที่ทำให้โลกตะลึง และย้อนดูเหตุผลว่าทำไมการเปิดตัวครั้งนี้ถึงสร้างแรงกระเพื่อมได้ขนาดนี้

โมเดล DeepSeek-R1 จาก DeepSeek คืออะไร ?

DeepSeek-R1 คือโมเดล AI สุดล้ำจากบริษัท DeepSeek ที่เปิดตัวอย่างเป็นทางการเมื่อวันที่ 20 มกราคม 2025 หลังจากมีข่าวลือเกี่ยวกับการพัฒนาโมเดลนี้ตั้งแต่เดือนพฤศจิกายน 2024 โดย DeepSeek ยืนยันว่าโมเดลนี้จะเป็น โอเพ่นซอร์ส และเปิด API ให้ผู้ใช้งานทั่วไปสามารถเข้าถึงและใช้งานเทคโนโลยี AI ขั้นสูงได้อย่างง่ายดาย

DeepSeek-R1 โดดเด่นด้วยประสิทธิภาพที่เหนือกว่าโมเดลชั้นนำอย่าง OpenAI o1 ในการแก้ปัญหาคณิตศาสตร์และการให้เหตุผล พร้อมเปิดโอกาสให้ชุมชนวิจัยทั่วโลกนำไปต่อยอดเพื่อพัฒนาเทคโนโลยี AI ใหม่ๆ ได้ โมเดล DeepSeek-R1-Lite-Preview ยังแสดงให้เห็นศักยภาพที่สามารถเทียบเคียงกับ OpenAI o1-preview ในการทดสอบมาตรฐานอย่าง AIME และ MATH ซึ่งใช้วัดความสามารถของ AI

อย่างไรก็ตาม DeepSeek-R1 ยังมีจุดที่ต้องปรับปรุง เช่น การแก้ปัญหาเกมง่ายๆ อย่าง tic-tac-toe ซึ่งเป็นจุดอ่อนที่คล้ายกับ OpenAI o1 แต่ในภาพรวมถือว่าเป็นก้าวสำคัญของ AI ฝั่งจีน

ทำไม DeepSeek-R1 ถึงสะเทือนทั้ง Silicon Valley ?

ความสำเร็จของ DeepSeek-R1 ไม่ได้เป็นเพียงการเปิดตัวโมเดล AI ใหม่ แต่ยังเป็นบทพิสูจน์ถึงความสามารถในการพัฒนาภายใต้ข้อจำกัดที่ใหญ่หลวง มาตรการควบคุมการส่งออกของสหรัฐฯ ตั้งแต่ปี 2022 ที่ห้ามขายชิปประมวลผลขั้นสูงให้บริษัทจีน กดดันให้ DeepSeek ต้องคิดค้นวิธีการใหม่ในการฝึกโมเดล AI โดยมุ่งเน้นการใช้ทรัพยากรที่มีอยู่ให้เกิดประโยชน์สูงสุด เช่น Multi-head Latent Attention (MLA) และ Mixture-of-Experts มาประยุกต์ใช้ ทำให้สามารถลดการใช้พลังประมวลผลได้อย่างมาก

นี่คือ 3 เหตุผลที่ DeepSeek-R1 สร้างแรงสั่นสะเทือนใน Silicon Valley:

1. ประสิทธิภาพเหนือคู่แข่งในต้นทุนที่ต่ำกว่า

DeepSeek-R1 สามารถเทียบชั้นหรือเหนือกว่าโมเดล OpenAI o1 ในบางเกณฑ์ เช่น การแก้ปัญหาคณิตศาสตร์และการให้เหตุผล
ใช้ต้นทุนการฝึกเพียง 5.6 ล้านดอลลารสหรัฐฯ ซึ่งต่ำกว่าหลายร้อยล้านดอลลาร์ที่บริษัทในสหรัฐฯ ใช้
โมเดลใช้ทรัพยากรเพียง 1 ใน 10 ของโมเดล Llama 3.1 ของ Meta ในการฝึก นี่ถือเป็นจุดพลิกเกมสำคัญที่สร้างความทึ่งให้กับทั้งวงการ

2. การสนับสนุนโอเพ่นซอร์ส

DeepSeek-R1 เปิดโอเพ่นซอร์สและ API ให้ใช้งาน ทำให้วงการวิจัยทั่วโลกสามารถเข้าถึงและพัฒนาต่อได้
Yann LeCun หัวหน้าฝ่ายวิจัย AI ของ Meta ชี้ให้เห็นว่า ความสำเร็จของ DeepSeek เป็นผลมาจากการใช้ประโยชน์จากงานวิจัยโอเพ่นซอร์ส

3. ประสบความสำเร็จได้ ท่ามกลางข้อจำกัด

สหรัฐฯ ใช้มาตรการควบคุมการส่งออกชิปขั้นสูง ทำให้บริษัทจีนไม่สามารถเข้าถึงทรัพยากรที่จำเป็นได้
DeepSeek เลือกพัฒนาเทคโนโลยีที่เน้น ประสิทธิภาพสูงสุด โดยใช้ทรัพยากรที่มี เช่น ชิป Nvidia A100 จำนวน 10,000 ตัว โดยไม่ต้องพึ่งพาทรัพยากรระดับมหาศาลแบบบริษัทในตะวันตก

นี่จึงเป็นเหตุผลว่าทำไม DeepSeek-R1 ถึงกลายเป็นประเด็นที่ทำให้ Silicon Valley ต้องหันมาจับตามอง นอกจากนี้นักลงทุนและผู้มีชื่อเสียงในวงการเทคโนโลยีก็ต่างออกมาแสดงความคิดเห็นมากมาย

นักวิเคราะห์และผู้เชี่ยวชาญคิดอย่างไรกับ Deepseek ?

Marc Andreessen นักลงทุนชื่อดัง ยกย่อง DeepSeek ผ่านโพสต์บน X ว่าเป็น "หนึ่งในความก้าวหน้าที่น่าทึ่งที่สุดเท่าที่เคยเห็น" โดยชี้ว่าโมเดล R1 สามารถเทียบชั้นหรือเหนือกว่าโมเดล o1 ของ OpenAI ในบางเกณฑ์สำคัญ ทั้งยังใช้ต้นทุนในการฝึกเพียง 5.6 ล้านดอลลาร์สหรัฐฯ ซึ่งต่ำกว่าหลายร้อยล้านดอลลาร์ที่บริษัท AI ชั้นนำในสหรัฐฯ ต้องจ่าย
MIT Technology Review มองว่าความสำเร็จของ DeepSeek แสดงให้เห็นว่าการคว่ำบาตรจากสหรัฐฯ กลับกลายเป็นแรงผลักดันให้สตาร์ทอัพจีนต้องคิดค้นวิธีที่เน้น ประสิทธิภาพ การรวมทรัพยากร และความร่วมมือ เพื่อเอาชนะข้อจำกัด อย่างไรก็ตาม Liang Wenfeng ผู้ก่อตั้ง DeepSeek ยอมรับว่าการควบคุมการส่งออกของสหรัฐฯ ยังคงเป็นอุปสรรคสำคัญต่อการพัฒนาในระยะยาว
Neal Khosla ซีอีโอของ Curai แสดงความเห็นว่า DeepSeek อาจเป็น "ปฏิบัติการจิตวิทยาของรัฐบาลจีน" โดยกล่าวหาว่าบริษัทตั้งราคาต้นทุนต่ำเพื่อทำลายความสามารถในการแข่งขันของ AI ในสหรัฐฯ อย่างไรก็ดี ข้อกล่าวหานี้ถูกวิจารณ์อย่างหนัก เพราะ Khosla ไม่มีหลักฐานสนับสนุน อีกทั้งพ่อของเขาเป็นนักลงทุนใน OpenAI ซึ่งอาจก่อให้เกิดความขัดแย้งทางผลประโยชน์
Holger Zschaepitz ผู้สื่อข่าวด้านเศรษฐกิจ ชี้ว่า DeepSeek อาจกลายเป็นภัยคุกคามต่อบริษัทในตลาดหุ้นสหรัฐฯ หากบริษัทจีนสามารถพัฒนาโมเดลระดับโลกในต้นทุนต่ำได้โดยไม่พึ่งพาชิปขั้นสูง ความสำเร็จนี้อาจทำให้เกิดคำถามถึงความคุ้มค่าของการลงทุนมหาศาลในอุตสาหกรรม AI ของฝั่งตะวันตก
Garry Tan ซีอีโอของ Y Combinator มองในแง่ดี โดยเชื่อว่าความสำเร็จของ DeepSeek จะส่งผลดีต่อคู่แข่งในสหรัฐฯ เพราะต้นทุนการฝึกโมเดลที่ลดลงจะกระตุ้นความต้องการใช้งาน AI ในชีวิตจริงมากขึ้น ซึ่งเป็นการขยายตลาดโดยรวม
Yann LeCun หัวหน้าฝ่ายวิจัย AI ของ Meta เสนออีกมุมมองว่า ความสำเร็จของ DeepSeek ไม่ควรถูกมองผ่านเลนส์ของการแข่งขันระหว่างจีนกับสหรัฐฯ แต่ควรมองว่าเป็นบทพิสูจน์ถึง พลังของโอเพนซอร์ส LeCun ชี้ว่า DeepSeek ได้รับประโยชน์จากงานวิจัยโอเพนซอร์ส เช่น PyTorch และ Llama ของ Meta ซึ่งช่วยให้บริษัทสามารถต่อยอดได้อย่างมีประสิทธิภาพ พร้อมเน้นว่าการแบ่งปันความสำเร็จนี้กลับคืนสู่ชุมชนวิจัยทั่วโลกถือเป็นหัวใจสำคัญของความก้าวหน้าใน AI

ท่ามกลางกระแสวิพากษ์วิจารณ์นี้ โมเดลของ DeepSeek กำลังดึงดูดความสนใจจากผู้ใช้ โดยในช่วงสุดสัปดาห์ที่ผ่านมา แอป AI ของ DeepSeek ขึ้นแท่นเป็นแอปฟรีอันดับ 1 ใน Apple App Store แซงหน้า ChatGPT ไปแล้ว

อ่านบทความที่เกี่ยวข้อง

อ้างอิง: techcrunch , bloomberg , wired

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

เข้าสู่ระบบ
ลงทะเบียน

ลืมรหัสผ่าน?

มีบัญชีแล้วหรือยัง ?

มีบัญชีอยู่แล้ว ?

No comment

ทำไมวันนี้ต้องมอง ‘เมืองทองธานี’ เป็นเมืองอัจฉริยะที่มีทุกอย่าง เจาะดีล AIS-บางกอกแลนด์ สร้าง Intelligent Infrastructure ที่เมืองทอง

เจาะลึกโปรเจกต์ ‘Muang Thong NEXT’ เมื่อ AIS จับมือ บางกอกแลนด์ ปูพรมโครงสร้างพื้นฐานดิจิทัล 5G-Advanced และ AI พลิกโฉมเมืองทองธานีสู่ Hub Connectivity City รองรับผู้คนกว่า 2.2 ล้า...

กรกฎาคม 17, 2026 | By Techsauce Team

Tech & Biz

ais

Muang Thong NEXT: The Smart & Connected City

Agentic Commerce คืออะไร? เมื่อ AI เริ่มช้อปปิ้งแทนคน โจทย์ใหม่ที่แบรนด์ต้องรู้

ในอนาคตเราอาจไม่ต้องมาเปรียบเทียบราคาหรืออ่านรีวิวสินค้าเองอีกต่อไป เพราะเรากำลังเข้าสู่เทรนด์ที่เรียกว่า ‘Agentic Commerce’ หรือการให้ AI ซื้อของแทนเรา...

กรกฎาคม 15, 2026 | By Techsauce Team

3 เทรนด์ชี้ชะตาธุรกิจโลก: สรุปเวที Summer Davos (AI - พลังงาน - ยุทธศาสตร์จีน) | Tech for Biz EP.62

สรุป Summer Davos Techsauce สรุปประเด็นร้อนที่ส่งตรงจาก Congress Hall ใน Dalian กับ 3 จุดเปลี่ยนที่ธุรกิจไทยต้องรีบปรับตัว...

กรกฎาคม 11, 2026 | By Techsauce Team