DeepSeek สตาร์ทอัพด้าน AI สัญชาติจีนสร้างแรงสั่นสะเทือนวงการเมื่อวันอาทิตย์ที่ผ่านมา ด้วยการเปิดตัวโมเดล DeepSeek-V3.2 และ DeepSeek-V3.2-Speciale โดยระบุว่ามีประสิทธิภาพเทียบเท่าหรือเหนือกว่า GPT-5 ของ OpenAI และ Gemini-3.0-Pro ของ Google พร้อมปล่อยให้ใช้งานฟรีภายใต้ MIT License ถือเป็นพัฒนาการสำคัญที่อาจเปลี่ยนภูมิทัศน์การแข่งขันระหว่างบริษัทเทคโนโลยีสหรัฐฯ และจีน

DeepSeek-V3.2 ออกแบบมาเป็นผู้ช่วยด้านการให้เหตุผลในชีวิตประจำวัน ขณะที่ DeepSeek-V3.2-Speciale เป็นรุ่นประสิทธิภาพสูงที่โดดเด่นในด้านคณิตศาสตร์ การเขียนโค้ด และการให้เหตุผลระดับลึก โดยรุ่น Speciale ทำผลงานคว้าเหรียญทองจากการแข่งขันระดับโลก ได้แก่ International Mathematical Olympiad (IMO) 2025, International Olympiad in Informatics (IOI), ICPC World Finals และ China Mathematical Olympiad
การเปิดตัวครั้งนี้สะเทือนบัลลังก์ความเป็นผู้นำด้านเทคโนโลยีของสหรัฐฯ เพราะแม้จีนจะเผชิญข้อจำกัดการส่งออกชิป Nvidia ขั้นสูง แต่ DeepSeek ยังคงพิสูจน์ว่าสามารถสร้างโมเดลระดับแนวหน้าได้สำเร็จ ที่สำคัญคือบริษัทเลือกเปิดให้ใช้งานฟรีภายใต้ MIT License ซึ่งเป็นหนึ่งในลิขสิทธิ์โอเพ่นซอร์สที่เปิดกว้างที่สุด
ผู้คนคิดว่า DeepSeek เป็นเพียงแรงกระเพื่อมครั้งเดียว แต่เรากลับมาอย่างยิ่งใหญ่กว่าเดิมมาก
Chen Fang ผู้ร่วมโครงการเขียนบน X และการเปิดตัวครั้งนี้สร้างปฏิกิริยาอย่างรวดเร็วทางออนไลน์ โดยมีผู้ใช้อินเทอร์เน็ตรายหนึ่งโพสต์ว่า "ChatGPT จงไปสู่สุคติ"
หัวใจสำคัญของการเปิดตัวครั้งนี้คือ DeepSeek Sparse Attention (DSA) สถาปัตยกรรมใหม่ที่ลดต้นทุนการประมวลผลลงอย่างมหาศาล
กลไก Attention แบบดั้งเดิม ซึ่งเป็นเทคโนโลยีสำคัญที่ทำให้โมเดลเข้าใจบริบท มักมีปัญหาเมื่ออินพุตยาวขึ้น เพราะต้องใช้กำลังคำนวณเพิ่มขึ้นแบบทวีคูณ แต่แนวทางของ DeepSeek แก้ข้อจำกัดนี้ด้วยเทคนิค ‘Lightning Indexer’ ที่เลือกเฉพาะบริบทสำคัญที่สุดสำหรับแต่ละคำถาม แทนการประมวลผลทั้งเอกสารเหมือนโมเดลทั่วไป
ผลลัพธ์คือการประมวลผลเอกสารยาว 128,000 โทเคน (ประมาณ 300 หน้า) สามารถลดต้นทุนจากเดิม 2.40 ดอลลาร์ เหลือเพียง 0.70 ดอลลาร์ต่อล้านโทเคน โดยการประเมินระบุว่าถึงจะใช้กลไก Sparse Attention แต่ประสิทธิภาพยังคงเทียบเท่าหรือดีกว่ารุ่นก่อนหน้า
DeepSeek เปิดเผยผลการทดสอบที่ชี้ให้เห็นว่าทำผลงานเทียบชั้นหรือเหนือกว่าคู่แข่งจากสหรัฐฯ
อย่างไรก็ตาม บริษัทก็ยอมรับข้อจำกัด โดยระบุว่าโมเดลยังใช้จำนวนโทเคนมากกว่าเพื่อให้ได้คุณภาพคำตอบระดับเดียวกับ Gemini-3.0-Pro
หนึ่งในความก้าวหน้าที่สำคัญคือฟีเจอร์ ‘Thinking in Tool-Use’ ซึ่งช่วยให้โมเดลสามารถคิด วิเคราะห์ และเรียกใช้เครื่องมือภายนอก เช่นรันโค้ดหรือค้นเว็บไปพร้อมกัน โดยไม่สูญเสียตรรกะกลางทาง
โมเดล AI รุ่นก่อนๆ มักมีข้อจำกัดที่น่าหงุดหงิด คือ ทุกครั้งที่เรียกใช้เครื่องมือภายนอก โมเดลจะสูญเสียตรรกะการคิดไป แต่สถาปัตยกรรมใหม่ทำให้ DeepSeek รักษาเธรดการคิดไว้ตลอดงานหลายขั้นตอน ทำให้ทำงาน เช่น วางแผนทริป ค้นข้อมูลเชิงวิจัย หรือแก้บั๊กหลายภาษา ได้ต่อเนื่องและมีเสถียรภาพมากขึ้น
สิ่งที่สร้างแรงกระเพื่อมมากที่สุดคือ DeepSeek เลือกปล่อยโมเดลทั้งหมด น้ำหนักโมเดล โค้ดฝึก และเอกสารกำกับบน Hugging Face ให้ใช้งานได้ฟรีโดยไม่มีข้อจำกัดใด ๆ โดยนักพัฒนา นักวิจัย หรือองค์กรสามารถดาวน์โหลด ปรับแต่ง และนำโมเดลขนาด 685,000 ล้านพารามิเตอร์ไปใช้งานได้ทันที
กลยุทธ์นี้ถือเป็นการท้าทายโมเดลธุรกิจของ OpenAI, Anthropic และ Google ที่เรียกเก็บค่าบริการ API ในราคาสูง เพราะสำหรับ DeepSeek แล้ว ลูกค้าสามารถติดตั้งใช้งานเองด้วยต้นทุนที่ต่ำกว่ามาก
อย่างไรก็ดี DeepSeek ยังเผชิญแรงต้านจากหน่วยงานกำกับดูแลในยุโรปและสหรัฐฯ ทั้งกรณีคณะกรรมาธิการคุ้มครองข้อมูลของเบอร์ลินระบุว่าการส่งข้อมูลผู้ใช้ไปจีนผิดกฎหมาย โดยขอให้ Apple และ Google พิจารณาบล็อกแอปพลิเคชัน อิตาลีสั่งให้ DeepSeek บล็อกแอปไปแล้วในเดือนกุมภาพันธ์ สมาชิกรัฐสภาสหรัฐฯ ก็พยายามผลักดันการห้ามใช้บริการนี้ในอุปกรณ์ของรัฐบาล โดยอ้างถึงข้อกังวลด้านความมั่นคงแห่งชาติ
นอกจากนี้ยังมีมาตรการควบคุมการส่งออกชิป Nvidia ของสหรัฐฯ ที่มุ่งจำกัดศักยภาพ AI ของจีน แม้ DeepSeek จะยืนยันว่าสามารถทำงานบนชิป Huawei และ Cambricon ที่ผลิตในประเทศได้โดยไม่ต้องตั้งค่าเพิ่มก็ตาม
โมเดล V3 เดิมถูกฝึกด้วยชิป Nvidia H800 จำนวนราว 2,000 ตัว ซึ่งต่อมาถูกจำกัดการส่งออก แม้ DeepSeek ไม่เปิดเผยว่า V3.2 ใช้ฮาร์ดแวร์ใด แต่ความก้าวหน้าที่ต่อเนื่องแสดงให้เห็นว่ามาตรการควบคุมการส่งออกเพียงอย่างเดียวไม่สามารถหยุดยั้งความก้าวหน้าของ AI จีนได้
การเปิดตัวครั้งนี้สะท้อนว่าการแข่งขัน AI ระหว่างสหรัฐฯ และจีนกำลังก้าวสู่เฟสใหม่ จากเดิมที่แข่งกันด้วยขนาดโมเดลและเงินลงทุน สู่การแข่งขันที่เน้น ประสิทธิภาพ ต้นทุน และความสามารถในการเปิดให้ใช้งาน การที่ DeepSeek เลือกแจกเทคโนโลยีระดับชั้นนำให้ใช้ฟรี อาจทำให้โอเพ่นซอร์สกลับมาเป็นพลังสำคัญในเวที AI ระดับโลกอีกครั้ง
คำถามที่ตามมาจึงไม่ใช่ว่า AI จากจีนแข่งขันได้หรือไม่ แต่คือ บริษัทยักษ์จากสหรัฐฯ จะรักษาความเป็นผู้นำไว้ได้อย่างไร เมื่อคู่แข่งเลือกแจกเทคโนโลยีระดับแนวหน้าให้ทุกคนใช้งานได้ฟรี
อ้างอิง: VentureBeat
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด