DeepSeek เปิดตัว 2 โมเดลใหม่ล้ำกว่า GPT-5 เปิดให้ใช้ฟรีแบบเต็มรูปแบบ เขย่าบัลลังก์บิ๊กเทคสหรัฐ

DeepSeek สตาร์ทอัพด้าน AI สัญชาติจีนสร้างแรงสั่นสะเทือนวงการเมื่อวันอาทิตย์ที่ผ่านมา ด้วยการเปิดตัวโมเดล DeepSeek-V3.2 และ DeepSeek-V3.2-Speciale โดยระบุว่ามีประสิทธิภาพเทียบเท่าหรือเหนือกว่า GPT-5 ของ OpenAI และ Gemini-3.0-Pro ของ Google พร้อมปล่อยให้ใช้งานฟรีภายใต้ MIT License ถือเป็นพัฒนาการสำคัญที่อาจเปลี่ยนภูมิทัศน์การแข่งขันระหว่างบริษัทเทคโนโลยีสหรัฐฯ และจีน

DeepSeek-V3.2 ออกแบบมาเป็นผู้ช่วยด้านการให้เหตุผลในชีวิตประจำวัน ขณะที่ DeepSeek-V3.2-Speciale เป็นรุ่นประสิทธิภาพสูงที่โดดเด่นในด้านคณิตศาสตร์ การเขียนโค้ด และการให้เหตุผลระดับลึก โดยรุ่น Speciale ทำผลงานคว้าเหรียญทองจากการแข่งขันระดับโลก ได้แก่ International Mathematical Olympiad (IMO) 2025, International Olympiad in Informatics (IOI), ICPC World Finals และ China Mathematical Olympiad

การเปิดตัวครั้งนี้สะเทือนบัลลังก์ความเป็นผู้นำด้านเทคโนโลยีของสหรัฐฯ เพราะแม้จีนจะเผชิญข้อจำกัดการส่งออกชิป Nvidia ขั้นสูง แต่ DeepSeek ยังคงพิสูจน์ว่าสามารถสร้างโมเดลระดับแนวหน้าได้สำเร็จ ที่สำคัญคือบริษัทเลือกเปิดให้ใช้งานฟรีภายใต้ MIT License ซึ่งเป็นหนึ่งในลิขสิทธิ์โอเพ่นซอร์สที่เปิดกว้างที่สุด

ผู้คนคิดว่า DeepSeek เป็นเพียงแรงกระเพื่อมครั้งเดียว แต่เรากลับมาอย่างยิ่งใหญ่กว่าเดิมมาก

Chen Fang ผู้ร่วมโครงการเขียนบน X และการเปิดตัวครั้งนี้สร้างปฏิกิริยาอย่างรวดเร็วทางออนไลน์ โดยมีผู้ใช้อินเทอร์เน็ตรายหนึ่งโพสต์ว่า "ChatGPT จงไปสู่สุคติ"

DeepSeek Sparse Attention นวัตกรรมลดต้นทุนการประมวลผล

หัวใจสำคัญของการเปิดตัวครั้งนี้คือ DeepSeek Sparse Attention (DSA) สถาปัตยกรรมใหม่ที่ลดต้นทุนการประมวลผลลงอย่างมหาศาล

กลไก Attention แบบดั้งเดิม ซึ่งเป็นเทคโนโลยีสำคัญที่ทำให้โมเดลเข้าใจบริบท มักมีปัญหาเมื่ออินพุตยาวขึ้น เพราะต้องใช้กำลังคำนวณเพิ่มขึ้นแบบทวีคูณ แต่แนวทางของ DeepSeek แก้ข้อจำกัดนี้ด้วยเทคนิค ‘Lightning Indexer’  ที่เลือกเฉพาะบริบทสำคัญที่สุดสำหรับแต่ละคำถาม แทนการประมวลผลทั้งเอกสารเหมือนโมเดลทั่วไป

ผลลัพธ์คือการประมวลผลเอกสารยาว 128,000 โทเคน (ประมาณ 300 หน้า) สามารถลดต้นทุนจากเดิม 2.40 ดอลลาร์ เหลือเพียง 0.70 ดอลลาร์ต่อล้านโทเคน โดยการประเมินระบุว่าถึงจะใช้กลไก Sparse Attention แต่ประสิทธิภาพยังคงเทียบเท่าหรือดีกว่ารุ่นก่อนหน้า

DeepSeek ทัดเทียม GPT-5 และ Gemini-3.0-Pro ด้วยผลคะแนนที่โดดเด่น

DeepSeek เปิดเผยผลการทดสอบที่ชี้ให้เห็นว่าทำผลงานเทียบชั้นหรือเหนือกว่าคู่แข่งจากสหรัฐฯ

  • AIME 2025 (คณิตศาสตร์): Speciale ทำได้ 96.0% เทียบกับ 94.6% ของ GPT-5-High และ 95.0% ของ Gemini-3.0-Pro
  • Harvard-MIT Mathematics Tournament (HMMT): Speciale ทำคะแนนได้ 99.2% แซงหน้า Gemini ที่ 97.5%
  • การแข่งขัน IMO 2025: ทำได้ 35 จาก 42 คะแนน ระดับเหรียญทอง
  • การแข่งขัน IOI: ทำคะแนน 492 จาก 600 อยู่ในระดับเหรียญทองและติดอันดับที่ 10 เทียบกับมนุษย์
  • การแข่งขัน ICPC World Finals: แก้โจทย์ได้ 10 จาก 12 ข้อ อยู่ในอันดับที่ 2 เทียบกับมนุษย์
  • การเขียนโค้ด: DeepSeek-V3.2 แก้บั๊กบน SWE-Verified ได้ 73.1% ใกล้เคียง GPT-5-High ที่ 74.9% และในการวัดการจัดการ Workflow ที่ซับซ้อนบน Terminal Bench 2.0 DeepSeek ทำคะแนนได้ 46.4% ซึ่งสูงกว่า GPT-5-High ที่ 35.2%

อย่างไรก็ตาม บริษัทก็ยอมรับข้อจำกัด โดยระบุว่าโมเดลยังใช้จำนวนโทเคนมากกว่าเพื่อให้ได้คุณภาพคำตอบระดับเดียวกับ Gemini-3.0-Pro

การสอน AI ให้ ‘คิด’ ระหว่างใช้เครื่องมือคือจุดเปลี่ยน

หนึ่งในความก้าวหน้าที่สำคัญคือฟีเจอร์ ‘Thinking in Tool-Use’ ซึ่งช่วยให้โมเดลสามารถคิด วิเคราะห์ และเรียกใช้เครื่องมือภายนอก เช่นรันโค้ดหรือค้นเว็บไปพร้อมกัน โดยไม่สูญเสียตรรกะกลางทาง

โมเดล AI รุ่นก่อนๆ มักมีข้อจำกัดที่น่าหงุดหงิด คือ ทุกครั้งที่เรียกใช้เครื่องมือภายนอก โมเดลจะสูญเสียตรรกะการคิดไป แต่สถาปัตยกรรมใหม่ทำให้ DeepSeek รักษาเธรดการคิดไว้ตลอดงานหลายขั้นตอน ทำให้ทำงาน เช่น วางแผนทริป ค้นข้อมูลเชิงวิจัย หรือแก้บั๊กหลายภาษา ได้ต่อเนื่องและมีเสถียรภาพมากขึ้น

กลยุทธ์ Open-Source ที่อาจเปลี่ยนเกมธุรกิจ AI

สิ่งที่สร้างแรงกระเพื่อมมากที่สุดคือ DeepSeek เลือกปล่อยโมเดลทั้งหมด น้ำหนักโมเดล โค้ดฝึก และเอกสารกำกับบน Hugging Face ให้ใช้งานได้ฟรีโดยไม่มีข้อจำกัดใด ๆ โดยนักพัฒนา นักวิจัย หรือองค์กรสามารถดาวน์โหลด ปรับแต่ง และนำโมเดลขนาด 685,000 ล้านพารามิเตอร์ไปใช้งานได้ทันที

กลยุทธ์นี้ถือเป็นการท้าทายโมเดลธุรกิจของ OpenAI, Anthropic และ Google ที่เรียกเก็บค่าบริการ API ในราคาสูง เพราะสำหรับ DeepSeek แล้ว ลูกค้าสามารถติดตั้งใช้งานเองด้วยต้นทุนที่ต่ำกว่ามาก

กำแพงกฎระเบียบที่เพิ่มขึ้นในยุโรปและอเมริกาที่ยังคงต้องจับตามอง

อย่างไรก็ดี DeepSeek ยังเผชิญแรงต้านจากหน่วยงานกำกับดูแลในยุโรปและสหรัฐฯ ทั้งกรณีคณะกรรมาธิการคุ้มครองข้อมูลของเบอร์ลินระบุว่าการส่งข้อมูลผู้ใช้ไปจีนผิดกฎหมาย โดยขอให้ Apple และ Google พิจารณาบล็อกแอปพลิเคชัน อิตาลีสั่งให้ DeepSeek บล็อกแอปไปแล้วในเดือนกุมภาพันธ์ สมาชิกรัฐสภาสหรัฐฯ ก็พยายามผลักดันการห้ามใช้บริการนี้ในอุปกรณ์ของรัฐบาล โดยอ้างถึงข้อกังวลด้านความมั่นคงแห่งชาติ

นอกจากนี้ยังมีมาตรการควบคุมการส่งออกชิป Nvidia ของสหรัฐฯ ที่มุ่งจำกัดศักยภาพ AI ของจีน แม้ DeepSeek จะยืนยันว่าสามารถทำงานบนชิป Huawei และ Cambricon ที่ผลิตในประเทศได้โดยไม่ต้องตั้งค่าเพิ่มก็ตาม

โมเดล V3 เดิมถูกฝึกด้วยชิป Nvidia H800 จำนวนราว 2,000 ตัว ซึ่งต่อมาถูกจำกัดการส่งออก แม้ DeepSeek ไม่เปิดเผยว่า V3.2 ใช้ฮาร์ดแวร์ใด แต่ความก้าวหน้าที่ต่อเนื่องแสดงให้เห็นว่ามาตรการควบคุมการส่งออกเพียงอย่างเดียวไม่สามารถหยุดยั้งความก้าวหน้าของ AI จีนได้

ยุคใหม่ในโลกการแข่งขันของ AI

การเปิดตัวครั้งนี้สะท้อนว่าการแข่งขัน AI ระหว่างสหรัฐฯ และจีนกำลังก้าวสู่เฟสใหม่ จากเดิมที่แข่งกันด้วยขนาดโมเดลและเงินลงทุน สู่การแข่งขันที่เน้น ประสิทธิภาพ ต้นทุน และความสามารถในการเปิดให้ใช้งาน การที่ DeepSeek เลือกแจกเทคโนโลยีระดับชั้นนำให้ใช้ฟรี อาจทำให้โอเพ่นซอร์สกลับมาเป็นพลังสำคัญในเวที AI ระดับโลกอีกครั้ง

คำถามที่ตามมาจึงไม่ใช่ว่า AI จากจีนแข่งขันได้หรือไม่ แต่คือ บริษัทยักษ์จากสหรัฐฯ จะรักษาความเป็นผู้นำไว้ได้อย่างไร เมื่อคู่แข่งเลือกแจกเทคโนโลยีระดับแนวหน้าให้ทุกคนใช้งานได้ฟรี

อ้างอิง: VentureBeat


ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

แว่นตาแห่งอนาคต ปรับโฟกัสอ่านใกล้-ไกล อัตโนมัติ ซ่อนเทคโนโลยีไว้ใต้กรอบแว่น ราคายังไม่เปิด แต่บริษัทเผยว่าแพง

IXI เปิดตัวแว่นอัจฉริยะที่ปรับโฟกัสตามดวงตาอัตโนมัติ ใส่สบาย น้ำหนักเบา ดีไซน์เหมือนแว่นปกติ แต่เทคโนโลยีล้ำสุด...

Responsive image

Suno ขึ้นแท่น 'ยูนิคอร์น' เต็มตัว หลังระดมทุนรอบล่าสุด ดันมูลค่าบริษัทแตะ 2.45 พันล้านดอลลาร์

Suno บริษัทสตาร์ทอัพด้านดนตรีที่ใช้เทคโนโลยี AI ประกาศระดมทุนรอบล่าสุดได้ 250 ล้านดอลลาร์สหรัฐ ส่งผลให้มูลค่าบริษัทขยับขึ้นมาอยู่ที่ 2.45 พันล้านดอลลาร์...

Responsive image

ปฏิวัติวงการวัสดุศาสตร์! นักวิจัยสร้าง ‘Structural Color’ เปลี่ยนสีได้ดั่งใจ ไม่พึ่งสารเคมี

นักวิจัย University of Florida พัฒนาวัสดุอัจฉริยะเปลี่ยนสีได้ทันทีด้วย Vanadium Dioxide ไม่ง้อสีย้อมเคมี ใช้หลักการ Structural Color ประยุกต์ใช้ได้ทั้งสิ่งทอ แฟชั่น และชุดพรางตัวทห...