DeepSeek เปิดตัว 2 โมเดลใหม่ล้ำกว่า GPT-5 เปิดให้ใช้ฟรีแบบเต็มรูปแบบ เขย่าบัลลังก์บิ๊กเทคสหรัฐ

ธันวาคม 2, 2025 | By Techsauce Team

DeepSeek สตาร์ทอัพด้าน AI สัญชาติจีนสร้างแรงสั่นสะเทือนวงการเมื่อวันอาทิตย์ที่ผ่านมา ด้วยการเปิดตัวโมเดล DeepSeek-V3.2 และ DeepSeek-V3.2-Speciale โดยระบุว่ามีประสิทธิภาพเทียบเท่าหรือเหนือกว่า GPT-5 ของ OpenAI และ Gemini-3.0-Pro ของ Google พร้อมปล่อยให้ใช้งานฟรีภายใต้ MIT License ถือเป็นพัฒนาการสำคัญที่อาจเปลี่ยนภูมิทัศน์การแข่งขันระหว่างบริษัทเทคโนโลยีสหรัฐฯ และจีน

DeepSeek-V3.2 ออกแบบมาเป็นผู้ช่วยด้านการให้เหตุผลในชีวิตประจำวัน ขณะที่ DeepSeek-V3.2-Speciale เป็นรุ่นประสิทธิภาพสูงที่โดดเด่นในด้านคณิตศาสตร์ การเขียนโค้ด และการให้เหตุผลระดับลึก โดยรุ่น Speciale ทำผลงานคว้าเหรียญทองจากการแข่งขันระดับโลก ได้แก่ International Mathematical Olympiad (IMO) 2025, International Olympiad in Informatics (IOI), ICPC World Finals และ China Mathematical Olympiad

การเปิดตัวครั้งนี้สะเทือนบัลลังก์ความเป็นผู้นำด้านเทคโนโลยีของสหรัฐฯ เพราะแม้จีนจะเผชิญข้อจำกัดการส่งออกชิป Nvidia ขั้นสูง แต่ DeepSeek ยังคงพิสูจน์ว่าสามารถสร้างโมเดลระดับแนวหน้าได้สำเร็จ ที่สำคัญคือบริษัทเลือกเปิดให้ใช้งานฟรีภายใต้ MIT License ซึ่งเป็นหนึ่งในลิขสิทธิ์โอเพ่นซอร์สที่เปิดกว้างที่สุด

ผู้คนคิดว่า DeepSeek เป็นเพียงแรงกระเพื่อมครั้งเดียว แต่เรากลับมาอย่างยิ่งใหญ่กว่าเดิมมาก

Chen Fang ผู้ร่วมโครงการเขียนบน X และการเปิดตัวครั้งนี้สร้างปฏิกิริยาอย่างรวดเร็วทางออนไลน์ โดยมีผู้ใช้อินเทอร์เน็ตรายหนึ่งโพสต์ว่า "ChatGPT จงไปสู่สุคติ"

DeepSeek Sparse Attention นวัตกรรมลดต้นทุนการประมวลผล

หัวใจสำคัญของการเปิดตัวครั้งนี้คือ DeepSeek Sparse Attention (DSA) สถาปัตยกรรมใหม่ที่ลดต้นทุนการประมวลผลลงอย่างมหาศาล

กลไก Attention แบบดั้งเดิม ซึ่งเป็นเทคโนโลยีสำคัญที่ทำให้โมเดลเข้าใจบริบท มักมีปัญหาเมื่ออินพุตยาวขึ้น เพราะต้องใช้กำลังคำนวณเพิ่มขึ้นแบบทวีคูณ แต่แนวทางของ DeepSeek แก้ข้อจำกัดนี้ด้วยเทคนิค ‘Lightning Indexer’ ที่เลือกเฉพาะบริบทสำคัญที่สุดสำหรับแต่ละคำถาม แทนการประมวลผลทั้งเอกสารเหมือนโมเดลทั่วไป

ผลลัพธ์คือการประมวลผลเอกสารยาว 128,000 โทเคน (ประมาณ 300 หน้า) สามารถลดต้นทุนจากเดิม 2.40 ดอลลาร์ เหลือเพียง 0.70 ดอลลาร์ต่อล้านโทเคน โดยการประเมินระบุว่าถึงจะใช้กลไก Sparse Attention แต่ประสิทธิภาพยังคงเทียบเท่าหรือดีกว่ารุ่นก่อนหน้า

DeepSeek ทัดเทียม GPT-5 และ Gemini-3.0-Pro ด้วยผลคะแนนที่โดดเด่น

DeepSeek เปิดเผยผลการทดสอบที่ชี้ให้เห็นว่าทำผลงานเทียบชั้นหรือเหนือกว่าคู่แข่งจากสหรัฐฯ

AIME 2025 (คณิตศาสตร์): Speciale ทำได้ 96.0% เทียบกับ 94.6% ของ GPT-5-High และ 95.0% ของ Gemini-3.0-Pro
Harvard-MIT Mathematics Tournament (HMMT): Speciale ทำคะแนนได้ 99.2% แซงหน้า Gemini ที่ 97.5%
การแข่งขัน IMO 2025: ทำได้ 35 จาก 42 คะแนน ระดับเหรียญทอง
การแข่งขัน IOI: ทำคะแนน 492 จาก 600 อยู่ในระดับเหรียญทองและติดอันดับที่ 10 เทียบกับมนุษย์
การแข่งขัน ICPC World Finals: แก้โจทย์ได้ 10 จาก 12 ข้อ อยู่ในอันดับที่ 2 เทียบกับมนุษย์
การเขียนโค้ด: DeepSeek-V3.2 แก้บั๊กบน SWE-Verified ได้ 73.1% ใกล้เคียง GPT-5-High ที่ 74.9% และในการวัดการจัดการ Workflow ที่ซับซ้อนบน Terminal Bench 2.0 DeepSeek ทำคะแนนได้ 46.4% ซึ่งสูงกว่า GPT-5-High ที่ 35.2%

อย่างไรก็ตาม บริษัทก็ยอมรับข้อจำกัด โดยระบุว่าโมเดลยังใช้จำนวนโทเคนมากกว่าเพื่อให้ได้คุณภาพคำตอบระดับเดียวกับ Gemini-3.0-Pro

การสอน AI ให้ ‘คิด’ ระหว่างใช้เครื่องมือคือจุดเปลี่ยน

หนึ่งในความก้าวหน้าที่สำคัญคือฟีเจอร์ ‘Thinking in Tool-Use’ ซึ่งช่วยให้โมเดลสามารถคิด วิเคราะห์ และเรียกใช้เครื่องมือภายนอก เช่นรันโค้ดหรือค้นเว็บไปพร้อมกัน โดยไม่สูญเสียตรรกะกลางทาง

โมเดล AI รุ่นก่อนๆ มักมีข้อจำกัดที่น่าหงุดหงิด คือ ทุกครั้งที่เรียกใช้เครื่องมือภายนอก โมเดลจะสูญเสียตรรกะการคิดไป แต่สถาปัตยกรรมใหม่ทำให้ DeepSeek รักษาเธรดการคิดไว้ตลอดงานหลายขั้นตอน ทำให้ทำงาน เช่น วางแผนทริป ค้นข้อมูลเชิงวิจัย หรือแก้บั๊กหลายภาษา ได้ต่อเนื่องและมีเสถียรภาพมากขึ้น

กลยุทธ์ Open-Source ที่อาจเปลี่ยนเกมธุรกิจ AI

สิ่งที่สร้างแรงกระเพื่อมมากที่สุดคือ DeepSeek เลือกปล่อยโมเดลทั้งหมด น้ำหนักโมเดล โค้ดฝึก และเอกสารกำกับบน Hugging Face ให้ใช้งานได้ฟรีโดยไม่มีข้อจำกัดใด ๆ โดยนักพัฒนา นักวิจัย หรือองค์กรสามารถดาวน์โหลด ปรับแต่ง และนำโมเดลขนาด 685,000 ล้านพารามิเตอร์ไปใช้งานได้ทันที

กลยุทธ์นี้ถือเป็นการท้าทายโมเดลธุรกิจของ OpenAI, Anthropic และ Google ที่เรียกเก็บค่าบริการ API ในราคาสูง เพราะสำหรับ DeepSeek แล้ว ลูกค้าสามารถติดตั้งใช้งานเองด้วยต้นทุนที่ต่ำกว่ามาก

กำแพงกฎระเบียบที่เพิ่มขึ้นในยุโรปและอเมริกาที่ยังคงต้องจับตามอง

อย่างไรก็ดี DeepSeek ยังเผชิญแรงต้านจากหน่วยงานกำกับดูแลในยุโรปและสหรัฐฯ ทั้งกรณีคณะกรรมาธิการคุ้มครองข้อมูลของเบอร์ลินระบุว่าการส่งข้อมูลผู้ใช้ไปจีนผิดกฎหมาย โดยขอให้ Apple และ Google พิจารณาบล็อกแอปพลิเคชัน อิตาลีสั่งให้ DeepSeek บล็อกแอปไปแล้วในเดือนกุมภาพันธ์ สมาชิกรัฐสภาสหรัฐฯ ก็พยายามผลักดันการห้ามใช้บริการนี้ในอุปกรณ์ของรัฐบาล โดยอ้างถึงข้อกังวลด้านความมั่นคงแห่งชาติ

นอกจากนี้ยังมีมาตรการควบคุมการส่งออกชิป Nvidia ของสหรัฐฯ ที่มุ่งจำกัดศักยภาพ AI ของจีน แม้ DeepSeek จะยืนยันว่าสามารถทำงานบนชิป Huawei และ Cambricon ที่ผลิตในประเทศได้โดยไม่ต้องตั้งค่าเพิ่มก็ตาม

โมเดล V3 เดิมถูกฝึกด้วยชิป Nvidia H800 จำนวนราว 2,000 ตัว ซึ่งต่อมาถูกจำกัดการส่งออก แม้ DeepSeek ไม่เปิดเผยว่า V3.2 ใช้ฮาร์ดแวร์ใด แต่ความก้าวหน้าที่ต่อเนื่องแสดงให้เห็นว่ามาตรการควบคุมการส่งออกเพียงอย่างเดียวไม่สามารถหยุดยั้งความก้าวหน้าของ AI จีนได้

ยุคใหม่ในโลกการแข่งขันของ AI

การเปิดตัวครั้งนี้สะท้อนว่าการแข่งขัน AI ระหว่างสหรัฐฯ และจีนกำลังก้าวสู่เฟสใหม่ จากเดิมที่แข่งกันด้วยขนาดโมเดลและเงินลงทุน สู่การแข่งขันที่เน้น ประสิทธิภาพ ต้นทุน และความสามารถในการเปิดให้ใช้งาน การที่ DeepSeek เลือกแจกเทคโนโลยีระดับชั้นนำให้ใช้ฟรี อาจทำให้โอเพ่นซอร์สกลับมาเป็นพลังสำคัญในเวที AI ระดับโลกอีกครั้ง

คำถามที่ตามมาจึงไม่ใช่ว่า AI จากจีนแข่งขันได้หรือไม่ แต่คือ บริษัทยักษ์จากสหรัฐฯ จะรักษาความเป็นผู้นำไว้ได้อย่างไร เมื่อคู่แข่งเลือกแจกเทคโนโลยีระดับแนวหน้าให้ทุกคนใช้งานได้ฟรี

อ้างอิง: VentureBeat

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

เข้าสู่ระบบ
ลงทะเบียน

ลืมรหัสผ่าน?

มีบัญชีแล้วหรือยัง ?

มีบัญชีอยู่แล้ว ?

No comment

ไทยพร้อมแล้ว เป็นเจ้าภาพ 'โอลิมปิกทางการเงิน' รองนายกฯ - ผู้ว่า ธปท. อัปเดต 3 เดือนก่อนงาน IMF-World Bank Annual Meetings 2026

กระทรวงการคลังและธนาคารแห่งประเทศไทย (ธปท.) แถลงความพร้อมอย่างเป็นทางการ ในการเป็นเจ้าภาพจัด 'การประชุมประจำปีสภาผู้ว่าการกองทุนการเงินระหว่างประเทศและกลุ่มธนาคารโลก ปี 2569' หรือ ...

กรกฎาคม 14, 2026 | By Techsauce Team

News

IMF

IMF-World Bank Annual Meetings 2026

อวท. ดันสตาร์ทอัพไทยไปตลาดโลก เปิดตัว ‘TSP Scale X Landing Program’ เปิดทางสตาร์ทอัพไทยโตข้ามพรมแดน พร้อมปูทางสตาร์ทอัพต่างชาติเข้าสู่ไทยและอาเซียน

อวท. โดย สวทช. เปิดตัว TSP Scale X Landing Program เชื่อมสตาร์ทอัพไทยสู่ตลาดโลก พร้อมสนับสนุนสตาร์ทอัพต่างชาติเข้าสู่ตลาดไทยและอาเซียน ผ่านเครือข่ายงานวิจัย ภาคอุตสาหกรรม นักลงทุน ...

กรกฎาคม 13, 2026 | By Techsauce Team

บอร์ดบีโอไอ ปรับทิศทางส่งเสริมการลงทุนยุคใหม่ ชูเทคโนโลยี คน และซัพพลายเชนไทย

บอร์ดบีโอไอ หรือคณะกรรมการส่งเสริมการลงทุน ปรับทิศทางและบทบาทการส่งเสริมการลงทุนของประเทศไทยครั้งใหญ่ โดยวางเป้าหมายใหม่ให้เม็ดเงินลงทุนที่ดึงเข้ามาต้องสร้างมูลค่าเพิ่มจริงและกระจา...

กรกฎาคม 13, 2026 | By Techsauce Team

News

BOI