แอบเปิดตัว DeepSeek V3.1 โมเดลโอเพ่นซอร์สจากจีน ที่ออกมาแข่ง GPT-5 ตัวล่าสุด

ตอนนี้ทั่วโลกกำลังจับตา DeepSeek สตาร์ทอัพจากหางโจว ประเทศจีน ที่ล่าสุดปล่อย DeepSeek V3.1 โมเดลใหม่ที่หลายคนยกให้เป็นหนึ่งในระบบ AI ที่ทรงพลังที่สุดในตอนนี้ จุดที่ทำให้หลายฝ่ายประหลาดใจก็คือ บริษัทเลือกเปิดตัวแบบเงียบ ๆ เพียงอัปโหลดขึ้นแพลตฟอร์ม Hugging Face โดยไม่มีงานแถลงข่าวใหญ่โต แต่กลับสร้างกระแสในชุมชน AI ไปทั่วโลก

สิ่งที่ทำให้ V3.1 น่าจับตามีทั้ง พลังการประมวลผลระดับท็อป และ การเปิดให้ใช้งานแบบโอเพ่นซอร์ส ซึ่งแตกต่างจากโมเดลของสหรัฐฯ อย่าง OpenAI หรือ Anthropic ที่ยังคงเป็นระบบปิด ต้องเข้าผ่าน API และมีค่าใช้จ่ายสูง

ทำไม DeepSeek V3.1 ถึงสะเทือนโลกอีกครั้ง ?

หนึ่งในจุดแข็งที่ทำให้ DeepSeek V3.1 ถูกพูดถึงอย่างมากคือ พลังการประมวลผลมหาศาล โมเดลนี้ถูกออกแบบด้วยพารามิเตอร์มากถึง 685,000 ล้านตัว ซึ่งถือว่ามากกว่าหลายโมเดลชื่อดังจากสหรัฐฯ จุดเด่นอีกอย่างคือการรองรับ context window ขนาด 128k หรือความสามารถในการประมวลผลข้อมูลที่ยาวเท่ากับหนังสือกว่า 400 หน้าในครั้งเดียว ซึ่งช่วยให้ AI เข้าใจบริบทที่ซับซ้อนและต่อเนื่องได้ดีกว่าเดิม

นอกจากพลังการประมวลผลแล้ว V3.1 ยังมีจุดแข็งด้านความเร็วในการตอบสนอง โดยทั่วไปแล้ว AI ที่เน้นการใช้เหตุผลเชิงลึกมักใช้เวลาหลายนาทีในการประมวลผลคำสั่งที่ซับซ้อน แต่ DeepSeek V3.1 สามารถให้คำตอบได้เร็วกว่ามาก จุดนี้ทำให้มันเหมาะสำหรับการใช้งานจริงที่ต้องการผลลัพธ์ทันที เช่น แชตบอทบริการลูกค้า หรือแพลตฟอร์มช่วยเขียนโค้ด

และอีกสิ่งที่สร้างความแตกต่างคือเรื่องต้นทุน งานโค้ดดิ้ง 1 ครั้งบน V3.1 ใช้เงินเพียง 1 ดอลลาร์สหรัฐฯ ในขณะที่คู่แข่งบางรายมีต้นทุนสูงถึงเกือบ 70 ดอลลาร์สหรัฐฯ หากเป็นองค์กรขนาดใหญ่ที่มีการประมวลผลหลายพันครั้งต่อวัน ความแตกต่างนี้อาจหมายถึงการประหยัดงบประมาณได้หลายล้านดอลลาร์สหรัฐฯ ต่อปี

และที่สำคัญที่สุดคือ สถาปัตยกรรมแบบ Hybrid ที่ DeepSeek พัฒนาขึ้นมา เพราะมันสามารถผสานการสนทนา การให้เหตุผล และการเขียนโค้ดไว้ในโมเดลเดียวอย่างลงตัว ต่างจากความพยายามในอดีตของหลายบริษัทที่เมื่อรวมหลายความสามารถแล้วกลับทำให้ประสิทธิภาพโดยรวมตกลง แต่ DeepSeek V3.1 แก้จุดอ่อนนี้ได้สำเร็จ กลายเป็นโมเดลที่ครบเครื่องในการใช้งานจริง

กลยุทธ์ที่แตกต่างคือ โอเพ่นซอร์สเต็มรูปแบบ

ขณะที่ฝั่งสหรัฐฯ อย่าง OpenAI เลือกเปิดให้เข้าถึงโมเดลแบบจำกัดและต้องเสียเงิน DeepSeek กลับใช้แนวทางตรงข้ามคือ ปล่อยโมเดลให้ดาวน์โหลดไปใช้ได้เลย นี่ไม่ใช่แค่การตัดสินใจด้านธุรกิจ แต่เป็นการส่งสัญญาณเชิงยุทธศาสตร์ว่า จีนมอง AI เป็นสินค้าสาธารณะที่ควรเปิดให้คนเข้าถึงเพื่อเร่งนวัตกรรม ขณะที่สหรัฐฯ มองว่า AI เป็นทรัพย์สินที่ต้องปกป้องและสร้างรายได้

หลังอัปโหลดขึ้น Hugging Face ไม่กี่ชั่วโมง DeepSeek V3.1 ก็พุ่งขึ้นอันดับความนิยม นักพัฒนาและนักวิจัยทั่วโลกรีบดาวน์โหลดมาทดสอบ พบว่า:

  • ทำคะแนน 71.6% บน Aider benchmark สูงกว่าบางโมเดลชั้นนำ เช่น Claude Opus 4 ของ Anthropic
  • มีนักวิจัยพบว่า DeepSeek ฝังโทเคนพิเศษที่เปิดทางให้ใช้งานฟังก์ชันใหม่ ๆ เช่น การเชื่อมต่อเว็บแบบเรียลไทม์ หรือการประมวลผลเหตุผลภายในที่ลึกขึ้น
  • นักพัฒนาชื่นชมเพราะเป็นคุณภาพระดับท็อป แต่เข้าถึงได้ฟรี ต่างจากระบบปิดที่มีข้อจำกัดมากมาย

อ้างอิง: venturebeat, scmp

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Google เปิดตัว Gemini Embedding 2 ผสานข้อความ, รูปภาพ, วิดีโอ จบใน API เดียว หมดปัญหาประมวลผลข้อมูลหลายแบบ

Google เปิดตัว Gemini Embedding 2 โมเดล AI มัลติโมดัลสุดล้ำที่ผสานข้อความ รูปภาพ วิดีโอ เสียง และ PDF ไว้ในที่เดียว ตอบโจทย์ระบบ RAG และ Semantic Search...

Responsive image

Meta เข้าซื้อ Moltbook แล้ว! โซเชียลมีเดียที่มีแต่ AI ใช้คุยกัน เพราะต้องการ ‘ซื้อเพื่อดึงตัวคนเก่ง’ หลัง OpenAI ตัดหน้าดึงตัวทีม Openclaw

เมื่อมีข่าวออกมาว่า Meta บริษัทยักษ์ใหญ่ด้านโซเชียลมีเดียได้เข้าซื้อกิจการ Moltbook ซึ่งเป็นโซเชียลเน็ตเวิร์กสำหรับ ‘AI Agent’ หรือบอท AI หลายคนอาจจะเกิดความสงสัยว่า บริษัทที่ทำรา...

Responsive image

เปิดตัวชิป Meta ทำความรู้จัก MTIA ขุมพลัง AI รุ่นใหม่ที่แรงกว่า GPU ทั่วไป

เจาะลึกกลยุทธ์ Meta เปิดตัวชิป AI ตระกูล MTIA 4 รุ่นรวด! ชูจุดเด่นสถาปัตยกรรม ASIC ที่ออกแบบมาเพื่องานเฉพาะทางโดยเฉพาะ "ตัดส่วนเกิน เพิ่มส่วนแรง" กินไฟน้อยลงแต่ทรงพลังกว่า GPU ทั่ว...