แอบเปิดตัว DeepSeek V3.1 โมเดลโอเพ่นซอร์สจากจีน ที่ออกมาแข่ง GPT-5 ตัวล่าสุด

ตอนนี้ทั่วโลกกำลังจับตา DeepSeek สตาร์ทอัพจากหางโจว ประเทศจีน ที่ล่าสุดปล่อย DeepSeek V3.1 โมเดลใหม่ที่หลายคนยกให้เป็นหนึ่งในระบบ AI ที่ทรงพลังที่สุดในตอนนี้ จุดที่ทำให้หลายฝ่ายประหลาดใจก็คือ บริษัทเลือกเปิดตัวแบบเงียบ ๆ เพียงอัปโหลดขึ้นแพลตฟอร์ม Hugging Face โดยไม่มีงานแถลงข่าวใหญ่โต แต่กลับสร้างกระแสในชุมชน AI ไปทั่วโลก

สิ่งที่ทำให้ V3.1 น่าจับตามีทั้ง พลังการประมวลผลระดับท็อป และ การเปิดให้ใช้งานแบบโอเพ่นซอร์ส ซึ่งแตกต่างจากโมเดลของสหรัฐฯ อย่าง OpenAI หรือ Anthropic ที่ยังคงเป็นระบบปิด ต้องเข้าผ่าน API และมีค่าใช้จ่ายสูง

ทำไม DeepSeek V3.1 ถึงสะเทือนโลกอีกครั้ง ?

หนึ่งในจุดแข็งที่ทำให้ DeepSeek V3.1 ถูกพูดถึงอย่างมากคือ พลังการประมวลผลมหาศาล โมเดลนี้ถูกออกแบบด้วยพารามิเตอร์มากถึง 685,000 ล้านตัว ซึ่งถือว่ามากกว่าหลายโมเดลชื่อดังจากสหรัฐฯ จุดเด่นอีกอย่างคือการรองรับ context window ขนาด 128k หรือความสามารถในการประมวลผลข้อมูลที่ยาวเท่ากับหนังสือกว่า 400 หน้าในครั้งเดียว ซึ่งช่วยให้ AI เข้าใจบริบทที่ซับซ้อนและต่อเนื่องได้ดีกว่าเดิม

นอกจากพลังการประมวลผลแล้ว V3.1 ยังมีจุดแข็งด้านความเร็วในการตอบสนอง โดยทั่วไปแล้ว AI ที่เน้นการใช้เหตุผลเชิงลึกมักใช้เวลาหลายนาทีในการประมวลผลคำสั่งที่ซับซ้อน แต่ DeepSeek V3.1 สามารถให้คำตอบได้เร็วกว่ามาก จุดนี้ทำให้มันเหมาะสำหรับการใช้งานจริงที่ต้องการผลลัพธ์ทันที เช่น แชตบอทบริการลูกค้า หรือแพลตฟอร์มช่วยเขียนโค้ด

และอีกสิ่งที่สร้างความแตกต่างคือเรื่องต้นทุน งานโค้ดดิ้ง 1 ครั้งบน V3.1 ใช้เงินเพียง 1 ดอลลาร์สหรัฐฯ ในขณะที่คู่แข่งบางรายมีต้นทุนสูงถึงเกือบ 70 ดอลลาร์สหรัฐฯ หากเป็นองค์กรขนาดใหญ่ที่มีการประมวลผลหลายพันครั้งต่อวัน ความแตกต่างนี้อาจหมายถึงการประหยัดงบประมาณได้หลายล้านดอลลาร์สหรัฐฯ ต่อปี

และที่สำคัญที่สุดคือ สถาปัตยกรรมแบบ Hybrid ที่ DeepSeek พัฒนาขึ้นมา เพราะมันสามารถผสานการสนทนา การให้เหตุผล และการเขียนโค้ดไว้ในโมเดลเดียวอย่างลงตัว ต่างจากความพยายามในอดีตของหลายบริษัทที่เมื่อรวมหลายความสามารถแล้วกลับทำให้ประสิทธิภาพโดยรวมตกลง แต่ DeepSeek V3.1 แก้จุดอ่อนนี้ได้สำเร็จ กลายเป็นโมเดลที่ครบเครื่องในการใช้งานจริง

กลยุทธ์ที่แตกต่างคือ โอเพ่นซอร์สเต็มรูปแบบ

ขณะที่ฝั่งสหรัฐฯ อย่าง OpenAI เลือกเปิดให้เข้าถึงโมเดลแบบจำกัดและต้องเสียเงิน DeepSeek กลับใช้แนวทางตรงข้ามคือ ปล่อยโมเดลให้ดาวน์โหลดไปใช้ได้เลย นี่ไม่ใช่แค่การตัดสินใจด้านธุรกิจ แต่เป็นการส่งสัญญาณเชิงยุทธศาสตร์ว่า จีนมอง AI เป็นสินค้าสาธารณะที่ควรเปิดให้คนเข้าถึงเพื่อเร่งนวัตกรรม ขณะที่สหรัฐฯ มองว่า AI เป็นทรัพย์สินที่ต้องปกป้องและสร้างรายได้

หลังอัปโหลดขึ้น Hugging Face ไม่กี่ชั่วโมง DeepSeek V3.1 ก็พุ่งขึ้นอันดับความนิยม นักพัฒนาและนักวิจัยทั่วโลกรีบดาวน์โหลดมาทดสอบ พบว่า:

  • ทำคะแนน 71.6% บน Aider benchmark สูงกว่าบางโมเดลชั้นนำ เช่น Claude Opus 4 ของ Anthropic
  • มีนักวิจัยพบว่า DeepSeek ฝังโทเคนพิเศษที่เปิดทางให้ใช้งานฟังก์ชันใหม่ ๆ เช่น การเชื่อมต่อเว็บแบบเรียลไทม์ หรือการประมวลผลเหตุผลภายในที่ลึกขึ้น
  • นักพัฒนาชื่นชมเพราะเป็นคุณภาพระดับท็อป แต่เข้าถึงได้ฟรี ต่างจากระบบปิดที่มีข้อจำกัดมากมาย

อ้างอิง: venturebeat, scmp

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Meta พลิกเกมโซเชียล สร้างหน้าฟีดยุคใหม่ ‘AI Social Feeds’ AI สร้างคอนเทนต์ให้ดูเอง เจาะจงตามความสนใจ ไม่มีซ้ำ เลื่อนได้ไม่รู้จบ

Meta พลิกโฉมโซเชียลมีเดีย สู่ยุค 'AI Social Feeds' เมื่อหน้าฟีดไม่ได้แค่จัดเรียงโพสต์ แต่ AI สามารถสร้างคอนเทนต์ใหม่ขึ้นมาเฉพาะบุคคลแบบ On-demand เปิดอนาคตโซเชียลที่สดใหม่ เลื่อนได...

Responsive image

มากกว่าแค่กระเป๋า แต่นี่คือ ‘บ้านเคลื่อนที่’ สำหรับคนไร้บ้าน ใบเดียวครบที่พัก แหล่งไฟและอุปกรณ์กู้ชีพ

นักศึกษาในซานฟรานซิสโกออกแบบกระเป๋าเป้โซลาร์เซลล์เพื่อช่วยเหลือผู้ไร้บ้าน โดยกระเป๋าสามารถทำหน้าที่เป็นทั้งที่พักชั่วคราว แหล่งพลังงานไฟฟ้าและชุดสิ่งของจำเป็นพื้นฐาน...

Responsive image

ไม่ต้องเขียนโค้ดก็สร้างเกมได้! Google เปิดตัว Project Genie เนรมิตโลก 3D ที่เดินเล่นได้จริงผ่าน AI

ทำความรู้จัก Project Genie จาก Google DeepMind นวัตกรรมสร้างโลกเสมือนแบบโต้ตอบได้ด้วย AI ขับเคลื่อนโดยโมเดลโลก Genie 3 และ Nano Banana Pro เปิดประสบการณ์สร้างโลกจากข้อความและรูปภาพ...