Sonnet 4.6 มาแล้ว โมเดลพื้นฐาน ‘เก่งใกล้เรือธง’

วงการ AI เดือดอีกครั้ง! เมื่อ Anthropic ยักษ์ใหญ่คู่แข่งเบอร์ต้นของ OpenAI ประกาศเปิดตัวโมเดลรุ่นอัปเกรดใหม่ล่าสุด Claude Sonnet 4.6 ซึ่งเป็นการเดินเกมตามโร้ดแมป อัปเกรดทุก 4 เดือน 

โดยรอบนี้ไม่ได้มาเพียงแค่การปรับปรุงเล็กน้อย แต่เป็นการยกเครื่องทักษะการเขียนโค้ด การทำความเข้าใจบริบทที่ยาวมหาศาล และความสามารถในการสั่งการคอมพิวเตอร์ที่แม่นยำจนน่าตกใจ อาทิ

1M Context Window อ่านจบทั้งโปรเจกต์ในคำสั่งเดียว

ไฮไลท์ที่สั่นสะเทือนวงการที่สุดคือการเปิดตัว Context Window ขนาด 1 ล้านทอเค็น (ในเวอร์ชัน Beta) ซึ่งใหญ่กว่าเดิมถึง 2 เท่า

ทำไมต้องตื่นเต้น ? ลองจินตนาการว่าคุณสามารถโยนซอร์สโค้ดทั้งโปรเจกต์, สัญญาทางกฎหมายหนาปึกหลายสิบฉบับ หรืองานวิจัยเป็นกอง เข้าไปในคำสั่งเดียว แล้วให้ AI วิเคราะห์หาจุดบกพร่องหรือสรุปประเด็นสำคัญได้ทันทีโดยที่ข้อมูลไม่หลุด

ที่สำคัญ Sonnet 4.6 ยังโชว์ทักษะ Long-context Reasoning หรือการใช้เหตุผลท่ามกลางข้อมูลมหาศาลได้ดีเยี่ยม ไม่ใช่แค่จำได้ แต่เข้าใจความเชื่อมโยงของข้อมูลทั้งหมด

Computer Use ไม่ได้แค่ตอบแชท แต่ขยับเมาส์-พิมพ์งานแทนเรา

Anthropic ตอกย้ำความเป็นผู้นำด้าน Agentic Workflow ด้วยการอัปเกรดความสามารถ Computer Use ให้ก้าวข้ามขีดจำกัดเดิม ๆ ผลทดสอบ OSWorld พบว่า Sonnet 4.6 ทำคะแนนทุบสถิติโลกในการสั่งการคอมพิวเตอร์จำลอง ไม่ว่าจะเป็นการเปิด Chrome, ใช้ LibreOffice หรือเขียนโค้ดใน VS Code

ผู้ใช้กลุ่มแรกรายงานว่ามันสามารถกรอกฟอร์มเว็บที่ซับซ้อน หรือดึงข้อมูลข้าม Browser หลาย ๆ Tab มาสรุปใน Spreadsheet ได้เนียนระดับเดียวกับคนทำ นั่นหมายความว่า ต่อไปนี้องค์กรที่มีซอฟต์แวร์ยุคเก่าที่ไม่มี API ก็สามารถใช้ Claude เข้าไปสั่งงานผ่านหน้าจอได้เหมือนพนักงานคนหนึ่งเลยทีเดียว ถือเป็นจุดเปลี่ยนสำคัญสำหรับองค์กรที่ต้องการระบบอัตโนมัติมาช่วยทำงานในซอฟต์แวร์ที่ไม่มีระบบ API รองรับ

ฉลาดเทียบชั้นรุ่นท็อป

สิ่งที่น่าทึ่งคือ Sonnet 4.6 ซึ่งเป็นโมเดลระดับกลางกลับทำคะแนน Benchmark ได้สูงจนเบียดรุ่นเรือธง ของค่ายอื่น ๆ เช่น

  1. ARC-AGI-2 ได้คะแนน 60.4% ซึ่งเน้นวัดทักษะการเรียนรู้สิ่งใหม่ (General Intelligence) แบบมนุษย์ แซงหน้าคู่แข่งเกือบทุกรายในตลาด (แม้จะยังตามหลังรุ่นพี่อย่าง Opus 4.6 หรือ Gemini 3 Deep Think อยู่เล็กน้อย)
  2. SWE-Bench ยืนหนึ่งในด้านวิศวกรรมซอฟต์แวร์

จากการทดสอบใช้งานจริง นักพัฒนากว่า 70% เทใจให้ Sonnet 4.6 มากกว่ารุ่น 4.5 เพราะหมดปัญหา AI ขี้เกียจสั่งแล้วไม่ทำ หรือทำแบบครึ่ง ๆ กลาง ๆ

รวมถึงในการทดสอบบริหารธุรกิจจำลอง Claude โชว์กึ๋นด้วยการยอมลงทุนหนักในช่วง 10 เดือนแรกเพื่อขยายกิจการ ก่อนจะสวิตช์มาทำกำไรเน้น ๆ ในช่วงสุดท้าย ซึ่งเป็นกลยุทธ์ที่ล้ำลึกกว่า AI ทั่วไป

และงานสาย Frontend และงานดีไซน์ออกมาดูดีกว่าเดิมมาก ทั้ง Layout และ Animation มีความรู้สึกของความเป็นมืออาชีพมากขึ้น

อย่างไรก็ตาม การเปิดตัวครั้งนี้มาพร้อมกับความระมัดระวังด้านความปลอดภัยอย่างเข้มงวด Anthropic ระบุว่าได้ผ่านการประเมินความปลอดภัยตามนโยบาย Responsible Scaling Policy โดยพบว่าโมเดลมีพฤติกรรมที่ซื่อสัตย์และเป็นมิตรมากขึ้น รวมถึงมีความแข็งแกร่งในการต้านทานการโจมตีประเภท Prompt Injection ที่อาจแฝงมากับคำสั่งบนเว็บไซต์ภายนอก ซึ่งถือเป็นความเสี่ยงหลักของการปล่อยให้ AI เข้าถึงระบบคอมพิวเตอร์

สำหรับผู้ใช้ที่สดใจใช้โมเดล Claude Sonnet 4.6 

Anthropic ได้ยึดให้เป็นโมเดลพื้นฐานสำหรับผู้ใช้งานแผน Free และ Pro บนหน้าเว็บไซต์ Claude.ai และแอปพลิเคชันมือถือตั้งแต่วันนี้เป็นต้นไป 

ขณะที่กลุ่มลูกค้าองค์กรที่ใช้งานผ่าน API ยังคงได้รับข้อเสนอราคาเดิมที่ $3 ต่อล้านโทเค็นสำหรับ Input และ $15 สำหรับ Output ซึ่งทาง Anthropic มั่นใจว่า Sonnet 4.6 คือ จุดสมดุลใหม่ที่ให้ทั้งความฉลาดระดับแนวหน้าในราคาที่คุ้มค่าสำหรับธุรกิจทุกระดับ

การเปิดตัว Sonnet 4.6 เกิดขึ้นเพียงไม่กี่สัปดาห์หลังจากการปล่อย Opus 4.6 รุ่นท็อปออกสู่ตลาด ซึ่งแสดงให้เห็นถึงความเร็วในการพัฒนาของ Anthropic ที่ต้องการครองตำแหน่งผู้นำในตลาด AI Agent และงานด้านวิศวกรรมซอฟต์แวร์อย่างเต็มตัวในปี 2026 นี้

อ้างอิง: anthropic, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

จีนประกาศวาระแห่งชาติ ชูธง Employment-First สร้างตำแหน่งงานใหม่ให้ประชาชน เป้าหมายคือ ลดการว่างงานยุค AI

เจาะลึกยุทธศาสตร์ Employment-First ของจีน พลิกวิกฤตคนว่างงานพุ่ง ด้วยการเปลี่ยนเทคโนโลยี AI ให้กลายเป็นผู้สร้างงานพร้อมดันเศรษฐกิจทางทะเลเป็นขุมทรัพย์ใหม่...

Responsive image

HBR เตือนองค์กรที่ใช้ AI แบบสุดทาง ระวัง 'งานสวยแต่ข้างในกลวง'

ช่วงนี้หลายบริษัทพยายามนำ AI เข้ามาช่วยทำงาน เพราะหวังว่าจะช่วยลดต้นทุนและทำให้งานเสร็จไวขึ้น แต่ผลลัพธ์ที่ได้กลับไม่ได้สวยอย่างที่คิด...

Responsive image

นอร์เวย์สั่งแบน AI ในชั้นประถม หวั่นเด็กข้ามขั้นการเรียนรู้ หลังเด็กนอร์เวย์ 1 ใน 4 อ่านหนังสือไม่ผ่านเกณฑ์

รัฐบาลนอร์เวย์สั่งถอดปัญญาประดิษฐ์ออกจากชั้นประถมแทบทั้งหมด เริ่มเปิดเทอมสิงหาคม 2026 หลังพบเด็ก 1 ใน 4 อ่านหนังสือไม่ผ่านเกณฑ์ OECD และบทเรียนจากการแจก iPad ปี 2016 พร้อมแบ่งการใช...