Sonnet 4.6 มาแล้ว โมเดลพื้นฐาน ‘เก่งใกล้เรือธง’

วงการ AI เดือดอีกครั้ง! เมื่อ Anthropic ยักษ์ใหญ่คู่แข่งเบอร์ต้นของ OpenAI ประกาศเปิดตัวโมเดลรุ่นอัปเกรดใหม่ล่าสุด Claude Sonnet 4.6 ซึ่งเป็นการเดินเกมตามโร้ดแมป อัปเกรดทุก 4 เดือน 

โดยรอบนี้ไม่ได้มาเพียงแค่การปรับปรุงเล็กน้อย แต่เป็นการยกเครื่องทักษะการเขียนโค้ด การทำความเข้าใจบริบทที่ยาวมหาศาล และความสามารถในการสั่งการคอมพิวเตอร์ที่แม่นยำจนน่าตกใจ อาทิ

1M Context Window อ่านจบทั้งโปรเจกต์ในคำสั่งเดียว

ไฮไลท์ที่สั่นสะเทือนวงการที่สุดคือการเปิดตัว Context Window ขนาด 1 ล้านทอเค็น (ในเวอร์ชัน Beta) ซึ่งใหญ่กว่าเดิมถึง 2 เท่า

ทำไมต้องตื่นเต้น ? ลองจินตนาการว่าคุณสามารถโยนซอร์สโค้ดทั้งโปรเจกต์, สัญญาทางกฎหมายหนาปึกหลายสิบฉบับ หรืองานวิจัยเป็นกอง เข้าไปในคำสั่งเดียว แล้วให้ AI วิเคราะห์หาจุดบกพร่องหรือสรุปประเด็นสำคัญได้ทันทีโดยที่ข้อมูลไม่หลุด

ที่สำคัญ Sonnet 4.6 ยังโชว์ทักษะ Long-context Reasoning หรือการใช้เหตุผลท่ามกลางข้อมูลมหาศาลได้ดีเยี่ยม ไม่ใช่แค่จำได้ แต่เข้าใจความเชื่อมโยงของข้อมูลทั้งหมด

Computer Use ไม่ได้แค่ตอบแชท แต่ขยับเมาส์-พิมพ์งานแทนเรา

Anthropic ตอกย้ำความเป็นผู้นำด้าน Agentic Workflow ด้วยการอัปเกรดความสามารถ Computer Use ให้ก้าวข้ามขีดจำกัดเดิม ๆ ผลทดสอบ OSWorld พบว่า Sonnet 4.6 ทำคะแนนทุบสถิติโลกในการสั่งการคอมพิวเตอร์จำลอง ไม่ว่าจะเป็นการเปิด Chrome, ใช้ LibreOffice หรือเขียนโค้ดใน VS Code

ผู้ใช้กลุ่มแรกรายงานว่ามันสามารถกรอกฟอร์มเว็บที่ซับซ้อน หรือดึงข้อมูลข้าม Browser หลาย ๆ Tab มาสรุปใน Spreadsheet ได้เนียนระดับเดียวกับคนทำ นั่นหมายความว่า ต่อไปนี้องค์กรที่มีซอฟต์แวร์ยุคเก่าที่ไม่มี API ก็สามารถใช้ Claude เข้าไปสั่งงานผ่านหน้าจอได้เหมือนพนักงานคนหนึ่งเลยทีเดียว ถือเป็นจุดเปลี่ยนสำคัญสำหรับองค์กรที่ต้องการระบบอัตโนมัติมาช่วยทำงานในซอฟต์แวร์ที่ไม่มีระบบ API รองรับ

ฉลาดเทียบชั้นรุ่นท็อป

สิ่งที่น่าทึ่งคือ Sonnet 4.6 ซึ่งเป็นโมเดลระดับกลางกลับทำคะแนน Benchmark ได้สูงจนเบียดรุ่นเรือธง ของค่ายอื่น ๆ เช่น

  1. ARC-AGI-2 ได้คะแนน 60.4% ซึ่งเน้นวัดทักษะการเรียนรู้สิ่งใหม่ (General Intelligence) แบบมนุษย์ แซงหน้าคู่แข่งเกือบทุกรายในตลาด (แม้จะยังตามหลังรุ่นพี่อย่าง Opus 4.6 หรือ Gemini 3 Deep Think อยู่เล็กน้อย)
  2. SWE-Bench ยืนหนึ่งในด้านวิศวกรรมซอฟต์แวร์

จากการทดสอบใช้งานจริง นักพัฒนากว่า 70% เทใจให้ Sonnet 4.6 มากกว่ารุ่น 4.5 เพราะหมดปัญหา AI ขี้เกียจสั่งแล้วไม่ทำ หรือทำแบบครึ่ง ๆ กลาง ๆ

รวมถึงในการทดสอบบริหารธุรกิจจำลอง Claude โชว์กึ๋นด้วยการยอมลงทุนหนักในช่วง 10 เดือนแรกเพื่อขยายกิจการ ก่อนจะสวิตช์มาทำกำไรเน้น ๆ ในช่วงสุดท้าย ซึ่งเป็นกลยุทธ์ที่ล้ำลึกกว่า AI ทั่วไป

และงานสาย Frontend และงานดีไซน์ออกมาดูดีกว่าเดิมมาก ทั้ง Layout และ Animation มีความรู้สึกของความเป็นมืออาชีพมากขึ้น

อย่างไรก็ตาม การเปิดตัวครั้งนี้มาพร้อมกับความระมัดระวังด้านความปลอดภัยอย่างเข้มงวด Anthropic ระบุว่าได้ผ่านการประเมินความปลอดภัยตามนโยบาย Responsible Scaling Policy โดยพบว่าโมเดลมีพฤติกรรมที่ซื่อสัตย์และเป็นมิตรมากขึ้น รวมถึงมีความแข็งแกร่งในการต้านทานการโจมตีประเภท Prompt Injection ที่อาจแฝงมากับคำสั่งบนเว็บไซต์ภายนอก ซึ่งถือเป็นความเสี่ยงหลักของการปล่อยให้ AI เข้าถึงระบบคอมพิวเตอร์

สำหรับผู้ใช้ที่สดใจใช้โมเดล Claude Sonnet 4.6 

Anthropic ได้ยึดให้เป็นโมเดลพื้นฐานสำหรับผู้ใช้งานแผน Free และ Pro บนหน้าเว็บไซต์ Claude.ai และแอปพลิเคชันมือถือตั้งแต่วันนี้เป็นต้นไป 

ขณะที่กลุ่มลูกค้าองค์กรที่ใช้งานผ่าน API ยังคงได้รับข้อเสนอราคาเดิมที่ $3 ต่อล้านโทเค็นสำหรับ Input และ $15 สำหรับ Output ซึ่งทาง Anthropic มั่นใจว่า Sonnet 4.6 คือ จุดสมดุลใหม่ที่ให้ทั้งความฉลาดระดับแนวหน้าในราคาที่คุ้มค่าสำหรับธุรกิจทุกระดับ

การเปิดตัว Sonnet 4.6 เกิดขึ้นเพียงไม่กี่สัปดาห์หลังจากการปล่อย Opus 4.6 รุ่นท็อปออกสู่ตลาด ซึ่งแสดงให้เห็นถึงความเร็วในการพัฒนาของ Anthropic ที่ต้องการครองตำแหน่งผู้นำในตลาด AI Agent และงานด้านวิศวกรรมซอฟต์แวร์อย่างเต็มตัวในปี 2026 นี้

อ้างอิง: anthropic, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ทำไมบางคนเลือกยุติการตั้งครรภ์​ ? เปิดอินไซต์ 12,000 เคส จาก ‘พักใจคลินิก’ ดาต้าใหม่ที่ได้จาก Telemedicine สะท้อนถึงวิกฤตเด็กเกิดใหม่ในไทย

ปี 2568 ประเทศไทยมีเด็กเกิดใหม่ 416,574 คน ต่ำสุดในรอบ 75 ปี ตัวเลขนี้ทำให้ทั้งภาครัฐและเอกชนพยายามตอบคำถามเดิมซ้ำกันว่า 'ทำไมคนไทยไม่อยากมีลูก ?' แล้วออกมาตรการกระตุ้นการมีบุตร ลด...

Responsive image

ทำไม Formula 1 ถึงเป็นสถานที่ดีลธุรกิจแห่งใหม่ของ Startup และนักลงทุน

ไม่กี่ปีที่ผ่านมา F1 ได้กลายเป็นอีกหนึ่ง ‘ศูนย์กลางธุรกิจ’ ของโลกเทคโนโลยี สตาร์ทอัพ นักลงทุน ไปจนถึงบริษัท AI และ Cloud รายใหญ่ของโลก...

Responsive image

นักวิจัยพัฒนา ‘เครื่องช่วยฟัง’ ใช้คลื่นสมองเลือกเสียงพูด ช่วยแยกเสียงในที่คนคุยพร้อมกัน นวัตกรรมเพื่อผู้มีปัญหาการได้ยิน

นักวิจัยจาก Columbia University พัฒนาเครื่องช่วยฟังรุ่นใหม่ได้สำเร็จ โดยระบบจะสามารถรับรู้ได้เองว่าผู้สวมใส่กำลังตั้งใจฟังใครอยู่ จากนั้นจะค่อยๆ ดึงเสียงขนั้นให้ชัดขึ้นโดยอัตโนมัติ...