Sonnet 4.6 มาแล้ว โมเดลพื้นฐาน ‘เก่งใกล้เรือธง’

วงการ AI เดือดอีกครั้ง! เมื่อ Anthropic ยักษ์ใหญ่คู่แข่งเบอร์ต้นของ OpenAI ประกาศเปิดตัวโมเดลรุ่นอัปเกรดใหม่ล่าสุด Claude Sonnet 4.6 ซึ่งเป็นการเดินเกมตามโร้ดแมป อัปเกรดทุก 4 เดือน 

โดยรอบนี้ไม่ได้มาเพียงแค่การปรับปรุงเล็กน้อย แต่เป็นการยกเครื่องทักษะการเขียนโค้ด การทำความเข้าใจบริบทที่ยาวมหาศาล และความสามารถในการสั่งการคอมพิวเตอร์ที่แม่นยำจนน่าตกใจ อาทิ

1M Context Window อ่านจบทั้งโปรเจกต์ในคำสั่งเดียว

ไฮไลท์ที่สั่นสะเทือนวงการที่สุดคือการเปิดตัว Context Window ขนาด 1 ล้านทอเค็น (ในเวอร์ชัน Beta) ซึ่งใหญ่กว่าเดิมถึง 2 เท่า

ทำไมต้องตื่นเต้น ? ลองจินตนาการว่าคุณสามารถโยนซอร์สโค้ดทั้งโปรเจกต์, สัญญาทางกฎหมายหนาปึกหลายสิบฉบับ หรืองานวิจัยเป็นกอง เข้าไปในคำสั่งเดียว แล้วให้ AI วิเคราะห์หาจุดบกพร่องหรือสรุปประเด็นสำคัญได้ทันทีโดยที่ข้อมูลไม่หลุด

ที่สำคัญ Sonnet 4.6 ยังโชว์ทักษะ Long-context Reasoning หรือการใช้เหตุผลท่ามกลางข้อมูลมหาศาลได้ดีเยี่ยม ไม่ใช่แค่จำได้ แต่เข้าใจความเชื่อมโยงของข้อมูลทั้งหมด

Computer Use ไม่ได้แค่ตอบแชท แต่ขยับเมาส์-พิมพ์งานแทนเรา

Anthropic ตอกย้ำความเป็นผู้นำด้าน Agentic Workflow ด้วยการอัปเกรดความสามารถ Computer Use ให้ก้าวข้ามขีดจำกัดเดิม ๆ ผลทดสอบ OSWorld พบว่า Sonnet 4.6 ทำคะแนนทุบสถิติโลกในการสั่งการคอมพิวเตอร์จำลอง ไม่ว่าจะเป็นการเปิด Chrome, ใช้ LibreOffice หรือเขียนโค้ดใน VS Code

ผู้ใช้กลุ่มแรกรายงานว่ามันสามารถกรอกฟอร์มเว็บที่ซับซ้อน หรือดึงข้อมูลข้าม Browser หลาย ๆ Tab มาสรุปใน Spreadsheet ได้เนียนระดับเดียวกับคนทำ นั่นหมายความว่า ต่อไปนี้องค์กรที่มีซอฟต์แวร์ยุคเก่าที่ไม่มี API ก็สามารถใช้ Claude เข้าไปสั่งงานผ่านหน้าจอได้เหมือนพนักงานคนหนึ่งเลยทีเดียว ถือเป็นจุดเปลี่ยนสำคัญสำหรับองค์กรที่ต้องการระบบอัตโนมัติมาช่วยทำงานในซอฟต์แวร์ที่ไม่มีระบบ API รองรับ

ฉลาดเทียบชั้นรุ่นท็อป

สิ่งที่น่าทึ่งคือ Sonnet 4.6 ซึ่งเป็นโมเดลระดับกลางกลับทำคะแนน Benchmark ได้สูงจนเบียดรุ่นเรือธง ของค่ายอื่น ๆ เช่น

  1. ARC-AGI-2 ได้คะแนน 60.4% ซึ่งเน้นวัดทักษะการเรียนรู้สิ่งใหม่ (General Intelligence) แบบมนุษย์ แซงหน้าคู่แข่งเกือบทุกรายในตลาด (แม้จะยังตามหลังรุ่นพี่อย่าง Opus 4.6 หรือ Gemini 3 Deep Think อยู่เล็กน้อย)
  2. SWE-Bench ยืนหนึ่งในด้านวิศวกรรมซอฟต์แวร์

จากการทดสอบใช้งานจริง นักพัฒนากว่า 70% เทใจให้ Sonnet 4.6 มากกว่ารุ่น 4.5 เพราะหมดปัญหา AI ขี้เกียจสั่งแล้วไม่ทำ หรือทำแบบครึ่ง ๆ กลาง ๆ

รวมถึงในการทดสอบบริหารธุรกิจจำลอง Claude โชว์กึ๋นด้วยการยอมลงทุนหนักในช่วง 10 เดือนแรกเพื่อขยายกิจการ ก่อนจะสวิตช์มาทำกำไรเน้น ๆ ในช่วงสุดท้าย ซึ่งเป็นกลยุทธ์ที่ล้ำลึกกว่า AI ทั่วไป

และงานสาย Frontend และงานดีไซน์ออกมาดูดีกว่าเดิมมาก ทั้ง Layout และ Animation มีความรู้สึกของความเป็นมืออาชีพมากขึ้น

อย่างไรก็ตาม การเปิดตัวครั้งนี้มาพร้อมกับความระมัดระวังด้านความปลอดภัยอย่างเข้มงวด Anthropic ระบุว่าได้ผ่านการประเมินความปลอดภัยตามนโยบาย Responsible Scaling Policy โดยพบว่าโมเดลมีพฤติกรรมที่ซื่อสัตย์และเป็นมิตรมากขึ้น รวมถึงมีความแข็งแกร่งในการต้านทานการโจมตีประเภท Prompt Injection ที่อาจแฝงมากับคำสั่งบนเว็บไซต์ภายนอก ซึ่งถือเป็นความเสี่ยงหลักของการปล่อยให้ AI เข้าถึงระบบคอมพิวเตอร์

สำหรับผู้ใช้ที่สดใจใช้โมเดล Claude Sonnet 4.6 

Anthropic ได้ยึดให้เป็นโมเดลพื้นฐานสำหรับผู้ใช้งานแผน Free และ Pro บนหน้าเว็บไซต์ Claude.ai และแอปพลิเคชันมือถือตั้งแต่วันนี้เป็นต้นไป 

ขณะที่กลุ่มลูกค้าองค์กรที่ใช้งานผ่าน API ยังคงได้รับข้อเสนอราคาเดิมที่ $3 ต่อล้านโทเค็นสำหรับ Input และ $15 สำหรับ Output ซึ่งทาง Anthropic มั่นใจว่า Sonnet 4.6 คือ จุดสมดุลใหม่ที่ให้ทั้งความฉลาดระดับแนวหน้าในราคาที่คุ้มค่าสำหรับธุรกิจทุกระดับ

การเปิดตัว Sonnet 4.6 เกิดขึ้นเพียงไม่กี่สัปดาห์หลังจากการปล่อย Opus 4.6 รุ่นท็อปออกสู่ตลาด ซึ่งแสดงให้เห็นถึงความเร็วในการพัฒนาของ Anthropic ที่ต้องการครองตำแหน่งผู้นำในตลาด AI Agent และงานด้านวิศวกรรมซอฟต์แวร์อย่างเต็มตัวในปี 2026 นี้

อ้างอิง: anthropic, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

นักวิทย์ฯ MIT ไขปริศนา 2,000 ปี! พบสูตรลับ ‘คอนกรีตโรมัน’ ที่สามารถซ่อมแซมตัวเองได้ ยืนยันหลักฐานจากเหตุการณ์ปอมเปอี

นักวิทย์ MIT ไขความลับคอนกรีตโรมันที่ซ่อมแซมตัวเองได้ ยืนยันด้วยหลักฐานจากปอมเปอี พร้อมเปิดตัวสตาร์ทอัพ DMAT พลิกโฉมวัสดุก่อสร้างด้วยภูมิปัญญาพันปี...

Responsive image

Alibaba เปิดตัว Qwen3.5 เร่งเกม ‘Agentic AI’ เคลมประสิทธิภาพเหนือคู่แข่งสหรัฐฯ พร้อมต้นทุนลดลง 60%

Alibaba เปิดตัว Qwen 3.5 รับยุค Agentic AI ชูจุดเด่นมองเห็นหน้าจอและทำงานข้ามแอปได้ ลดต้นทุน 60% ประสิทธิภาพเพิ่ม 8 เท่า...

Responsive image

บางจาก ประกาศรายได้ปี 68 แตะ 507,570 ล้านบาท พร้อมปิดดีลซื้อ Chevron Hong Kong 100%

กลุ่มบริษัทบางจาก (BCP) เปิดเผยผลการดำเนินงานประจำปี 2568 โดยมีรายได้จากการขายและการให้บริการรวม 507,570 ล้านบาท มี EBITDA อยู่ที่ 35,753 ล้านบาท และกำไรหลักอยู่ที่ 10,240 ล้านบาท ...