Sonnet 4.6 มาแล้ว โมเดลพื้นฐาน ‘เก่งใกล้เรือธง’

วงการ AI เดือดอีกครั้ง! เมื่อ Anthropic ยักษ์ใหญ่คู่แข่งเบอร์ต้นของ OpenAI ประกาศเปิดตัวโมเดลรุ่นอัปเกรดใหม่ล่าสุด Claude Sonnet 4.6 ซึ่งเป็นการเดินเกมตามโร้ดแมป อัปเกรดทุก 4 เดือน 

โดยรอบนี้ไม่ได้มาเพียงแค่การปรับปรุงเล็กน้อย แต่เป็นการยกเครื่องทักษะการเขียนโค้ด การทำความเข้าใจบริบทที่ยาวมหาศาล และความสามารถในการสั่งการคอมพิวเตอร์ที่แม่นยำจนน่าตกใจ อาทิ

1M Context Window อ่านจบทั้งโปรเจกต์ในคำสั่งเดียว

ไฮไลท์ที่สั่นสะเทือนวงการที่สุดคือการเปิดตัว Context Window ขนาด 1 ล้านทอเค็น (ในเวอร์ชัน Beta) ซึ่งใหญ่กว่าเดิมถึง 2 เท่า

ทำไมต้องตื่นเต้น ? ลองจินตนาการว่าคุณสามารถโยนซอร์สโค้ดทั้งโปรเจกต์, สัญญาทางกฎหมายหนาปึกหลายสิบฉบับ หรืองานวิจัยเป็นกอง เข้าไปในคำสั่งเดียว แล้วให้ AI วิเคราะห์หาจุดบกพร่องหรือสรุปประเด็นสำคัญได้ทันทีโดยที่ข้อมูลไม่หลุด

ที่สำคัญ Sonnet 4.6 ยังโชว์ทักษะ Long-context Reasoning หรือการใช้เหตุผลท่ามกลางข้อมูลมหาศาลได้ดีเยี่ยม ไม่ใช่แค่จำได้ แต่เข้าใจความเชื่อมโยงของข้อมูลทั้งหมด

Computer Use ไม่ได้แค่ตอบแชท แต่ขยับเมาส์-พิมพ์งานแทนเรา

Anthropic ตอกย้ำความเป็นผู้นำด้าน Agentic Workflow ด้วยการอัปเกรดความสามารถ Computer Use ให้ก้าวข้ามขีดจำกัดเดิม ๆ ผลทดสอบ OSWorld พบว่า Sonnet 4.6 ทำคะแนนทุบสถิติโลกในการสั่งการคอมพิวเตอร์จำลอง ไม่ว่าจะเป็นการเปิด Chrome, ใช้ LibreOffice หรือเขียนโค้ดใน VS Code

ผู้ใช้กลุ่มแรกรายงานว่ามันสามารถกรอกฟอร์มเว็บที่ซับซ้อน หรือดึงข้อมูลข้าม Browser หลาย ๆ Tab มาสรุปใน Spreadsheet ได้เนียนระดับเดียวกับคนทำ นั่นหมายความว่า ต่อไปนี้องค์กรที่มีซอฟต์แวร์ยุคเก่าที่ไม่มี API ก็สามารถใช้ Claude เข้าไปสั่งงานผ่านหน้าจอได้เหมือนพนักงานคนหนึ่งเลยทีเดียว ถือเป็นจุดเปลี่ยนสำคัญสำหรับองค์กรที่ต้องการระบบอัตโนมัติมาช่วยทำงานในซอฟต์แวร์ที่ไม่มีระบบ API รองรับ

ฉลาดเทียบชั้นรุ่นท็อป

สิ่งที่น่าทึ่งคือ Sonnet 4.6 ซึ่งเป็นโมเดลระดับกลางกลับทำคะแนน Benchmark ได้สูงจนเบียดรุ่นเรือธง ของค่ายอื่น ๆ เช่น

  1. ARC-AGI-2 ได้คะแนน 60.4% ซึ่งเน้นวัดทักษะการเรียนรู้สิ่งใหม่ (General Intelligence) แบบมนุษย์ แซงหน้าคู่แข่งเกือบทุกรายในตลาด (แม้จะยังตามหลังรุ่นพี่อย่าง Opus 4.6 หรือ Gemini 3 Deep Think อยู่เล็กน้อย)
  2. SWE-Bench ยืนหนึ่งในด้านวิศวกรรมซอฟต์แวร์

จากการทดสอบใช้งานจริง นักพัฒนากว่า 70% เทใจให้ Sonnet 4.6 มากกว่ารุ่น 4.5 เพราะหมดปัญหา AI ขี้เกียจสั่งแล้วไม่ทำ หรือทำแบบครึ่ง ๆ กลาง ๆ

รวมถึงในการทดสอบบริหารธุรกิจจำลอง Claude โชว์กึ๋นด้วยการยอมลงทุนหนักในช่วง 10 เดือนแรกเพื่อขยายกิจการ ก่อนจะสวิตช์มาทำกำไรเน้น ๆ ในช่วงสุดท้าย ซึ่งเป็นกลยุทธ์ที่ล้ำลึกกว่า AI ทั่วไป

และงานสาย Frontend และงานดีไซน์ออกมาดูดีกว่าเดิมมาก ทั้ง Layout และ Animation มีความรู้สึกของความเป็นมืออาชีพมากขึ้น

อย่างไรก็ตาม การเปิดตัวครั้งนี้มาพร้อมกับความระมัดระวังด้านความปลอดภัยอย่างเข้มงวด Anthropic ระบุว่าได้ผ่านการประเมินความปลอดภัยตามนโยบาย Responsible Scaling Policy โดยพบว่าโมเดลมีพฤติกรรมที่ซื่อสัตย์และเป็นมิตรมากขึ้น รวมถึงมีความแข็งแกร่งในการต้านทานการโจมตีประเภท Prompt Injection ที่อาจแฝงมากับคำสั่งบนเว็บไซต์ภายนอก ซึ่งถือเป็นความเสี่ยงหลักของการปล่อยให้ AI เข้าถึงระบบคอมพิวเตอร์

สำหรับผู้ใช้ที่สดใจใช้โมเดล Claude Sonnet 4.6 

Anthropic ได้ยึดให้เป็นโมเดลพื้นฐานสำหรับผู้ใช้งานแผน Free และ Pro บนหน้าเว็บไซต์ Claude.ai และแอปพลิเคชันมือถือตั้งแต่วันนี้เป็นต้นไป 

ขณะที่กลุ่มลูกค้าองค์กรที่ใช้งานผ่าน API ยังคงได้รับข้อเสนอราคาเดิมที่ $3 ต่อล้านโทเค็นสำหรับ Input และ $15 สำหรับ Output ซึ่งทาง Anthropic มั่นใจว่า Sonnet 4.6 คือ จุดสมดุลใหม่ที่ให้ทั้งความฉลาดระดับแนวหน้าในราคาที่คุ้มค่าสำหรับธุรกิจทุกระดับ

การเปิดตัว Sonnet 4.6 เกิดขึ้นเพียงไม่กี่สัปดาห์หลังจากการปล่อย Opus 4.6 รุ่นท็อปออกสู่ตลาด ซึ่งแสดงให้เห็นถึงความเร็วในการพัฒนาของ Anthropic ที่ต้องการครองตำแหน่งผู้นำในตลาด AI Agent และงานด้านวิศวกรรมซอฟต์แวร์อย่างเต็มตัวในปี 2026 นี้

อ้างอิง: anthropic, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

MIT ปรับกฎเหล็กหนุน Startup รับกระแส AI อาจารย์-นศ. ลาไปทำธุรกิจได้แบบไร้ความเสี่ยง

เจาะลึกแผนปฏิรูปครั้งใหญ่ของ MIT แก้กฎการลางานและดรอปเรียน เปิดทางอาจารย์และนักศึกษาปั้น Startup รับเทรนด์ AI บูม ล้มแล้วกลับมาเรียนต่อได้ทันที พร้อมทุนหนุนเกือบ 3 ล้านบาท...

Responsive image

SCB 10X ลงทุนใน Gradient Fund V เปิดทางเข้าถึงสตาร์ทอัพ AI ระยะเริ่มต้นทั่วโลก

SCB 10X บริษัทด้านการลงทุนในเทคโนโลยีเปลี่ยนโลก (Disruptive Technology) ภายใต้กลุ่มเอสซีบีเอกซ์ ประกาศลงทุนใน Gradient Fund V กองทุนล่าสุดจาก Gradient บริษัท Venture Capital ระยะเร...

Responsive image

SpaceX ยื่น IPO แล้ว คาดภายในมิถุนายนนี้ ปูทางสร้างอาณานิคมดาวอังคาร และ Data Center ในอวกาศ ใหญ่ที่สุดในประวัติศาสตร์มนุษยชาติ

SpaceX เตรียม IPO ครั้งประวัติศาสตร์! ยื่นไฟลิ่งลับระดมทุนเฉียด 7.5 หมื่นล้านเหรียญ ดันมูลค่าบริษัททะลุ 1 ล้านล้านดอลลาร์ เจาะลึกแผนกลยุทธ์ อีลอน มัสก์ ควบรวม xAI และภารกิจกู้ซาก X...