บริษัท Anthropic ได้เปิดตัวโมเดล AI รุ่นล่าสุด Claude Opus 4 และ Claude Sonnet 4 ซึ่งออกแบบมาเพื่อรองรับงานเขียนโค้ดและแก้ปัญหาที่ซับซ้อนได้อย่างมีประสิทธิภาพ
โดยเฉพาะโมเดล Claude Opus 4 ที่ทางบริษัทระบุว่าเป็นโมเดลที่ทรงพลังที่สุดเท่าที่เคยพัฒนามา สามารถทำงานได้ต่อเนื่องยาวนานถึง “หลายชั่วโมง” โดยในการทดสอบกับลูกค้า พบว่าโมเดลสามารถทำงานแบบอัตโนมัติได้นานถึง 7 ชั่วโมง เปิดโอกาสให้ระบบ AI สามารถทำงานแทนมนุษย์ในรูปแบบใหม่ได้มากยิ่งขึ้น
Anthropic ยังระบุว่า Opus 4 เป็นโมเดลที่ “เขียนโค้ดได้ดีที่สุดในโลก” โดยผลการทดสอบชี้ให้เห็นว่าโมเดลนี้สามารถทำงานด้านเขียนโค้ดได้ดีกว่า Google Gemini 2.5 Pro, OpenAI’s o3 reasoning และ GPT-4.1 รวมถึงมีความสามารถในการใช้เครื่องมือต่าง ๆ เช่นการค้นหาบนเว็บได้อย่างมีประสิทธิภาพ
แม้ว่า Opus 4 จะเอาชนะ Google Gemini 2.5 Pro, OpenAI o3 และ GPT-4.1 ได้บนเกณฑ์ SWE-bench Verified ที่ใช้วัดความสามารถในการเขียนโค้ด แต่ก็ยังไม่สามารถเอาชนะ o3 บนเกณฑ์มัลติโมดัล MMMU หรือ GPQA Diamond ซึ่งเป็นชุดคำถามระดับปริญญาเอกในวิชาชีววิทยา ฟิสิกส์ และเคมี
Anthropic ยังระบุว่า Opus 4 ผ่านการทดสอบด้านความปลอดภัยอย่างเข้มงวด และมีมาตรการป้องกันเนื้อหาที่เป็นอันตราย โดยพบว่าโมเดลนี้อาจเพิ่มขีดความสามารถของผู้เชี่ยวชาญด้าน STEM ในการเข้าถึงหรือผลิตอาวุธชีวภาพ เคมี หรือแม้แต่อาวุธนิวเคลียร์ได้ จึงถูกจัดอยู่ในระดับ ASL-3
ในขณะที่ Claude Sonnet 4 เป็นรุ่นที่มีต้นทุนต่ำกว่า เน้นประสิทธิภาพและความแม่นยำในการใช้งานทั่วไป และมาแทนที่รุ่น Sonnet 3.7 ที่เปิดตัวเมื่อเดือนกุมภาพันธ์ โดยบริษัทระบุว่า Sonnet 4 มีความสามารถในการเขียนโค้ดและให้เหตุผลที่เหนือกว่า อีกทั้งยังลดโอกาสในการใช้วิธีลัดลงถึง 65% และจัดการข้อมูลสำคัญได้ดีขึ้นในการทำงานระยะยาว เมื่อผู้พัฒนาให้สิทธิ์เข้าถึงไฟล์ในเครื่อง
ฟีเจอร์ใหม่ของโมเดลทั้งสอง ได้แก่ “thinking summaries” ซึ่งสรุปขั้นตอนการให้เหตุผลของโมเดลให้เข้าใจง่าย และฟีเจอร์ “extended thinking” ที่อยู่ในระหว่างทดสอบซึ่งช่วยให้ผู้ใช้สามารถปรับโหมดระหว่างการให้เหตุผลกับการใช้เครื่องมือ เพื่อเพิ่มความแม่นยำในการตอบคำถาม
ทั้ง Claude Opus 4 และ Sonnet 4 พร้อมใช้งานแล้วบนแพลตฟอร์ม Anthropic API, Amazon Bedrock และ Google Cloud’s Vertex AI และรวมอยู่ในแพ็กเกจแบบชำระเงินของ Claude พร้อมฟีเจอร์ extended thinking ในเวอร์ชันทดสอบ สำหรับผู้ใช้ฟรีสามารถเข้าถึงได้เฉพาะ Claude Sonnet 4
นอกจากนี้ Anthropic ยังเปิดให้ใช้งาน Claude Code เครื่องมือแบบ command-line อย่างเป็นทางการ หลังจากที่เปิดให้ทดลองใช้งานแบบจำกัดในเดือนกุมภาพันธ์ที่ผ่านมา และประกาศว่าจะมีการอัปเดตโมเดลบ่อยขึ้น เพื่อตอบรับการแข่งขันกับ OpenAI, Google และ Meta
อ้างอิง: theverge, techcrunch
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด