Anthropic เปิดตัวโมเดล Claude 4 รุ่นใหม่ เน้นพัฒนาศักยภาพด้านการเขียนโค้ดและการให้เหตุผล

บริษัท Anthropic ได้เปิดตัวโมเดล AI รุ่นล่าสุด Claude Opus 4 และ Claude Sonnet 4 ซึ่งออกแบบมาเพื่อรองรับงานเขียนโค้ดและแก้ปัญหาที่ซับซ้อนได้อย่างมีประสิทธิภาพ 

โดยเฉพาะโมเดล Claude Opus 4 ที่ทางบริษัทระบุว่าเป็นโมเดลที่ทรงพลังที่สุดเท่าที่เคยพัฒนามา สามารถทำงานได้ต่อเนื่องยาวนานถึง “หลายชั่วโมง” โดยในการทดสอบกับลูกค้า พบว่าโมเดลสามารถทำงานแบบอัตโนมัติได้นานถึง 7 ชั่วโมง เปิดโอกาสให้ระบบ AI สามารถทำงานแทนมนุษย์ในรูปแบบใหม่ได้มากยิ่งขึ้น

Claude Opus 4 ทั้ง 2 รุ่นโหดแค่ไหน ?

Anthropic ยังระบุว่า Opus 4 เป็นโมเดลที่ “เขียนโค้ดได้ดีที่สุดในโลก” โดยผลการทดสอบชี้ให้เห็นว่าโมเดลนี้สามารถทำงานด้านเขียนโค้ดได้ดีกว่า Google Gemini 2.5 Pro, OpenAI’s o3 reasoning และ GPT-4.1 รวมถึงมีความสามารถในการใช้เครื่องมือต่าง ๆ เช่นการค้นหาบนเว็บได้อย่างมีประสิทธิภาพ

แม้ว่า Opus 4 จะเอาชนะ Google Gemini 2.5 Pro, OpenAI o3 และ GPT-4.1 ได้บนเกณฑ์ SWE-bench Verified ที่ใช้วัดความสามารถในการเขียนโค้ด แต่ก็ยังไม่สามารถเอาชนะ o3 บนเกณฑ์มัลติโมดัล MMMU หรือ GPQA Diamond ซึ่งเป็นชุดคำถามระดับปริญญาเอกในวิชาชีววิทยา ฟิสิกส์ และเคมี

Anthropic ยังระบุว่า Opus 4 ผ่านการทดสอบด้านความปลอดภัยอย่างเข้มงวด และมีมาตรการป้องกันเนื้อหาที่เป็นอันตราย โดยพบว่าโมเดลนี้อาจเพิ่มขีดความสามารถของผู้เชี่ยวชาญด้าน STEM ในการเข้าถึงหรือผลิตอาวุธชีวภาพ เคมี หรือแม้แต่อาวุธนิวเคลียร์ได้ จึงถูกจัดอยู่ในระดับ ASL-3

ในขณะที่ Claude Sonnet 4 เป็นรุ่นที่มีต้นทุนต่ำกว่า เน้นประสิทธิภาพและความแม่นยำในการใช้งานทั่วไป และมาแทนที่รุ่น Sonnet 3.7 ที่เปิดตัวเมื่อเดือนกุมภาพันธ์ โดยบริษัทระบุว่า Sonnet 4 มีความสามารถในการเขียนโค้ดและให้เหตุผลที่เหนือกว่า อีกทั้งยังลดโอกาสในการใช้วิธีลัดลงถึง 65% และจัดการข้อมูลสำคัญได้ดีขึ้นในการทำงานระยะยาว เมื่อผู้พัฒนาให้สิทธิ์เข้าถึงไฟล์ในเครื่อง

Thinking summaries & Extended thinking ฟีเจอร์ใหม่ของ Claude 4

ฟีเจอร์ใหม่ของโมเดลทั้งสอง ได้แก่ “thinking summaries” ซึ่งสรุปขั้นตอนการให้เหตุผลของโมเดลให้เข้าใจง่าย และฟีเจอร์ “extended thinking” ที่อยู่ในระหว่างทดสอบซึ่งช่วยให้ผู้ใช้สามารถปรับโหมดระหว่างการให้เหตุผลกับการใช้เครื่องมือ เพื่อเพิ่มความแม่นยำในการตอบคำถาม

ทั้ง Claude Opus 4 และ Sonnet 4 พร้อมใช้งานแล้วบนแพลตฟอร์ม Anthropic API, Amazon Bedrock และ Google Cloud’s Vertex AI และรวมอยู่ในแพ็กเกจแบบชำระเงินของ Claude พร้อมฟีเจอร์ extended thinking ในเวอร์ชันทดสอบ สำหรับผู้ใช้ฟรีสามารถเข้าถึงได้เฉพาะ Claude Sonnet 4

นอกจากนี้ Anthropic ยังเปิดให้ใช้งาน Claude Code เครื่องมือแบบ command-line อย่างเป็นทางการ หลังจากที่เปิดให้ทดลองใช้งานแบบจำกัดในเดือนกุมภาพันธ์ที่ผ่านมา และประกาศว่าจะมีการอัปเดตโมเดลบ่อยขึ้น เพื่อตอบรับการแข่งขันกับ OpenAI, Google และ Meta

อ้างอิง: theverge, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

รู้จักทฤษฎี Boiling Frog ภาวะที่ AI ต้มสมองจนเปื่อย ยิ่งใช้บ่อย สมองยิ่งสูญเสียทักษะการคิด

การมี AI มาช่วยทำงานดูเหมือนจะเป็นเรื่องดีที่ช่วยให้ชีวิตง่ายขึ้น แต่ผลการศึกษาล่าสุดเตือนว่า การให้ AI คิดแทนเราบ่อยๆ กำลังส่งผลเสียร้ายแรงต่อสมองและนิสัยการทำงาน...

Responsive image

นักศึกษาอินเดียหัวหมอ สร้าง AI Influencer หารายได้ ขายคอนเทนต์ให้กลุ่มอวยทรัมป์ ผลลัพธ์ทึ่ง ทำเงินได้มหาศาล

นักศึกษาแพทย์วัย 22 ปีจากอินเดีย ที่ใช้ AI ปั้น Emily Hart อินฟลูเอนเซอร์สาวปลอมขึ้นมาเอาใจกลุ่มสายอนุรักษ์นิยมและผู้สนับสนุนโดนัลด์ ทรัมป์ (MAGA) จนสามารถทำรายได้หลายพันดอลลาร์ต่อ...

Responsive image

OpenAI เปิดตัว Workspace Agents สร้าง AI Agent ได้แล้ว สร้างง่าย มีเทมเพลตเอเจนท์ให้ใช้

OpenAI เปิดตัว Workspace Agents ใน ChatGPT ให้ทีมและองค์กรสร้าง AI agent ที่ทำงานแทนได้จริง เชื่อม Slack, Salesforce, Google Drive ฟรีถึง 6 พฤษภาคม 2026...