Anthropic เปิดตัวโมเดล Claude 4 รุ่นใหม่ เน้นพัฒนาศักยภาพด้านการเขียนโค้ดและการให้เหตุผล

บริษัท Anthropic ได้เปิดตัวโมเดล AI รุ่นล่าสุด Claude Opus 4 และ Claude Sonnet 4 ซึ่งออกแบบมาเพื่อรองรับงานเขียนโค้ดและแก้ปัญหาที่ซับซ้อนได้อย่างมีประสิทธิภาพ 

โดยเฉพาะโมเดล Claude Opus 4 ที่ทางบริษัทระบุว่าเป็นโมเดลที่ทรงพลังที่สุดเท่าที่เคยพัฒนามา สามารถทำงานได้ต่อเนื่องยาวนานถึง “หลายชั่วโมง” โดยในการทดสอบกับลูกค้า พบว่าโมเดลสามารถทำงานแบบอัตโนมัติได้นานถึง 7 ชั่วโมง เปิดโอกาสให้ระบบ AI สามารถทำงานแทนมนุษย์ในรูปแบบใหม่ได้มากยิ่งขึ้น

Claude Opus 4 ทั้ง 2 รุ่นโหดแค่ไหน ?

Anthropic ยังระบุว่า Opus 4 เป็นโมเดลที่ “เขียนโค้ดได้ดีที่สุดในโลก” โดยผลการทดสอบชี้ให้เห็นว่าโมเดลนี้สามารถทำงานด้านเขียนโค้ดได้ดีกว่า Google Gemini 2.5 Pro, OpenAI’s o3 reasoning และ GPT-4.1 รวมถึงมีความสามารถในการใช้เครื่องมือต่าง ๆ เช่นการค้นหาบนเว็บได้อย่างมีประสิทธิภาพ

แม้ว่า Opus 4 จะเอาชนะ Google Gemini 2.5 Pro, OpenAI o3 และ GPT-4.1 ได้บนเกณฑ์ SWE-bench Verified ที่ใช้วัดความสามารถในการเขียนโค้ด แต่ก็ยังไม่สามารถเอาชนะ o3 บนเกณฑ์มัลติโมดัล MMMU หรือ GPQA Diamond ซึ่งเป็นชุดคำถามระดับปริญญาเอกในวิชาชีววิทยา ฟิสิกส์ และเคมี

Anthropic ยังระบุว่า Opus 4 ผ่านการทดสอบด้านความปลอดภัยอย่างเข้มงวด และมีมาตรการป้องกันเนื้อหาที่เป็นอันตราย โดยพบว่าโมเดลนี้อาจเพิ่มขีดความสามารถของผู้เชี่ยวชาญด้าน STEM ในการเข้าถึงหรือผลิตอาวุธชีวภาพ เคมี หรือแม้แต่อาวุธนิวเคลียร์ได้ จึงถูกจัดอยู่ในระดับ ASL-3

ในขณะที่ Claude Sonnet 4 เป็นรุ่นที่มีต้นทุนต่ำกว่า เน้นประสิทธิภาพและความแม่นยำในการใช้งานทั่วไป และมาแทนที่รุ่น Sonnet 3.7 ที่เปิดตัวเมื่อเดือนกุมภาพันธ์ โดยบริษัทระบุว่า Sonnet 4 มีความสามารถในการเขียนโค้ดและให้เหตุผลที่เหนือกว่า อีกทั้งยังลดโอกาสในการใช้วิธีลัดลงถึง 65% และจัดการข้อมูลสำคัญได้ดีขึ้นในการทำงานระยะยาว เมื่อผู้พัฒนาให้สิทธิ์เข้าถึงไฟล์ในเครื่อง

Thinking summaries & Extended thinking ฟีเจอร์ใหม่ของ Claude 4

ฟีเจอร์ใหม่ของโมเดลทั้งสอง ได้แก่ “thinking summaries” ซึ่งสรุปขั้นตอนการให้เหตุผลของโมเดลให้เข้าใจง่าย และฟีเจอร์ “extended thinking” ที่อยู่ในระหว่างทดสอบซึ่งช่วยให้ผู้ใช้สามารถปรับโหมดระหว่างการให้เหตุผลกับการใช้เครื่องมือ เพื่อเพิ่มความแม่นยำในการตอบคำถาม

ทั้ง Claude Opus 4 และ Sonnet 4 พร้อมใช้งานแล้วบนแพลตฟอร์ม Anthropic API, Amazon Bedrock และ Google Cloud’s Vertex AI และรวมอยู่ในแพ็กเกจแบบชำระเงินของ Claude พร้อมฟีเจอร์ extended thinking ในเวอร์ชันทดสอบ สำหรับผู้ใช้ฟรีสามารถเข้าถึงได้เฉพาะ Claude Sonnet 4

นอกจากนี้ Anthropic ยังเปิดให้ใช้งาน Claude Code เครื่องมือแบบ command-line อย่างเป็นทางการ หลังจากที่เปิดให้ทดลองใช้งานแบบจำกัดในเดือนกุมภาพันธ์ที่ผ่านมา และประกาศว่าจะมีการอัปเดตโมเดลบ่อยขึ้น เพื่อตอบรับการแข่งขันกับ OpenAI, Google และ Meta

อ้างอิง: theverge, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Virtual Bank ไทยประกาศอย่างเป็นทางการ เจาะลึก 3 กลุ่มทุนผู้คว้าใบอนุญาตธนาคารไร้สาขา

ธนาคารแห่งประเทศไทยประกาศรายชื่อ 3 กลุ่มธุรกิจที่ได้รับใบอนุญาต Virtual Bank อย่างเป็นทางการเมื่อ 19 มิ.ย. 2568 ชี้เป็นจุดเปลี่ยนครั้งใหญ่ของระบบธนาคารไทย พร้อมเผยเกณฑ์คัดเลือกและเ...

Responsive image

Adobe ดึงตัวพ่อผู้สร้าง Computational Camera เปิดตัว Project Indigo เขย่าสมรภูมิกล้อง iPhone

Project Indigo แอปกล้องฟรีจาก Adobe ที่มี Marc Levoy ตำนานกล้อง Pixel อยู่เบื้องหลัง นี่คือกลยุทธ์เขย่าตลาดกล้อง iPhone และการสร้าง Ecosystem ครั้งสำคัญ...

Responsive image

Midjourney เปิดตัว V1 โมเดลสร้างวิดีโอด้วย AI รุ่นแรก

Midjourney ประกาศเปิดตัวโมเดลสร้างวิดีโอด้วย AI ครั้งแรกในชื่อ “V1” โมเดลนี้ให้ผู้ใช้สามารถเปลี่ยนภาพนิ่ง ให้กลายเป็นวิดีโอความยาว 5 วินาทีได้ทันที...