Anthropic เปิดตัวโมเดล Claude 4 รุ่นใหม่ เน้นพัฒนาศักยภาพด้านการเขียนโค้ดและการให้เหตุผล

บริษัท Anthropic ได้เปิดตัวโมเดล AI รุ่นล่าสุด Claude Opus 4 และ Claude Sonnet 4 ซึ่งออกแบบมาเพื่อรองรับงานเขียนโค้ดและแก้ปัญหาที่ซับซ้อนได้อย่างมีประสิทธิภาพ 

โดยเฉพาะโมเดล Claude Opus 4 ที่ทางบริษัทระบุว่าเป็นโมเดลที่ทรงพลังที่สุดเท่าที่เคยพัฒนามา สามารถทำงานได้ต่อเนื่องยาวนานถึง “หลายชั่วโมง” โดยในการทดสอบกับลูกค้า พบว่าโมเดลสามารถทำงานแบบอัตโนมัติได้นานถึง 7 ชั่วโมง เปิดโอกาสให้ระบบ AI สามารถทำงานแทนมนุษย์ในรูปแบบใหม่ได้มากยิ่งขึ้น

Claude Opus 4 ทั้ง 2 รุ่นโหดแค่ไหน ?

Anthropic ยังระบุว่า Opus 4 เป็นโมเดลที่ “เขียนโค้ดได้ดีที่สุดในโลก” โดยผลการทดสอบชี้ให้เห็นว่าโมเดลนี้สามารถทำงานด้านเขียนโค้ดได้ดีกว่า Google Gemini 2.5 Pro, OpenAI’s o3 reasoning และ GPT-4.1 รวมถึงมีความสามารถในการใช้เครื่องมือต่าง ๆ เช่นการค้นหาบนเว็บได้อย่างมีประสิทธิภาพ

แม้ว่า Opus 4 จะเอาชนะ Google Gemini 2.5 Pro, OpenAI o3 และ GPT-4.1 ได้บนเกณฑ์ SWE-bench Verified ที่ใช้วัดความสามารถในการเขียนโค้ด แต่ก็ยังไม่สามารถเอาชนะ o3 บนเกณฑ์มัลติโมดัล MMMU หรือ GPQA Diamond ซึ่งเป็นชุดคำถามระดับปริญญาเอกในวิชาชีววิทยา ฟิสิกส์ และเคมี

Anthropic ยังระบุว่า Opus 4 ผ่านการทดสอบด้านความปลอดภัยอย่างเข้มงวด และมีมาตรการป้องกันเนื้อหาที่เป็นอันตราย โดยพบว่าโมเดลนี้อาจเพิ่มขีดความสามารถของผู้เชี่ยวชาญด้าน STEM ในการเข้าถึงหรือผลิตอาวุธชีวภาพ เคมี หรือแม้แต่อาวุธนิวเคลียร์ได้ จึงถูกจัดอยู่ในระดับ ASL-3

ในขณะที่ Claude Sonnet 4 เป็นรุ่นที่มีต้นทุนต่ำกว่า เน้นประสิทธิภาพและความแม่นยำในการใช้งานทั่วไป และมาแทนที่รุ่น Sonnet 3.7 ที่เปิดตัวเมื่อเดือนกุมภาพันธ์ โดยบริษัทระบุว่า Sonnet 4 มีความสามารถในการเขียนโค้ดและให้เหตุผลที่เหนือกว่า อีกทั้งยังลดโอกาสในการใช้วิธีลัดลงถึง 65% และจัดการข้อมูลสำคัญได้ดีขึ้นในการทำงานระยะยาว เมื่อผู้พัฒนาให้สิทธิ์เข้าถึงไฟล์ในเครื่อง

Thinking summaries & Extended thinking ฟีเจอร์ใหม่ของ Claude 4

ฟีเจอร์ใหม่ของโมเดลทั้งสอง ได้แก่ “thinking summaries” ซึ่งสรุปขั้นตอนการให้เหตุผลของโมเดลให้เข้าใจง่าย และฟีเจอร์ “extended thinking” ที่อยู่ในระหว่างทดสอบซึ่งช่วยให้ผู้ใช้สามารถปรับโหมดระหว่างการให้เหตุผลกับการใช้เครื่องมือ เพื่อเพิ่มความแม่นยำในการตอบคำถาม

ทั้ง Claude Opus 4 และ Sonnet 4 พร้อมใช้งานแล้วบนแพลตฟอร์ม Anthropic API, Amazon Bedrock และ Google Cloud’s Vertex AI และรวมอยู่ในแพ็กเกจแบบชำระเงินของ Claude พร้อมฟีเจอร์ extended thinking ในเวอร์ชันทดสอบ สำหรับผู้ใช้ฟรีสามารถเข้าถึงได้เฉพาะ Claude Sonnet 4

นอกจากนี้ Anthropic ยังเปิดให้ใช้งาน Claude Code เครื่องมือแบบ command-line อย่างเป็นทางการ หลังจากที่เปิดให้ทดลองใช้งานแบบจำกัดในเดือนกุมภาพันธ์ที่ผ่านมา และประกาศว่าจะมีการอัปเดตโมเดลบ่อยขึ้น เพื่อตอบรับการแข่งขันกับ OpenAI, Google และ Meta

อ้างอิง: theverge, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Google เปิดตัว Gemini Embedding 2 ผสานข้อความ, รูปภาพ, วิดีโอ จบใน API เดียว หมดปัญหาประมวลผลข้อมูลหลายแบบ

Google เปิดตัว Gemini Embedding 2 โมเดล AI มัลติโมดัลสุดล้ำที่ผสานข้อความ รูปภาพ วิดีโอ เสียง และ PDF ไว้ในที่เดียว ตอบโจทย์ระบบ RAG และ Semantic Search...

Responsive image

Meta เข้าซื้อ Moltbook แล้ว! โซเชียลมีเดียที่มีแต่ AI ใช้คุยกัน เพราะต้องการ ‘ซื้อเพื่อดึงตัวคนเก่ง’ หลัง OpenAI ตัดหน้าดึงตัวทีม Openclaw

เมื่อมีข่าวออกมาว่า Meta บริษัทยักษ์ใหญ่ด้านโซเชียลมีเดียได้เข้าซื้อกิจการ Moltbook ซึ่งเป็นโซเชียลเน็ตเวิร์กสำหรับ ‘AI Agent’ หรือบอท AI หลายคนอาจจะเกิดความสงสัยว่า บริษัทที่ทำรา...

Responsive image

เปิดตัวชิป Meta ทำความรู้จัก MTIA ขุมพลัง AI รุ่นใหม่ที่แรงกว่า GPU ทั่วไป

เจาะลึกกลยุทธ์ Meta เปิดตัวชิป AI ตระกูล MTIA 4 รุ่นรวด! ชูจุดเด่นสถาปัตยกรรม ASIC ที่ออกแบบมาเพื่องานเฉพาะทางโดยเฉพาะ "ตัดส่วนเกิน เพิ่มส่วนแรง" กินไฟน้อยลงแต่ทรงพลังกว่า GPU ทั่ว...