Anthropic เปิดตัวโมเดล Claude 4 รุ่นใหม่ เน้นพัฒนาศักยภาพด้านการเขียนโค้ดและการให้เหตุผล

บริษัท Anthropic ได้เปิดตัวโมเดล AI รุ่นล่าสุด Claude Opus 4 และ Claude Sonnet 4 ซึ่งออกแบบมาเพื่อรองรับงานเขียนโค้ดและแก้ปัญหาที่ซับซ้อนได้อย่างมีประสิทธิภาพ 

โดยเฉพาะโมเดล Claude Opus 4 ที่ทางบริษัทระบุว่าเป็นโมเดลที่ทรงพลังที่สุดเท่าที่เคยพัฒนามา สามารถทำงานได้ต่อเนื่องยาวนานถึง “หลายชั่วโมง” โดยในการทดสอบกับลูกค้า พบว่าโมเดลสามารถทำงานแบบอัตโนมัติได้นานถึง 7 ชั่วโมง เปิดโอกาสให้ระบบ AI สามารถทำงานแทนมนุษย์ในรูปแบบใหม่ได้มากยิ่งขึ้น

Claude Opus 4 ทั้ง 2 รุ่นโหดแค่ไหน ?

Anthropic ยังระบุว่า Opus 4 เป็นโมเดลที่ “เขียนโค้ดได้ดีที่สุดในโลก” โดยผลการทดสอบชี้ให้เห็นว่าโมเดลนี้สามารถทำงานด้านเขียนโค้ดได้ดีกว่า Google Gemini 2.5 Pro, OpenAI’s o3 reasoning และ GPT-4.1 รวมถึงมีความสามารถในการใช้เครื่องมือต่าง ๆ เช่นการค้นหาบนเว็บได้อย่างมีประสิทธิภาพ

แม้ว่า Opus 4 จะเอาชนะ Google Gemini 2.5 Pro, OpenAI o3 และ GPT-4.1 ได้บนเกณฑ์ SWE-bench Verified ที่ใช้วัดความสามารถในการเขียนโค้ด แต่ก็ยังไม่สามารถเอาชนะ o3 บนเกณฑ์มัลติโมดัล MMMU หรือ GPQA Diamond ซึ่งเป็นชุดคำถามระดับปริญญาเอกในวิชาชีววิทยา ฟิสิกส์ และเคมี

Anthropic ยังระบุว่า Opus 4 ผ่านการทดสอบด้านความปลอดภัยอย่างเข้มงวด และมีมาตรการป้องกันเนื้อหาที่เป็นอันตราย โดยพบว่าโมเดลนี้อาจเพิ่มขีดความสามารถของผู้เชี่ยวชาญด้าน STEM ในการเข้าถึงหรือผลิตอาวุธชีวภาพ เคมี หรือแม้แต่อาวุธนิวเคลียร์ได้ จึงถูกจัดอยู่ในระดับ ASL-3

ในขณะที่ Claude Sonnet 4 เป็นรุ่นที่มีต้นทุนต่ำกว่า เน้นประสิทธิภาพและความแม่นยำในการใช้งานทั่วไป และมาแทนที่รุ่น Sonnet 3.7 ที่เปิดตัวเมื่อเดือนกุมภาพันธ์ โดยบริษัทระบุว่า Sonnet 4 มีความสามารถในการเขียนโค้ดและให้เหตุผลที่เหนือกว่า อีกทั้งยังลดโอกาสในการใช้วิธีลัดลงถึง 65% และจัดการข้อมูลสำคัญได้ดีขึ้นในการทำงานระยะยาว เมื่อผู้พัฒนาให้สิทธิ์เข้าถึงไฟล์ในเครื่อง

Thinking summaries & Extended thinking ฟีเจอร์ใหม่ของ Claude 4

ฟีเจอร์ใหม่ของโมเดลทั้งสอง ได้แก่ “thinking summaries” ซึ่งสรุปขั้นตอนการให้เหตุผลของโมเดลให้เข้าใจง่าย และฟีเจอร์ “extended thinking” ที่อยู่ในระหว่างทดสอบซึ่งช่วยให้ผู้ใช้สามารถปรับโหมดระหว่างการให้เหตุผลกับการใช้เครื่องมือ เพื่อเพิ่มความแม่นยำในการตอบคำถาม

ทั้ง Claude Opus 4 และ Sonnet 4 พร้อมใช้งานแล้วบนแพลตฟอร์ม Anthropic API, Amazon Bedrock และ Google Cloud’s Vertex AI และรวมอยู่ในแพ็กเกจแบบชำระเงินของ Claude พร้อมฟีเจอร์ extended thinking ในเวอร์ชันทดสอบ สำหรับผู้ใช้ฟรีสามารถเข้าถึงได้เฉพาะ Claude Sonnet 4

นอกจากนี้ Anthropic ยังเปิดให้ใช้งาน Claude Code เครื่องมือแบบ command-line อย่างเป็นทางการ หลังจากที่เปิดให้ทดลองใช้งานแบบจำกัดในเดือนกุมภาพันธ์ที่ผ่านมา และประกาศว่าจะมีการอัปเดตโมเดลบ่อยขึ้น เพื่อตอบรับการแข่งขันกับ OpenAI, Google และ Meta

อ้างอิง: theverge, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

อดีตพนักงานแฉ Oracle สุ่มเลิกจ้างด้วยอัลกอริทึม มุ่งเป้ากลุ่มหัวกะทิที่ถือหุ้นเยอะ

ดราม่า Oracle ปลดพนักงาน 30,000 ตำแหน่ง! อดีตพนักงานแฉบริษัทใช้ ‘อัลกอริทึม’ คัดเฉพาะตัวท็อปเงินเดือนสูงและถือหุ้นเยอะออกก่อน...

Responsive image

Google เปิดตัว ‘Gemma 4’ AI Open Model ที่ทรงพลังที่สุด รองรับ 140 ภาษา รันได้บนมือถือ Android ยันเซิร์ฟเวอร์ระดับองค์กร

Gemma 4 สุดยอดโมเดล AI แบบเปิด (Open Model) จาก Google ที่เก่งที่สุด พร้อมฟีเจอร์ให้เหตุผลขั้นสูง รองรับกว่า 140 ภาษา รันได้ตั้งแต่มือถือไปจนถึงพีซีส่วนตัว เปิดโอกาสให้นักพัฒนาต่อย...

Responsive image

Microsoft เปิดตัว ‘MAI’ 3 AI โมเดลใหม่ Transcribe-1, Voice-1, Image-2 แปลงเสียง-สร้างวิดีโอสุดล้ำ ราคาถูกกว่าคู่แข่ง

ไมโครซอฟท์เปิดตัว 3 โมเดลปัญญาประดิษฐ์พื้นฐานใหม่ MAI-Transcribe-1, Voice-1 และ Image-2 ชูจุดเด่นฟีเจอร์ล้ำหน้าในราคาที่ถูกกว่าคู่แข่งอย่างกูเกิลและโอเพ่นเอไอ พร้อมวิสัยทัศน์เพื่อม...