โมเดล Claude 3 ฉลาดสุดในตอนนี้ เก่งกว่า GPT-4 และพูดไทยได้ดีกว่า Gemini

Claude 3 (ออกเสียงว่า ‘คลอดด์’) ถูกพูดถึงในโลกโซเชียลมาสักพักหนึ่งแล้วในฐานะ AI ที่ฉลาดที่สุดในโลก ว่ากันว่ามันฉลาดกว่า ChatGPT-4 ของ OpenAI และสามารถเข้าใจภาษาไทยได้ดีกว่า Gemini จากค่าย Google ด้วย 

บทความนี้ Techsauce จะพามารู้จักกับสุดยอด AI แห่งปี 2024 ว่าจะฉลาดสมคำร่ำลือจริงไหม!

claude 3

รู้จัก Claude 3 ปัญญาประดิษฐ์แห่งปี 2024

Claude 3 ได้รับการพัฒนาจากบริษัท Anthropic บริษัทผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ LLM โดยประกอบด้วย 3 รุ่นย่อย ๆ  ได้แก่

  • Claude 3 Haiku: ความสามารถเหนือกว่า GPT3.5 (เร็วที่สุด เหมาะกับงานเบาๆ)
  • Claude 3 Sonnet: ความสามารถใกล้เคียง GPT-4 (เร็วและรองรับงานหนัก)
  • Claude 3 Opus: ความสามารถเหนือกว่า GPT-4 และ Gemini 1.0 Ultra (รุ่นที่ฉลาดที่สุด เหมาะกับงานซับซ้อน การวิเคราะห์)

โดยรุ่น Opus ตัวชูโรงของ Anthropic ถือเป็น AI ซึ่งฉลาดที่สุดที่โลกมีอยู่ในตอนนี้ ในการทดสอบมันสามารถทำคะแนนนำโมเดล LLM ตัวอื่น ๆ ที่มีอยู่ในตอนนี้ได้ทั้งหมด เช่น GPT-4, Gemini 1.0 Ultra, Gemini 1.0 Pro และที่สำคัญเก่งกว่าในทุก ๆ ด้าน

เกณฑ์การทดสอบที่ใช้ประเมิน AI ได้แก่ ความรู้ความเชี่ยวชาญในระดับปริญญาตรี (MMLU), ความเชี่ยวชาญในการใช้เหตุผลระดับปริญญาโทและเอก (GPQA), คณิตศาสตร์พื้นฐาน (GSM8K) และอื่นๆ

นอกจากรุ่น Opus แล้ว รุ่นอื่น ๆ ในตระกูล Claude 3 ก็มีความสามารถหลายด้านที่ดีขึ้นกว่าโมเดลตัวก่อน ๆ ในตลาด AI อาทิ ความสามารถด้านการวิเคราะห์และการพยากรณ์, การสร้างเนื้อหาที่มีรายละเอียดสมบูรณ์ขึ้น, การเขียนโค้ด, รวมถึงความสามารถด้านภาษา เช่น สเปน ญี่ปุ่น ฝรั่งเศส หรือแม้แต่ไทย (ตัวอย่างจากคุณเอ๋ นิ้วกลม) เป็นต้น

*ข้อจำกัดของ Claude 3 ในตอนนี้ คือ ข้อมูลล่าสุดจำกัดอยู่ที่เดือนสิงหาคมปี 2023 เท่านั้น และทุกรุ่นยังคงมี Limit ในการพูดคุย (ทั้งแบบฟรีและเสียเงิน) รุ่นทั่ว ๆ ไปรองรับ Context Window อยู่ที่ 200,000 Token และรุ่น Opus Pro ที่รองรับสูงถึง 1M Token

Claude 3 พัฒนาความสามารถด้านใดบ้าง

นอกจากการประเมินความรู้ของ Claude 3 ยังมีความสามารถด้านอื่น ๆ ที่ได้รับการปรับปรุงจากรุ่นโมเดล Claude 2.1 ดังนี้

  • ประมวลผลรูปภาพได้ดีกว่า ChatGPT

อีกหนึ่งความสามารถที่ผู้ใช้งาน ChatGPT Plus อยากรู้ ซึ่งจากการทดสอบพบว่า โมเดล Claude 3 สามารถเข้าใจข้อมูลที่มาในรูปแบบของรูปภาพ เช่น เอกสาร PDF, แผนภูมิ, กราฟ,สไลด์นำเสนองาน และไดอะแกรมทางเทคนิค โดยในหลาย ๆ ทักษะ Claude 3 ทำได้ดีกว่าทั้ง GPT-4 และ Gemini

  • ปฏิเสธการตอบคำถามน้อยลง

ในโมเดลนี้ AI จะปฏิเสธการตอบคำถามน้อยลงกว่าในโมเดล 2.1 มาก หรือพูดง่าย ๆ คือ Opus, Sonnet และ Haiku สามารถเข้าใจสิ่งที่ถูกถามได้ดียิ่งขึ้น ขอบเขตความรู้กว้างขึ้น ทำให้มันสามารถให้คำตอบที่เป็นประโยชน์ได้ดีขึ้นมาก

  • คำตอบถูกต้องแม่นยำขึ้น

จุดอ่อนสำคัญของ AI คือ ‘ความน่าเชื่อถือ’ ซึ่งในโมเดล Claude 3 ทางผู้พัฒนาได้ปรับปรุงให้มันมีความแม่นยำและซื่อตรงมากขึ้น เช่น เมื่อ AI ไม่รู้คำตอบที่ถูกต้อง มันจะแจ้งให้ผู้ใช้งานทราบว่าไม่ทราบคำตอบ แทนการเดาและให้ข้อมูลที่ไม่ถูกต้องไป เร็วๆ นี้ โมเดลเหล่านี้จะสามารถแสดงการอ้างอิงได้ ผู้ใช้งานจึงสามารถตรวจสอบแหล่งที่มาของคำตอบได้

  • การออกแบบที่มีความรับผิดชอบ

Anthropic เผยว่าบริษัทได้พัฒนาโมเดล Claude 3 ให้มีความน่าเชื่อถือและปลอดภัยจากความเสี่ยงทุกประเภท อาทิ การเผยแพร่ข้อมูลที่เป็นเท็จ, เนื้อหาที่เป็นอันตราย, การแทรกแซงการเลือกตั้ง, รวมถึงการลด AI Bias เป็นต้น 

ตอนนี้สามารถลงทะเบียนเพื่อใช้งานโมเดลเหล่านี้ได้แล้ว โดยรุ่น Sonnet (ใกล้เคียง GPT-4) เปิดให้ใช้งานได้โดยไม่เสียค่าใช้จ่ายบน claude.ai แต่สำหรับรุ่น Opus จำเป็นต้อง Subscribe Claude Pro เพื่อใช้งาน

อ้างอิง: anthropic

No comment

RELATED ARTICLE

Responsive image

คืนชีพ Dire Wolf หมาป่าที่สูญพันธ์ไปเมื่อ 12,500 ปีก่อน นักวิทยาศาสตร์ทำได้อย่างไร ?

Dire Wolf คือชื่อของหมาป่าสายพันธุ์หนึ่งซึ่งสูญพันธุ์ไปเมื่อราว 12,500 ปีก่อน และในวันนี้ พวกมันได้กลับมามีชีวิตอีกครั้งอย่างน่าทึ่ง ในฐานะที่บริษัทเทคโนโลยีชีวภาพ Colossal Bioscie...

Responsive image

คอมตัมคอมพิวติ้ง ตอนนี้ไปถึงไหนแล้ว ? สรุปความก้าวหน้าควอนตัมจากงาน NVIDIA GTC 2025

งาน NVIDIA GTC 2025 เป็นปีแรกที่มีการจัดเวทีพูดคุยเกี่ยวกับควอนตัมคอมพิวติ้งโดยเฉพาะ (Quantum Day) ซึ่ง NVIDIA ในฐานะเจ้าภาพ และผู้ขับเคลื่อนการประมวลผลแบบ Accelerated Computing จึ...

Responsive image

ญี่ปุ่น ใช้ AI และเทคโนโลยีอะไร ในการรับมือแผ่นดินไหว ?

เหตุแผ่นดินไหวในเมียนมาที่ส่งผลกระทบมาถึงประเทศไทย สร้างความตระหนักถึงความเสี่ยงด้านแผ่นดินไหวที่อาจเกิดขึ้นในประเทศ แม้ประเทศไทยจะไม่ใช่พื้นที่ที่มีความเสี่ยงสูง แต่เหตุการณ์ดังกล...