โมเดล Claude 3 ฉลาดสุดในตอนนี้ เก่งกว่า GPT-4 และพูดไทยได้ดีกว่า Gemini | Techsauce

โมเดล Claude 3 ฉลาดสุดในตอนนี้ เก่งกว่า GPT-4 และพูดไทยได้ดีกว่า Gemini

Claude 3 (ออกเสียงว่า ‘คลอดด์’) ถูกพูดถึงในโลกโซเชียลมาสักพักหนึ่งแล้วในฐานะ AI ที่ฉลาดที่สุดในโลก ว่ากันว่ามันฉลาดกว่า ChatGPT-4 ของ OpenAI และสามารถเข้าใจภาษาไทยได้ดีกว่า Gemini จากค่าย Google ด้วย 

บทความนี้ Techsauce จะพามารู้จักกับสุดยอด AI แห่งปี 2024 ว่าจะฉลาดสมคำร่ำลือจริงไหม!

claude 3

รู้จัก Claude 3 ปัญญาประดิษฐ์แห่งปี 2024

Claude 3 ได้รับการพัฒนาจากบริษัท Anthropic บริษัทผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ LLM โดยประกอบด้วย 3 รุ่นย่อย ๆ  ได้แก่

  • Claude 3 Haiku: ความสามารถเหนือกว่า GPT3.5 (เร็วที่สุด เหมาะกับงานเบาๆ)
  • Claude 3 Sonnet: ความสามารถใกล้เคียง GPT-4 (เร็วและรองรับงานหนัก)
  • Claude 3 Opus: ความสามารถเหนือกว่า GPT-4 และ Gemini 1.0 Ultra (รุ่นที่ฉลาดที่สุด เหมาะกับงานซับซ้อน การวิเคราะห์)

โดยรุ่น Opus ตัวชูโรงของ Anthropic ถือเป็น AI ซึ่งฉลาดที่สุดที่โลกมีอยู่ในตอนนี้ ในการทดสอบมันสามารถทำคะแนนนำโมเดล LLM ตัวอื่น ๆ ที่มีอยู่ในตอนนี้ได้ทั้งหมด เช่น GPT-4, Gemini 1.0 Ultra, Gemini 1.0 Pro และที่สำคัญเก่งกว่าในทุก ๆ ด้าน

เกณฑ์การทดสอบที่ใช้ประเมิน AI ได้แก่ ความรู้ความเชี่ยวชาญในระดับปริญญาตรี (MMLU), ความเชี่ยวชาญในการใช้เหตุผลระดับปริญญาโทและเอก (GPQA), คณิตศาสตร์พื้นฐาน (GSM8K) และอื่นๆ

นอกจากรุ่น Opus แล้ว รุ่นอื่น ๆ ในตระกูล Claude 3 ก็มีความสามารถหลายด้านที่ดีขึ้นกว่าโมเดลตัวก่อน ๆ ในตลาด AI อาทิ ความสามารถด้านการวิเคราะห์และการพยากรณ์, การสร้างเนื้อหาที่มีรายละเอียดสมบูรณ์ขึ้น, การเขียนโค้ด, รวมถึงความสามารถด้านภาษา เช่น สเปน ญี่ปุ่น ฝรั่งเศส หรือแม้แต่ไทย (ตัวอย่างจากคุณเอ๋ นิ้วกลม) เป็นต้น

*ข้อจำกัดของ Claude 3 ในตอนนี้ คือ ข้อมูลล่าสุดจำกัดอยู่ที่เดือนสิงหาคมปี 2023 เท่านั้น และทุกรุ่นยังคงมี Limit ในการพูดคุย (ทั้งแบบฟรีและเสียเงิน) รุ่นทั่ว ๆ ไปรองรับ Context Window อยู่ที่ 200,000 Token และรุ่น Opus Pro ที่รองรับสูงถึง 1M Token

Claude 3 พัฒนาความสามารถด้านใดบ้าง

นอกจากการประเมินความรู้ของ Claude 3 ยังมีความสามารถด้านอื่น ๆ ที่ได้รับการปรับปรุงจากรุ่นโมเดล Claude 2.1 ดังนี้

  • ประมวลผลรูปภาพได้ดีกว่า ChatGPT

อีกหนึ่งความสามารถที่ผู้ใช้งาน ChatGPT Plus อยากรู้ ซึ่งจากการทดสอบพบว่า โมเดล Claude 3 สามารถเข้าใจข้อมูลที่มาในรูปแบบของรูปภาพ เช่น เอกสาร PDF, แผนภูมิ, กราฟ,สไลด์นำเสนองาน และไดอะแกรมทางเทคนิค โดยในหลาย ๆ ทักษะ Claude 3 ทำได้ดีกว่าทั้ง GPT-4 และ Gemini

  • ปฏิเสธการตอบคำถามน้อยลง

ในโมเดลนี้ AI จะปฏิเสธการตอบคำถามน้อยลงกว่าในโมเดล 2.1 มาก หรือพูดง่าย ๆ คือ Opus, Sonnet และ Haiku สามารถเข้าใจสิ่งที่ถูกถามได้ดียิ่งขึ้น ขอบเขตความรู้กว้างขึ้น ทำให้มันสามารถให้คำตอบที่เป็นประโยชน์ได้ดีขึ้นมาก

  • คำตอบถูกต้องแม่นยำขึ้น

จุดอ่อนสำคัญของ AI คือ ‘ความน่าเชื่อถือ’ ซึ่งในโมเดล Claude 3 ทางผู้พัฒนาได้ปรับปรุงให้มันมีความแม่นยำและซื่อตรงมากขึ้น เช่น เมื่อ AI ไม่รู้คำตอบที่ถูกต้อง มันจะแจ้งให้ผู้ใช้งานทราบว่าไม่ทราบคำตอบ แทนการเดาและให้ข้อมูลที่ไม่ถูกต้องไป เร็วๆ นี้ โมเดลเหล่านี้จะสามารถแสดงการอ้างอิงได้ ผู้ใช้งานจึงสามารถตรวจสอบแหล่งที่มาของคำตอบได้

  • การออกแบบที่มีความรับผิดชอบ

Anthropic เผยว่าบริษัทได้พัฒนาโมเดล Claude 3 ให้มีความน่าเชื่อถือและปลอดภัยจากความเสี่ยงทุกประเภท อาทิ การเผยแพร่ข้อมูลที่เป็นเท็จ, เนื้อหาที่เป็นอันตราย, การแทรกแซงการเลือกตั้ง, รวมถึงการลด AI Bias เป็นต้น 

ตอนนี้สามารถลงทะเบียนเพื่อใช้งานโมเดลเหล่านี้ได้แล้ว โดยรุ่น Sonnet (ใกล้เคียง GPT-4) เปิดให้ใช้งานได้โดยไม่เสียค่าใช้จ่ายบน claude.ai แต่สำหรับรุ่น Opus จำเป็นต้อง Subscribe Claude Pro เพื่อใช้งาน

อ้างอิง: anthropic

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

เจาะเบื้องหลังดีล Zipevent และ Link Station Group สู่การขยายธุรกิจอีเวนต์ในภูมิภาค SEA

การเข้าซื้อกิจการระหว่าง Zipevent แพลตฟอร์มจัดการอีเวนต์และจำหน่ายบัตรออนไลน์ในประเทศไทย กับ Link Station Group บริษัทญี่ปุ่นผู้เชี่ยวชาญด้านระบบจำหน่ายบัตร (Ticketing System) ถือเ...

Responsive image

KBank x Orbix Technology x StraitsX สาธิตการชำระเงินข้ามพรมแดนด้วยบล็อกเชนที่ SG FinTech Festival 2024

ธนาคารกสิกรไทยร่วมกับ Orbix Technology และ StraitsX เปิดตัวนวัตกรรมชำระเงินข้ามพรมแดนด้วย e-Money on Blockchain ในงาน Singapore FinTech Festival 2024 ชูศักยภาพฟินเทคไทยบนเวทีโลก...

Responsive image

‘Yindee’ แชตบอตในแอป ttb Touch ใช้ Gen AI จับความรู้สึก ตอบเร็วและฉลาดกว่าที่เคย

Yindee แชตบอตที่อยู่บน Mobile Banking ของ ttb ทำงานผ่านแอป ttb Touch สามารถจับ Mood & Tone ของลูกค้าหรือผู้ใช้บริการ ว่าขณะแชตนั้น ลูกค้าอยู่ในอารมณ์ไหน ด้วย Generative AI โดย Azur...