รู้จัก CriticGPT นักตรวจสอบข้อผิดพลาดในโค้ดของ ChatGPT | Techsauce

รู้จัก CriticGPT นักตรวจสอบข้อผิดพลาดในโค้ดของ ChatGPT

ให้ AI ช่วยเขียนโค้ด แต่จะให้ใครช่วยตรวจสอบ Error ในโค้ด ? 

ล่าสุด OpenAI ได้พัฒนา CriticGPT มาแก้ Pain Point นี้แล้ว ! มันคืออะไร และทำงานอย่างไร บทความนี้ Techsauce จะเล่าให้ฟัง

CriticGPT คืออะไร ?

CriticGPT คือ เครื่องมือที่ OpenAI พัฒนาขึ้นมาจากโมเดล GPT-4 ใช้ในการตรวจสอบและค้นหาข้อผิดพลาดในโค้ดที่เขียนโดย ChatGPT และจากผลการทดสอบ พบว่า เมื่อใช้ CriticGPT ตรวจสอบโค้ด ผลลัพธ์ที่ออกมาดีกว่าเดิมถึง 60% 

ที่ผ่านมาการตรวจสอบข้อผิดพลาดของผลลัพธ์ใช้กระบวนการที่เรียกว่า RLHF - Reinforcement Learning from Human Feedback โดยให้ผู้ฝึกสอนที่เป็นมนุษย์ (AI Trainer) ตรวจสอบและให้ฟีดแบ็กผลลัพธ์ของ AI เพื่อให้มันนำไปเรียนรู้และปรับปรุง

แต่ในปัจจุบัน ChatGPT ได้รับการพัฒนาให้ฉลาดและตอบสนองได้ดียิ่งขึ้น จึงทำให้การตรวจสอบหาข้อผิดพลาดยากขึ้นตามไปด้วย เนื่องจากโมเดลฉลาดกว่า AI Trainer ไปแล้ว 

ดังนั้น การใช้กระบวนการ RLHF แบบเดิมๆ จึงอาจไม่ได้ผลลัพธ์ที่ดีเท่าที่ควร OpenAI ถึงต้องพัฒนา CriticGPT ขึ้นมาเพื่อแนะนำผู้ฝึกฝน AI ว่ามีจุดไหนที่ควรแก้ไข หรืออาจจะเป็นข้อผิดพลาด

CriticGPT เก่งว่า ChatGPT หรือเปล่า ?

ความจริงแล้วการฝึกฝน CriticGPT ก็ใช้วิธีการเดียวกับ ChatGPT ก็คือ  RLHF แต่ต่างกันตรงที่ข้อมูลที่ใช้ฝึก เพราะ CriticGPT จะได้รับ Input ที่มีข้อผิดพลาดมากมาย และต้องเรียนรู้วิธีค้นหาและอธิบายข้อผิดพลาดเหล่านี้ ดังนั้น อาจไม่สามารถเปรียบเทียบว่าใครเก่งกว่ากัน เพราะถูกพัฒนามาคนละวัตถุประสงค์นั่นเอง

ข้อจำกัดของ CriticGPT

  1. ถูกฝึกจากผลลัพธ์ที่สั้น: CriticGPT ได้รับฝึกโดยใช้คำตอบสั้น ๆ จาก ChatGPTซึ่งเป็นความท้าทายของ OpenAI ที่ในอนาคตจะต้องฝึกสอนให้มันสามารถทำความเข้าใจและประเมินผลลัพธ์ที่ยาวและซับซ้อนมากขึ้นได้
  2. ยังมีอาการหลอน (Hallucinations): บางครั้ง CriticGPT ก็มีอาการ Hallucinations หรือการจินตนาการถึงข้อผิดพลาดที่ไม่มีอยู่จริง ซึ่งนำไปสู่ข้อผิดพลาดในการระบุและให้คำแนะนำ
  3. ระบุข้อผิดพลาดได้เพียงจุดเดียว: ผลลัพธ์จาก ChatGPT อาจไม่ได้มีข้อผิดพลาดเพียงแค่จุดเดียว ซึ่งในตอนนี้ CriticGPT ยังสามารถระบุข้อผิดพลาดที่ชัดเจนได้เพียงแค่จุดเดียว และมองข้ามข้อผิดพลาดอื่นๆ ที่กระจายอยู่ในผลลัพธ์
  4. รับมืองานซับซ้อนไม่ได้: หากผลลัพธ์ที่ต้องตรวจสอบมีความซับซ้อนมาก ผู้เชี่ยวชาญที่ใช้ความ CriticGPT ก็อาจยังประสบปัญหาเรื่องการตรวจสอบที่แม่นยำ

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

‘เข้าใจลูกค้า’ ฟังเหมือนง่ายแต่ทำยาก NocNoc เปิดเวที NocNoc Hackathon 2024 พัฒนาระบบรู้ใจลูกค้า ยกระดับ E-commerce ด้าน Home and Living สร้างประสบการณ์ที่ดีบนแพลตฟอร์ม

NocNoc Hackathon 2024 Home & Living Personalization เวทีปล่อยของคนไทยหัวใจเทคฯ ร่วมพัฒนา ‘ระบบรู้ใจลูกค้า’ เพื่ออนาคตธุรกิจไทย...

Responsive image

จาก Oswald สู่ Mickey Mouse ตำนาน Brand Character ของ Walt Disney

Mickey Mouse หนึ่งใน Brand Character ตัวสำคัญที่ซ่อนอยู่ในหนัง สวนสนุกหรือแม้แต่โลโก้ของ Disney การเกิดขึ้นมาของ Mickey จึงเต็มไปด้วยกลยุทธ์ทางธุรกิจมากมาย ไม่ใช่แค่ความน่ารัก !...

Responsive image

True คว้า DJSI 2023 6 ปีซ้อน สะท้อนกลยุทธ์เชิงรุก เปลี่ยนแปลงองค์กรเพื่อความยั่งยืนในทุกมิติ

3 แนวทางการดำเนินธุรกิจ ที่ทำให้ทรูเป็นผู้นำด้านความยั่งยืน ติดอันดับ 1 ดัชนี DJSI 2023 ในกลุ่มอุตสาหกรรมโทรคมนาคม เป็นปีที่ 6 ติดต่อกัน พร้อมร่วมขับเคลื่อ oประเทศไทยสู่ความยั่งยืน...