รู้จัก CriticGPT นักตรวจสอบข้อผิดพลาดในโค้ดของ ChatGPT

ให้ AI ช่วยเขียนโค้ด แต่จะให้ใครช่วยตรวจสอบ Error ในโค้ด ? 

ล่าสุด OpenAI ได้พัฒนา CriticGPT มาแก้ Pain Point นี้แล้ว ! มันคืออะไร และทำงานอย่างไร บทความนี้ Techsauce จะเล่าให้ฟัง

CriticGPT คืออะไร ?

CriticGPT คือ เครื่องมือที่ OpenAI พัฒนาขึ้นมาจากโมเดล GPT-4 ใช้ในการตรวจสอบและค้นหาข้อผิดพลาดในโค้ดที่เขียนโดย ChatGPT และจากผลการทดสอบ พบว่า เมื่อใช้ CriticGPT ตรวจสอบโค้ด ผลลัพธ์ที่ออกมาดีกว่าเดิมถึง 60% 

ที่ผ่านมาการตรวจสอบข้อผิดพลาดของผลลัพธ์ใช้กระบวนการที่เรียกว่า RLHF - Reinforcement Learning from Human Feedback โดยให้ผู้ฝึกสอนที่เป็นมนุษย์ (AI Trainer) ตรวจสอบและให้ฟีดแบ็กผลลัพธ์ของ AI เพื่อให้มันนำไปเรียนรู้และปรับปรุง

แต่ในปัจจุบัน ChatGPT ได้รับการพัฒนาให้ฉลาดและตอบสนองได้ดียิ่งขึ้น จึงทำให้การตรวจสอบหาข้อผิดพลาดยากขึ้นตามไปด้วย เนื่องจากโมเดลฉลาดกว่า AI Trainer ไปแล้ว 

ดังนั้น การใช้กระบวนการ RLHF แบบเดิมๆ จึงอาจไม่ได้ผลลัพธ์ที่ดีเท่าที่ควร OpenAI ถึงต้องพัฒนา CriticGPT ขึ้นมาเพื่อแนะนำผู้ฝึกฝน AI ว่ามีจุดไหนที่ควรแก้ไข หรืออาจจะเป็นข้อผิดพลาด

CriticGPT เก่งว่า ChatGPT หรือเปล่า ?

ความจริงแล้วการฝึกฝน CriticGPT ก็ใช้วิธีการเดียวกับ ChatGPT ก็คือ  RLHF แต่ต่างกันตรงที่ข้อมูลที่ใช้ฝึก เพราะ CriticGPT จะได้รับ Input ที่มีข้อผิดพลาดมากมาย และต้องเรียนรู้วิธีค้นหาและอธิบายข้อผิดพลาดเหล่านี้ ดังนั้น อาจไม่สามารถเปรียบเทียบว่าใครเก่งกว่ากัน เพราะถูกพัฒนามาคนละวัตถุประสงค์นั่นเอง

ข้อจำกัดของ CriticGPT

  1. ถูกฝึกจากผลลัพธ์ที่สั้น: CriticGPT ได้รับฝึกโดยใช้คำตอบสั้น ๆ จาก ChatGPTซึ่งเป็นความท้าทายของ OpenAI ที่ในอนาคตจะต้องฝึกสอนให้มันสามารถทำความเข้าใจและประเมินผลลัพธ์ที่ยาวและซับซ้อนมากขึ้นได้
  2. ยังมีอาการหลอน (Hallucinations): บางครั้ง CriticGPT ก็มีอาการ Hallucinations หรือการจินตนาการถึงข้อผิดพลาดที่ไม่มีอยู่จริง ซึ่งนำไปสู่ข้อผิดพลาดในการระบุและให้คำแนะนำ
  3. ระบุข้อผิดพลาดได้เพียงจุดเดียว: ผลลัพธ์จาก ChatGPT อาจไม่ได้มีข้อผิดพลาดเพียงแค่จุดเดียว ซึ่งในตอนนี้ CriticGPT ยังสามารถระบุข้อผิดพลาดที่ชัดเจนได้เพียงแค่จุดเดียว และมองข้ามข้อผิดพลาดอื่นๆ ที่กระจายอยู่ในผลลัพธ์
  4. รับมืองานซับซ้อนไม่ได้: หากผลลัพธ์ที่ต้องตรวจสอบมีความซับซ้อนมาก ผู้เชี่ยวชาญที่ใช้ความ CriticGPT ก็อาจยังประสบปัญหาเรื่องการตรวจสอบที่แม่นยำ

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

MIT ทดสอบ AI กับงานจริง 11,000 ชิ้น ผลคือยังเป็นแค่ 'เด็กฝึกงาน' ผ่านเกณฑ์แค่ 65%

คนทำงานออฟฟิศที่เคยลองใช้ AI ช่วยงาน อาจเคยรู้สึกหวั่น ๆ ว่าสักวันจะโดนแทนที่ แต่งานวิจัยล่าสุดจาก MIT บอกเราว่าตอนนี้ AI ยังทำงานได้แค่ระดับพอผ่านเท่านั้น ถ้าเปรียบเทียบก็เหมือนเด...

Responsive image

ทำไมผู้นำยุค AI ถึงเดิมพันกับคน มากกว่าการลดพนักงาน

เจาะลึกทำไมบริษัทระดับโลกในปี 2026 เลิกบ้าการลดคน แต่หันมาใช้ AI เสริมศักยภาพมนุษย์แทน พร้อมเผย 3 คัมภีร์ลัดสำหรับผู้นำที่ต้องการเปลี่ยนความกลัวให้กลายเป็นความได้เปรียบทางธุรกิจ...

Responsive image

ใครคือ Satoshi? เมื่อ New York Times เปิดหน้าสืบสวน พุ่งเป้า Adam Back คือบิดา Bitcoin ตัวจริง

NYT มั่นใจ! เจอตัว Satoshi Nakamoto แล้ว? เจาะลึกรายงานสืบสวนล่าสุดที่มุ่งเป้าไปที่ Adam Back ซีอีโอ Blockstream กับหลักฐานไทม์ไลน์ที่หายไปอย่างประจวบเหมาะ...