รู้จัก CriticGPT นักตรวจสอบข้อผิดพลาดในโค้ดของ ChatGPT

ให้ AI ช่วยเขียนโค้ด แต่จะให้ใครช่วยตรวจสอบ Error ในโค้ด ? 

ล่าสุด OpenAI ได้พัฒนา CriticGPT มาแก้ Pain Point นี้แล้ว ! มันคืออะไร และทำงานอย่างไร บทความนี้ Techsauce จะเล่าให้ฟัง

CriticGPT คืออะไร ?

CriticGPT คือ เครื่องมือที่ OpenAI พัฒนาขึ้นมาจากโมเดล GPT-4 ใช้ในการตรวจสอบและค้นหาข้อผิดพลาดในโค้ดที่เขียนโดย ChatGPT และจากผลการทดสอบ พบว่า เมื่อใช้ CriticGPT ตรวจสอบโค้ด ผลลัพธ์ที่ออกมาดีกว่าเดิมถึง 60% 

ที่ผ่านมาการตรวจสอบข้อผิดพลาดของผลลัพธ์ใช้กระบวนการที่เรียกว่า RLHF - Reinforcement Learning from Human Feedback โดยให้ผู้ฝึกสอนที่เป็นมนุษย์ (AI Trainer) ตรวจสอบและให้ฟีดแบ็กผลลัพธ์ของ AI เพื่อให้มันนำไปเรียนรู้และปรับปรุง

แต่ในปัจจุบัน ChatGPT ได้รับการพัฒนาให้ฉลาดและตอบสนองได้ดียิ่งขึ้น จึงทำให้การตรวจสอบหาข้อผิดพลาดยากขึ้นตามไปด้วย เนื่องจากโมเดลฉลาดกว่า AI Trainer ไปแล้ว 

ดังนั้น การใช้กระบวนการ RLHF แบบเดิมๆ จึงอาจไม่ได้ผลลัพธ์ที่ดีเท่าที่ควร OpenAI ถึงต้องพัฒนา CriticGPT ขึ้นมาเพื่อแนะนำผู้ฝึกฝน AI ว่ามีจุดไหนที่ควรแก้ไข หรืออาจจะเป็นข้อผิดพลาด

CriticGPT เก่งว่า ChatGPT หรือเปล่า ?

ความจริงแล้วการฝึกฝน CriticGPT ก็ใช้วิธีการเดียวกับ ChatGPT ก็คือ  RLHF แต่ต่างกันตรงที่ข้อมูลที่ใช้ฝึก เพราะ CriticGPT จะได้รับ Input ที่มีข้อผิดพลาดมากมาย และต้องเรียนรู้วิธีค้นหาและอธิบายข้อผิดพลาดเหล่านี้ ดังนั้น อาจไม่สามารถเปรียบเทียบว่าใครเก่งกว่ากัน เพราะถูกพัฒนามาคนละวัตถุประสงค์นั่นเอง

ข้อจำกัดของ CriticGPT

  1. ถูกฝึกจากผลลัพธ์ที่สั้น: CriticGPT ได้รับฝึกโดยใช้คำตอบสั้น ๆ จาก ChatGPTซึ่งเป็นความท้าทายของ OpenAI ที่ในอนาคตจะต้องฝึกสอนให้มันสามารถทำความเข้าใจและประเมินผลลัพธ์ที่ยาวและซับซ้อนมากขึ้นได้
  2. ยังมีอาการหลอน (Hallucinations): บางครั้ง CriticGPT ก็มีอาการ Hallucinations หรือการจินตนาการถึงข้อผิดพลาดที่ไม่มีอยู่จริง ซึ่งนำไปสู่ข้อผิดพลาดในการระบุและให้คำแนะนำ
  3. ระบุข้อผิดพลาดได้เพียงจุดเดียว: ผลลัพธ์จาก ChatGPT อาจไม่ได้มีข้อผิดพลาดเพียงแค่จุดเดียว ซึ่งในตอนนี้ CriticGPT ยังสามารถระบุข้อผิดพลาดที่ชัดเจนได้เพียงแค่จุดเดียว และมองข้ามข้อผิดพลาดอื่นๆ ที่กระจายอยู่ในผลลัพธ์
  4. รับมืองานซับซ้อนไม่ได้: หากผลลัพธ์ที่ต้องตรวจสอบมีความซับซ้อนมาก ผู้เชี่ยวชาญที่ใช้ความ CriticGPT ก็อาจยังประสบปัญหาเรื่องการตรวจสอบที่แม่นยำ

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

เจาะลึกวิธีสเกล Omnichannel จากแผนระดับโลก สู่การชนะใจลูกค้าท้องถิ่น โดย Electrolux และ Konvy

ถอดบทเรียน Electrolux และ Konvy สู่การทำ Omnichannel ที่แท้จริง เลิกแยกทีม Online-Offline พร้อมมุ่งสู่ Instant Commerce และการใช้ Data ทำนายอนาคต เพื่อความอยู่รอดในยุครีเทลใหม่...

Responsive image

เมื่ออาชญากรรมไซเบอร์ปัจจุบัน กำลังกลายเป็นวิกฤตค้ามนุษย์ เสียงจากสีหศักดิ์ พวงเกตุแก้ว บนเวที Davos กับภารกิจทลายรังสแกมเมอร์ที่ท้าทายอำนาจรัฐ

เมื่ออาชญากรรมไซเบอร์ผสานการค้ามนุษย์และ AI สร้างความเสียหาย 3.6 แสนล้านดอลลาร์ ทำไม SE Asia ถึงเป็นเป้าหมาย และทางออกในการกวาดล้างโรงงานนรกเหล่านี้คืออะไรจากเวที Davos...

Responsive image

‘ยุคทองอาเซียน’ เริ่มแล้ว ความเป็นกลาง คือ แต้มต่อ ความร่วมมือในภูมิภาค คือ คันเร่ง ฟัง ดร.เอกนิติ บนเวที Davos 2026

เจาะลึกวิสัยทัศน์ ดร.เอกนิติ นิติทัณฑ์ประภาศ จากเวที Davos 2026 ทำไมอาเซียนถึงเข้าสู่ยุคทอง? เมื่อความเป็นกลางคือแต้มต่อ และความร่วมมือในภูมิภาคคือคันเร่งสู่ความมั่งคั่งใหม่...