รู้จัก CriticGPT นักตรวจสอบข้อผิดพลาดในโค้ดของ ChatGPT

ให้ AI ช่วยเขียนโค้ด แต่จะให้ใครช่วยตรวจสอบ Error ในโค้ด ? 

ล่าสุด OpenAI ได้พัฒนา CriticGPT มาแก้ Pain Point นี้แล้ว ! มันคืออะไร และทำงานอย่างไร บทความนี้ Techsauce จะเล่าให้ฟัง

CriticGPT คืออะไร ?

CriticGPT คือ เครื่องมือที่ OpenAI พัฒนาขึ้นมาจากโมเดล GPT-4 ใช้ในการตรวจสอบและค้นหาข้อผิดพลาดในโค้ดที่เขียนโดย ChatGPT และจากผลการทดสอบ พบว่า เมื่อใช้ CriticGPT ตรวจสอบโค้ด ผลลัพธ์ที่ออกมาดีกว่าเดิมถึง 60% 

ที่ผ่านมาการตรวจสอบข้อผิดพลาดของผลลัพธ์ใช้กระบวนการที่เรียกว่า RLHF - Reinforcement Learning from Human Feedback โดยให้ผู้ฝึกสอนที่เป็นมนุษย์ (AI Trainer) ตรวจสอบและให้ฟีดแบ็กผลลัพธ์ของ AI เพื่อให้มันนำไปเรียนรู้และปรับปรุง

แต่ในปัจจุบัน ChatGPT ได้รับการพัฒนาให้ฉลาดและตอบสนองได้ดียิ่งขึ้น จึงทำให้การตรวจสอบหาข้อผิดพลาดยากขึ้นตามไปด้วย เนื่องจากโมเดลฉลาดกว่า AI Trainer ไปแล้ว 

ดังนั้น การใช้กระบวนการ RLHF แบบเดิมๆ จึงอาจไม่ได้ผลลัพธ์ที่ดีเท่าที่ควร OpenAI ถึงต้องพัฒนา CriticGPT ขึ้นมาเพื่อแนะนำผู้ฝึกฝน AI ว่ามีจุดไหนที่ควรแก้ไข หรืออาจจะเป็นข้อผิดพลาด

CriticGPT เก่งว่า ChatGPT หรือเปล่า ?

ความจริงแล้วการฝึกฝน CriticGPT ก็ใช้วิธีการเดียวกับ ChatGPT ก็คือ  RLHF แต่ต่างกันตรงที่ข้อมูลที่ใช้ฝึก เพราะ CriticGPT จะได้รับ Input ที่มีข้อผิดพลาดมากมาย และต้องเรียนรู้วิธีค้นหาและอธิบายข้อผิดพลาดเหล่านี้ ดังนั้น อาจไม่สามารถเปรียบเทียบว่าใครเก่งกว่ากัน เพราะถูกพัฒนามาคนละวัตถุประสงค์นั่นเอง

ข้อจำกัดของ CriticGPT

  1. ถูกฝึกจากผลลัพธ์ที่สั้น: CriticGPT ได้รับฝึกโดยใช้คำตอบสั้น ๆ จาก ChatGPTซึ่งเป็นความท้าทายของ OpenAI ที่ในอนาคตจะต้องฝึกสอนให้มันสามารถทำความเข้าใจและประเมินผลลัพธ์ที่ยาวและซับซ้อนมากขึ้นได้
  2. ยังมีอาการหลอน (Hallucinations): บางครั้ง CriticGPT ก็มีอาการ Hallucinations หรือการจินตนาการถึงข้อผิดพลาดที่ไม่มีอยู่จริง ซึ่งนำไปสู่ข้อผิดพลาดในการระบุและให้คำแนะนำ
  3. ระบุข้อผิดพลาดได้เพียงจุดเดียว: ผลลัพธ์จาก ChatGPT อาจไม่ได้มีข้อผิดพลาดเพียงแค่จุดเดียว ซึ่งในตอนนี้ CriticGPT ยังสามารถระบุข้อผิดพลาดที่ชัดเจนได้เพียงแค่จุดเดียว และมองข้ามข้อผิดพลาดอื่นๆ ที่กระจายอยู่ในผลลัพธ์
  4. รับมืองานซับซ้อนไม่ได้: หากผลลัพธ์ที่ต้องตรวจสอบมีความซับซ้อนมาก ผู้เชี่ยวชาญที่ใช้ความ CriticGPT ก็อาจยังประสบปัญหาเรื่องการตรวจสอบที่แม่นยำ

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

90% ขององค์กรไทยยังไม่พร้อมรับมือความเสี่ยงไซเบอร์ยุค AI รายงานจาก Accenture ชี้ Cybersecurity คือโจทย์เร่งด่วน

รายงานจาก Accenture ชี้ว่าองค์กรไทยและเอเชียแปซิฟิกยังขาดความพร้อมด้าน Cybersecurity ในยุค AI เมื่อ Autonomous AI, AI Agent และระบบอัตโนมัติเร่งขยายตัว ความปลอดภัยจึงกลายเป็นกลยุทธ...

Responsive image

ทำไมองค์กรทุ่มงบให้ AI แต่ยังไม่เห็นผลจริง ? เปิดมุมมองกับ ABeam Consulting ผู้คลุกคลีกับ Data & AI ขององค์กรไทย

ทำไมทุ่มงบ AI แต่ไม่เห็นผล? เจาะลึกมุมมองจาก ABeam Consulting ถึงสาเหตุที่แท้จริง ตั้งแต่ปัญหาข้อมูลใช้ไม่ได้ จนถึงวัฒนธรรมองค์กร พร้อมแนวทางปรับตัวให้ AI ใช้งานได้จริงในปี 2025...

Responsive image

ส่องเทรนด์ AI ปี 2026 เมื่อเทคโนโลยีเป็น 'คู่คิด' แต่ความเร็วอาจเป็น 'กับดัก'

ปี 2025 AI ได้กลายเป็นเครื่องมือของคนทำงานไปแล้ว และในปี 2026 กำลังจะเป็นอีกก้าวสำคัญ เพราะ AI จะไม่ได้แค่ช่วยให้ทำงานเร็วขึ้น แต่จะเริ่มเข้ามามีบทบาทในการตัดสินใจมากขึ้นเรื่อย ๆ...