รู้จัก CriticGPT นักตรวจสอบข้อผิดพลาดในโค้ดของ ChatGPT | Techsauce

รู้จัก CriticGPT นักตรวจสอบข้อผิดพลาดในโค้ดของ ChatGPT

ให้ AI ช่วยเขียนโค้ด แต่จะให้ใครช่วยตรวจสอบ Error ในโค้ด ? 

ล่าสุด OpenAI ได้พัฒนา CriticGPT มาแก้ Pain Point นี้แล้ว ! มันคืออะไร และทำงานอย่างไร บทความนี้ Techsauce จะเล่าให้ฟัง

CriticGPT คืออะไร ?

CriticGPT คือ เครื่องมือที่ OpenAI พัฒนาขึ้นมาจากโมเดล GPT-4 ใช้ในการตรวจสอบและค้นหาข้อผิดพลาดในโค้ดที่เขียนโดย ChatGPT และจากผลการทดสอบ พบว่า เมื่อใช้ CriticGPT ตรวจสอบโค้ด ผลลัพธ์ที่ออกมาดีกว่าเดิมถึง 60% 

ที่ผ่านมาการตรวจสอบข้อผิดพลาดของผลลัพธ์ใช้กระบวนการที่เรียกว่า RLHF - Reinforcement Learning from Human Feedback โดยให้ผู้ฝึกสอนที่เป็นมนุษย์ (AI Trainer) ตรวจสอบและให้ฟีดแบ็กผลลัพธ์ของ AI เพื่อให้มันนำไปเรียนรู้และปรับปรุง

แต่ในปัจจุบัน ChatGPT ได้รับการพัฒนาให้ฉลาดและตอบสนองได้ดียิ่งขึ้น จึงทำให้การตรวจสอบหาข้อผิดพลาดยากขึ้นตามไปด้วย เนื่องจากโมเดลฉลาดกว่า AI Trainer ไปแล้ว 

ดังนั้น การใช้กระบวนการ RLHF แบบเดิมๆ จึงอาจไม่ได้ผลลัพธ์ที่ดีเท่าที่ควร OpenAI ถึงต้องพัฒนา CriticGPT ขึ้นมาเพื่อแนะนำผู้ฝึกฝน AI ว่ามีจุดไหนที่ควรแก้ไข หรืออาจจะเป็นข้อผิดพลาด

CriticGPT เก่งว่า ChatGPT หรือเปล่า ?

ความจริงแล้วการฝึกฝน CriticGPT ก็ใช้วิธีการเดียวกับ ChatGPT ก็คือ  RLHF แต่ต่างกันตรงที่ข้อมูลที่ใช้ฝึก เพราะ CriticGPT จะได้รับ Input ที่มีข้อผิดพลาดมากมาย และต้องเรียนรู้วิธีค้นหาและอธิบายข้อผิดพลาดเหล่านี้ ดังนั้น อาจไม่สามารถเปรียบเทียบว่าใครเก่งกว่ากัน เพราะถูกพัฒนามาคนละวัตถุประสงค์นั่นเอง

ข้อจำกัดของ CriticGPT

  1. ถูกฝึกจากผลลัพธ์ที่สั้น: CriticGPT ได้รับฝึกโดยใช้คำตอบสั้น ๆ จาก ChatGPTซึ่งเป็นความท้าทายของ OpenAI ที่ในอนาคตจะต้องฝึกสอนให้มันสามารถทำความเข้าใจและประเมินผลลัพธ์ที่ยาวและซับซ้อนมากขึ้นได้
  2. ยังมีอาการหลอน (Hallucinations): บางครั้ง CriticGPT ก็มีอาการ Hallucinations หรือการจินตนาการถึงข้อผิดพลาดที่ไม่มีอยู่จริง ซึ่งนำไปสู่ข้อผิดพลาดในการระบุและให้คำแนะนำ
  3. ระบุข้อผิดพลาดได้เพียงจุดเดียว: ผลลัพธ์จาก ChatGPT อาจไม่ได้มีข้อผิดพลาดเพียงแค่จุดเดียว ซึ่งในตอนนี้ CriticGPT ยังสามารถระบุข้อผิดพลาดที่ชัดเจนได้เพียงแค่จุดเดียว และมองข้ามข้อผิดพลาดอื่นๆ ที่กระจายอยู่ในผลลัพธ์
  4. รับมืองานซับซ้อนไม่ได้: หากผลลัพธ์ที่ต้องตรวจสอบมีความซับซ้อนมาก ผู้เชี่ยวชาญที่ใช้ความ CriticGPT ก็อาจยังประสบปัญหาเรื่องการตรวจสอบที่แม่นยำ

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

KBTG เผย ‘Horizontal Core Banking’ บิ๊กโปรเจกต์ขยายระบบหลังบ้าน KBank รองรับการเติบโตได้ถึงปี 2031

เจาะอินไซด์การขยายระบบหลักของธนาคารกสิกรไทย เพื่อรองรับการเติบโตของลูกค้ายาวถึงปี 2031 ใน ‘Core Banking Horizontal Scale Project’ โดยทีม KBTG และทีม KBank รวมแล้วพันคน มาร่วมแรงร่ว...

Responsive image

DeepSeek และ Qwen: เมื่อ AI ราคาถูกเปลี่ยนโฉมโลก

DeepSeek และ Qwen จาก Alibaba กำลังเปลี่ยนแปลงวงการ AI ด้วยต้นทุนที่ต่ำลง ส่งผลต่อเศรษฐกิจ ธุรกิจ และระบบนิเวศ AI ทั่วโลก สุภาวดี ตันติยานนท์ วิเคราะห์ผลกระทบและแนวทางที่ประเทศไทยค...

Responsive image

ทำไม Deepseek อาจยังไม่ใช่การก้าวกระโดดของเทคโนโลยี ฟังความเห็น ดร.พัทน์ แห่ง MIT Media Lab

DeepSeek R1 คือ AI จากจีนที่ถูกมองว่าอาจท้าทาย ChatGPT-O1 ของ OpenAI แต่ ดร. พัทน์ ภัทรนุธาพร วิเคราะห์ว่า DeepSeek อาจยังไม่ใช่ "breakthrough" ที่แท้จริง...