OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI | Techsauce

OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI

OpenAI เปิดตัว o3 และ o3-mini โมเดล AI ตัวใหม่ที่พัฒนาต่อยอดมาจาก o1 ที่เพิ่งเปิดตัวให้เห็นเมื่อเดือนกันยายน ปี 2024 โดยมาพร้อมกับความสามารถเด่นในเรื่องของ Reasoning หรือการให้เหตุผล ซึ่งนี่อาจเป็นก้าวต่อไปที่ทำให้เข้าใกล้ยุค AGI หรือขั้นต่อไปของปัญญาประดิษฐ์ที่จะมีความสามารถที่เหนือกว่ามนุษย์ในหลายๆ ด้าน


o3 มีอะไรดี ?

ความพิเศษของ o3 อยู่ที่ "ความสามารถในการให้เหตุผล" ซึ่งหมายความว่ามันสามารถ "คิด" และ "ตรวจสอบ" คำตอบของตัวเองได้ ก่อนที่จะตอบเรา โดยปกติแล้วหากเราถามคำถามยากๆ กับ AI มันอาจจะตอบผิดหรือให้ข้อมูลที่ไม่ถูกต้อง แต่ o3 ต่างออกไป เพราะมันถูกฝึกมาให้คิดอย่างรอบคอบก่อนตอบ

โดยเมื่อเราถามคำถามกับ o3 แทนที่มันจะตอบทันที o3 จะหยุดคิดสักครู่ราวกับว่ามันกำลังคิดอยู่ในใจ โดยพิจารณาคำถามที่คล้ายกันหลายๆ คำถาม และอธิบายขั้นตอนการคิดให้ทราบ จากนั้น o3 จะตรวจสอบคำตอบของตัวเองอย่างละเอียดเพื่อให้แน่ใจว่าถูกต้องที่สุด ซึ่งหลังจากคิด และตรวจสอบแล้ว o3 จะทำการสรุปคำตอบที่ดีที่สุดให้กับผู้ใช้

ทั้งนี้ o3 และ o3-mini จะเปิดให้นักวิจัยบางส่วนได้ใช้งานเวอร์ชันพรีวิวก่อนเป็นกลุ่มแรก ก่อนที่จะเปิดให้ผู้ใช้ทั่วไปใช้งานช่วงเดือนมกราคม 2025


o3 เก่งแค่ไหน เข้าใกล้ AGI หรือยัง ?

ในการทดสอบ SWE-Bench Verified ซึ่งเป็นการทดสอบความสามารถด้านการเขียนโปรแกรม o3 ทำคะแนนได้ดีกว่า o1 ราว 22.8% ส่วนการทดสอบ Codeforce หรือการแข่งขันเขียนโปรแกรม o3 ได้คะแนนสูงถึง 2,727 ซึ่งนับว่าเป็นคะแนนที่สูงมาก เพราะหากได้คะแนนราว 2,400 ก็ถือว่าเก่งกว่าโปรแกรมเมอร์ราว 99.2% บนโลกแล้ว

ส่วนการทดสอบ American Invitational Mathematics Exam หรือการทดสอบเลขระดับยากของอเมริกา o3 ทำคะแนนได้เกือบเต็มที่ 96.7% ตอบผิดเพียงแค่ข้อเดียว ส่วนการทดสอบ Frontier Math หรือการทดสอบคณิตศาสตร์ขั้นสูง o3 ก็สามารถทำลายสถิติ แก้โจทย์ได้ 25.2% ในขณะที่ AI ตัวอื่นๆ ทำได้ไม่เกิน 2%

แม้ Sam Altman ซีอีโอของ OpenAI จะเคยกล่าวว่า ปี 2025 อาจเป็นปีที่มนุษย์ได้เห็น AGI แต่ดูเหมือนว่า โมเดล o3 ตัวใหม่อาจจะยังไม่ไปถึงจุดนั้น โดยจากการทดสอบ ARC-AGI ซึ่งเป็นการทดสอบที่ออกแบบมาเพื่อประเมินว่าระบบ AI สามารถได้รับทักษะใหม่ๆ นอกจากข้อมูลที่ได้ระบการฝึกฝนหรือไม่ 

ARC-AGI ค้นพบว่า o3 เป็นโมเดลที่ถือว่ามีความก้าวหน้าในเรื่องของความสามารถเป็นอย่างมาก แต่ค่าใช้จ่ายในการแก้โจทย์ ARC-AGI ยังถือว่าสูงอยู่ที่ราว 17-20 ดอลลาร์สหรัฐฯ ต่อข้อ แม้จะประมวลผลในโหมด low-compute (หากจ้างมนุษย์แก้โจทย์เดียวกันจะอยู่ที่ราว 5 ดอลลาร์สหรัฐฯ)

โดยทาง ARC-AGI มองว่า o3 ยังไม่ใช่ AGI ที่แท้จริงเพราะยังทำโจทย์ง่ายๆ บางข้อผิดพลาด รวมทั้งแบบทดสอบ ARC-AGI 2 ที่กำลังจะออกมาใหม่น่าจะเป็นโจทย์ที่ท้าทายสำหรับ o3 มากกว่าตอนนี้มาก และอาจทำให้คะแนนลดลงเหลือต่ำกว่า 30% 

ทาง ARC-AGI สรุปทิ้งท้ายไว้อย่างน่าสนใจว่า ถ้าวันไหนที่เราพยายามคิดโจทย์ง่ายๆ ให้มนุษย์ทำ แต่กลับพบว่า AI ก็ทำได้หมดทุกข้อ ไม่ว่าจะพยายามแค่ไหน นั่นแหละคือสัญญาณว่า AGI ได้เกิดขึ้นจริงแล้ว ซึ่งในตอนนี้ o3 ยังไปไม่ถึงจุดนั้น


อ้างอิง : techcrunch, arcprize



ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Elon Musk ส่งอีเมลถึงราชกาให้เลือกลาออกหรืออยู่ต่อ เหมือนที่เคยทำกับพนักงาน Twitter ปี 2022

เกิดแรงสั่นสะเทือนครั้งใหญ่ในระบบราชการสหรัฐฯ หลังประธานาธิบดี โดนัลด์ ทรัมป์ แต่งตั้ง อีลอน มัสก์ ให้เป็นหัวหน้ากระทรวงเพิ่มประสิทธิภาพภาครัฐ หรือ DOGE โดยมัสก์และทีมงานได้เดินหน้...

Responsive image

SparkCat คืออะไร ทำงานอย่างไร ? มัลแวร์ตัวแรกบน AppStore ลอบขโมยข้อมูลคริปโตผ่านรูปภาพ

มัลแวร์ SparkCat ถูกพบใน AppStore และ Google Play ใช้เทคโนโลยี OCR ขโมยข้อมูลคริปโตจากรูปภาพในแกลเลอรี ระวังการให้สิทธิ์แอปที่ไม่น่าไว้วางใจ...

Responsive image

นักวิจัยสหรัฐฯ สร้างคู่แข่ง AI จีน DeepSeek ด้วยต้นทุนแค่ 50 ดอลลาร์สหรัฐฯ

นักวิจัยจาก Stanford และ University of Washington สร้างโมเดล AI ด้านการให้เหตุผล s1 คู่แข่ง OpenAI o1 ด้วยต้นทุนต่ำกว่า 50 ดอลลาร์ โดยใช้เทคนิค Distillation และข้อมูลจาก Gemini 2.0...