OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI | Techsauce

OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI

OpenAI เปิดตัว o3 และ o3-mini โมเดล AI ตัวใหม่ที่พัฒนาต่อยอดมาจาก o1 ที่เพิ่งเปิดตัวให้เห็นเมื่อเดือนกันยายน ปี 2024 โดยมาพร้อมกับความสามารถเด่นในเรื่องของ Reasoning หรือการให้เหตุผล ซึ่งนี่อาจเป็นก้าวต่อไปที่ทำให้เข้าใกล้ยุค AGI หรือขั้นต่อไปของปัญญาประดิษฐ์ที่จะมีความสามารถที่เหนือกว่ามนุษย์ในหลายๆ ด้าน


o3 มีอะไรดี ?

ความพิเศษของ o3 อยู่ที่ "ความสามารถในการให้เหตุผล" ซึ่งหมายความว่ามันสามารถ "คิด" และ "ตรวจสอบ" คำตอบของตัวเองได้ ก่อนที่จะตอบเรา โดยปกติแล้วหากเราถามคำถามยากๆ กับ AI มันอาจจะตอบผิดหรือให้ข้อมูลที่ไม่ถูกต้อง แต่ o3 ต่างออกไป เพราะมันถูกฝึกมาให้คิดอย่างรอบคอบก่อนตอบ

โดยเมื่อเราถามคำถามกับ o3 แทนที่มันจะตอบทันที o3 จะหยุดคิดสักครู่ราวกับว่ามันกำลังคิดอยู่ในใจ โดยพิจารณาคำถามที่คล้ายกันหลายๆ คำถาม และอธิบายขั้นตอนการคิดให้ทราบ จากนั้น o3 จะตรวจสอบคำตอบของตัวเองอย่างละเอียดเพื่อให้แน่ใจว่าถูกต้องที่สุด ซึ่งหลังจากคิด และตรวจสอบแล้ว o3 จะทำการสรุปคำตอบที่ดีที่สุดให้กับผู้ใช้

ทั้งนี้ o3 และ o3-mini จะเปิดให้นักวิจัยบางส่วนได้ใช้งานเวอร์ชันพรีวิวก่อนเป็นกลุ่มแรก ก่อนที่จะเปิดให้ผู้ใช้ทั่วไปใช้งานช่วงเดือนมกราคม 2025


o3 เก่งแค่ไหน เข้าใกล้ AGI หรือยัง ?

ในการทดสอบ SWE-Bench Verified ซึ่งเป็นการทดสอบความสามารถด้านการเขียนโปรแกรม o3 ทำคะแนนได้ดีกว่า o1 ราว 22.8% ส่วนการทดสอบ Codeforce หรือการแข่งขันเขียนโปรแกรม o3 ได้คะแนนสูงถึง 2,727 ซึ่งนับว่าเป็นคะแนนที่สูงมาก เพราะหากได้คะแนนราว 2,400 ก็ถือว่าเก่งกว่าโปรแกรมเมอร์ราว 99.2% บนโลกแล้ว

ส่วนการทดสอบ American Invitational Mathematics Exam หรือการทดสอบเลขระดับยากของอเมริกา o3 ทำคะแนนได้เกือบเต็มที่ 96.7% ตอบผิดเพียงแค่ข้อเดียว ส่วนการทดสอบ Frontier Math หรือการทดสอบคณิตศาสตร์ขั้นสูง o3 ก็สามารถทำลายสถิติ แก้โจทย์ได้ 25.2% ในขณะที่ AI ตัวอื่นๆ ทำได้ไม่เกิน 2%

แม้ Sam Altman ซีอีโอของ OpenAI จะเคยกล่าวว่า ปี 2025 อาจเป็นปีที่มนุษย์ได้เห็น AGI แต่ดูเหมือนว่า โมเดล o3 ตัวใหม่อาจจะยังไม่ไปถึงจุดนั้น โดยจากการทดสอบ ARC-AGI ซึ่งเป็นการทดสอบที่ออกแบบมาเพื่อประเมินว่าระบบ AI สามารถได้รับทักษะใหม่ๆ นอกจากข้อมูลที่ได้ระบการฝึกฝนหรือไม่ 

ARC-AGI ค้นพบว่า o3 เป็นโมเดลที่ถือว่ามีความก้าวหน้าในเรื่องของความสามารถเป็นอย่างมาก แต่ค่าใช้จ่ายในการแก้โจทย์ ARC-AGI ยังถือว่าสูงอยู่ที่ราว 17-20 ดอลลาร์สหรัฐฯ ต่อข้อ แม้จะประมวลผลในโหมด low-compute (หากจ้างมนุษย์แก้โจทย์เดียวกันจะอยู่ที่ราว 5 ดอลลาร์สหรัฐฯ)

โดยทาง ARC-AGI มองว่า o3 ยังไม่ใช่ AGI ที่แท้จริงเพราะยังทำโจทย์ง่ายๆ บางข้อผิดพลาด รวมทั้งแบบทดสอบ ARC-AGI 2 ที่กำลังจะออกมาใหม่น่าจะเป็นโจทย์ที่ท้าทายสำหรับ o3 มากกว่าตอนนี้มาก และอาจทำให้คะแนนลดลงเหลือต่ำกว่า 30% 

ทาง ARC-AGI สรุปทิ้งท้ายไว้อย่างน่าสนใจว่า ถ้าวันไหนที่เราพยายามคิดโจทย์ง่ายๆ ให้มนุษย์ทำ แต่กลับพบว่า AI ก็ทำได้หมดทุกข้อ ไม่ว่าจะพยายามแค่ไหน นั่นแหละคือสัญญาณว่า AGI ได้เกิดขึ้นจริงแล้ว ซึ่งในตอนนี้ o3 ยังไปไม่ถึงจุดนั้น


อ้างอิง : techcrunch, arcprize



ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

รวี บุญสินสุข ขึ้นแท่น CEO คนใหม่ BCPG

บอร์ดบริหารของ บีซีพีจี (BCPG) มีมติแต่งตั้ง นายรวี บุญสินสุข วัย 49 ปี ดำรงตำแหน่งประธานเจ้าหน้าที่บริหารและกรรมการผู้จัดการใหญ่คนใหม่ แทนที่นายนิวัติ อดิเรก โดยมีผลตั้งแต่วันที่ ...

Responsive image

ซีอีโอ Nike เผย 3 สิ่งที่ทำบริษัทพลาดมาตลอดจนทำให้ไนกี้ไม่เหมือนเดิม

ปลายปี 2024 ที่ผ่านมา Nike เกิดการเปลี่ยนแปลงครั้งใหญ่นั่นคือ การลาออกของ John Donahole ในตำแหน่งซีอีโอ และได้ลูกหม้ออย่าง Elliott Hill ที่เริ่มทำงานกับ Nike มาอย่างยาวนานขึ้นมารับ...

Responsive image

กูเกิลปรับนิยาม "Googleyness" ใหม่ ซีอีโอเน้นกล้าคิด กล้าทำ มีเป้าหมาย เป็นคุณสมบัติที่มองหา

"Googleyness" คำที่เคยใช้อธิบายความเป็นกูเกิล ได้รับการปรับความหมายใหม่ในปี 2024 โดย Sundar Pichai ซีอีโอของกูเกิลเอง เพราะที่ผ่านมาคำนี้ค่อนข้างกว้างและไม่ชัดเจน ในการประชุม Pich...