OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI | Techsauce

OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI

OpenAI เปิดตัว o3 และ o3-mini โมเดล AI ตัวใหม่ที่พัฒนาต่อยอดมาจาก o1 ที่เพิ่งเปิดตัวให้เห็นเมื่อเดือนกันยายน ปี 2024 โดยมาพร้อมกับความสามารถเด่นในเรื่องของ Reasoning หรือการให้เหตุผล ซึ่งนี่อาจเป็นก้าวต่อไปที่ทำให้เข้าใกล้ยุค AGI หรือขั้นต่อไปของปัญญาประดิษฐ์ที่จะมีความสามารถที่เหนือกว่ามนุษย์ในหลายๆ ด้าน


o3 มีอะไรดี ?

ความพิเศษของ o3 อยู่ที่ "ความสามารถในการให้เหตุผล" ซึ่งหมายความว่ามันสามารถ "คิด" และ "ตรวจสอบ" คำตอบของตัวเองได้ ก่อนที่จะตอบเรา โดยปกติแล้วหากเราถามคำถามยากๆ กับ AI มันอาจจะตอบผิดหรือให้ข้อมูลที่ไม่ถูกต้อง แต่ o3 ต่างออกไป เพราะมันถูกฝึกมาให้คิดอย่างรอบคอบก่อนตอบ

โดยเมื่อเราถามคำถามกับ o3 แทนที่มันจะตอบทันที o3 จะหยุดคิดสักครู่ราวกับว่ามันกำลังคิดอยู่ในใจ โดยพิจารณาคำถามที่คล้ายกันหลายๆ คำถาม และอธิบายขั้นตอนการคิดให้ทราบ จากนั้น o3 จะตรวจสอบคำตอบของตัวเองอย่างละเอียดเพื่อให้แน่ใจว่าถูกต้องที่สุด ซึ่งหลังจากคิด และตรวจสอบแล้ว o3 จะทำการสรุปคำตอบที่ดีที่สุดให้กับผู้ใช้

ทั้งนี้ o3 และ o3-mini จะเปิดให้นักวิจัยบางส่วนได้ใช้งานเวอร์ชันพรีวิวก่อนเป็นกลุ่มแรก ก่อนที่จะเปิดให้ผู้ใช้ทั่วไปใช้งานช่วงเดือนมกราคม 2025


o3 เก่งแค่ไหน เข้าใกล้ AGI หรือยัง ?

ในการทดสอบ SWE-Bench Verified ซึ่งเป็นการทดสอบความสามารถด้านการเขียนโปรแกรม o3 ทำคะแนนได้ดีกว่า o1 ราว 22.8% ส่วนการทดสอบ Codeforce หรือการแข่งขันเขียนโปรแกรม o3 ได้คะแนนสูงถึง 2,727 ซึ่งนับว่าเป็นคะแนนที่สูงมาก เพราะหากได้คะแนนราว 2,400 ก็ถือว่าเก่งกว่าโปรแกรมเมอร์ราว 99.2% บนโลกแล้ว

ส่วนการทดสอบ American Invitational Mathematics Exam หรือการทดสอบเลขระดับยากของอเมริกา o3 ทำคะแนนได้เกือบเต็มที่ 96.7% ตอบผิดเพียงแค่ข้อเดียว ส่วนการทดสอบ Frontier Math หรือการทดสอบคณิตศาสตร์ขั้นสูง o3 ก็สามารถทำลายสถิติ แก้โจทย์ได้ 25.2% ในขณะที่ AI ตัวอื่นๆ ทำได้ไม่เกิน 2%

แม้ Sam Altman ซีอีโอของ OpenAI จะเคยกล่าวว่า ปี 2025 อาจเป็นปีที่มนุษย์ได้เห็น AGI แต่ดูเหมือนว่า โมเดล o3 ตัวใหม่อาจจะยังไม่ไปถึงจุดนั้น โดยจากการทดสอบ ARC-AGI ซึ่งเป็นการทดสอบที่ออกแบบมาเพื่อประเมินว่าระบบ AI สามารถได้รับทักษะใหม่ๆ นอกจากข้อมูลที่ได้ระบการฝึกฝนหรือไม่ 

ARC-AGI ค้นพบว่า o3 เป็นโมเดลที่ถือว่ามีความก้าวหน้าในเรื่องของความสามารถเป็นอย่างมาก แต่ค่าใช้จ่ายในการแก้โจทย์ ARC-AGI ยังถือว่าสูงอยู่ที่ราว 17-20 ดอลลาร์สหรัฐฯ ต่อข้อ แม้จะประมวลผลในโหมด low-compute (หากจ้างมนุษย์แก้โจทย์เดียวกันจะอยู่ที่ราว 5 ดอลลาร์สหรัฐฯ)

โดยทาง ARC-AGI มองว่า o3 ยังไม่ใช่ AGI ที่แท้จริงเพราะยังทำโจทย์ง่ายๆ บางข้อผิดพลาด รวมทั้งแบบทดสอบ ARC-AGI 2 ที่กำลังจะออกมาใหม่น่าจะเป็นโจทย์ที่ท้าทายสำหรับ o3 มากกว่าตอนนี้มาก และอาจทำให้คะแนนลดลงเหลือต่ำกว่า 30% 

ทาง ARC-AGI สรุปทิ้งท้ายไว้อย่างน่าสนใจว่า ถ้าวันไหนที่เราพยายามคิดโจทย์ง่ายๆ ให้มนุษย์ทำ แต่กลับพบว่า AI ก็ทำได้หมดทุกข้อ ไม่ว่าจะพยายามแค่ไหน นั่นแหละคือสัญญาณว่า AGI ได้เกิดขึ้นจริงแล้ว ซึ่งในตอนนี้ o3 ยังไปไม่ถึงจุดนั้น


อ้างอิง : techcrunch, arcprize



ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

สรุปภารกิจนายกฯ บนเวทีโลก ในงานประชุม World Economic Forum 2025

นายกรัฐมนตรีแพทองธาร ได้เป็นตัวแทนประเทศไทยในงาน World Economic Forum (WEF) 2025 ที่จัดขึ้นระหว่างวันที่ 20-25 มกราคม 2025 ที่เมืองดาวอส ประเทศสวิตเซอร์แลนด์ ซึ่งถือเป็นครั้งแรกในร...

Responsive image

อาเซียนร่วมใจ แสงแห่งความหวัง พลังขับเคลื่อนเศรษฐกิจดิจิทัลในเวทีโลก

ร่วมสำรวจเชิงลึกถึงศักยภาพ ความท้าทาย และวิสัยทัศน์ของภูมิภาคอาเซียน ซึ่งกำลังก้าวขึ้นมามีบทบาทสำคัญในเวทีโลก ในการเสวนาหัวข้อ 'ASEAN: Even Stronger Together' หรือ อาเซียนยิ่งร่วมใ...

Responsive image

สรุป FTA ไทย-EFTA คืออะไร ? ส่งผลอย่างไรกับประเทศ ? และไทยจะได้จากข้อตกลงครั้งนี้ ?

ปี 2025 เป็นอีกปีที่ไทยได้เข้าร่วมงานประชุม World Economic Forum ที่เมืองดาวอส โดยในปีนี้ นายกฯ แพทองธาร ได้ไปปฏิบัติภารกิจสำคัญหลายอย่างทั้งการประชุมกับผู้นำโลก เผยแพร่ซอฟต์พาวเวอ...