OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI | Techsauce

OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI

OpenAI เปิดตัว o3 และ o3-mini โมเดล AI ตัวใหม่ที่พัฒนาต่อยอดมาจาก o1 ที่เพิ่งเปิดตัวให้เห็นเมื่อเดือนกันยายน ปี 2024 โดยมาพร้อมกับความสามารถเด่นในเรื่องของ Reasoning หรือการให้เหตุผล ซึ่งนี่อาจเป็นก้าวต่อไปที่ทำให้เข้าใกล้ยุค AGI หรือขั้นต่อไปของปัญญาประดิษฐ์ที่จะมีความสามารถที่เหนือกว่ามนุษย์ในหลายๆ ด้าน


o3 มีอะไรดี ?

ความพิเศษของ o3 อยู่ที่ "ความสามารถในการให้เหตุผล" ซึ่งหมายความว่ามันสามารถ "คิด" และ "ตรวจสอบ" คำตอบของตัวเองได้ ก่อนที่จะตอบเรา โดยปกติแล้วหากเราถามคำถามยากๆ กับ AI มันอาจจะตอบผิดหรือให้ข้อมูลที่ไม่ถูกต้อง แต่ o3 ต่างออกไป เพราะมันถูกฝึกมาให้คิดอย่างรอบคอบก่อนตอบ

โดยเมื่อเราถามคำถามกับ o3 แทนที่มันจะตอบทันที o3 จะหยุดคิดสักครู่ราวกับว่ามันกำลังคิดอยู่ในใจ โดยพิจารณาคำถามที่คล้ายกันหลายๆ คำถาม และอธิบายขั้นตอนการคิดให้ทราบ จากนั้น o3 จะตรวจสอบคำตอบของตัวเองอย่างละเอียดเพื่อให้แน่ใจว่าถูกต้องที่สุด ซึ่งหลังจากคิด และตรวจสอบแล้ว o3 จะทำการสรุปคำตอบที่ดีที่สุดให้กับผู้ใช้

ทั้งนี้ o3 และ o3-mini จะเปิดให้นักวิจัยบางส่วนได้ใช้งานเวอร์ชันพรีวิวก่อนเป็นกลุ่มแรก ก่อนที่จะเปิดให้ผู้ใช้ทั่วไปใช้งานช่วงเดือนมกราคม 2025


o3 เก่งแค่ไหน เข้าใกล้ AGI หรือยัง ?

ในการทดสอบ SWE-Bench Verified ซึ่งเป็นการทดสอบความสามารถด้านการเขียนโปรแกรม o3 ทำคะแนนได้ดีกว่า o1 ราว 22.8% ส่วนการทดสอบ Codeforce หรือการแข่งขันเขียนโปรแกรม o3 ได้คะแนนสูงถึง 2,727 ซึ่งนับว่าเป็นคะแนนที่สูงมาก เพราะหากได้คะแนนราว 2,400 ก็ถือว่าเก่งกว่าโปรแกรมเมอร์ราว 99.2% บนโลกแล้ว

ส่วนการทดสอบ American Invitational Mathematics Exam หรือการทดสอบเลขระดับยากของอเมริกา o3 ทำคะแนนได้เกือบเต็มที่ 96.7% ตอบผิดเพียงแค่ข้อเดียว ส่วนการทดสอบ Frontier Math หรือการทดสอบคณิตศาสตร์ขั้นสูง o3 ก็สามารถทำลายสถิติ แก้โจทย์ได้ 25.2% ในขณะที่ AI ตัวอื่นๆ ทำได้ไม่เกิน 2%

แม้ Sam Altman ซีอีโอของ OpenAI จะเคยกล่าวว่า ปี 2025 อาจเป็นปีที่มนุษย์ได้เห็น AGI แต่ดูเหมือนว่า โมเดล o3 ตัวใหม่อาจจะยังไม่ไปถึงจุดนั้น โดยจากการทดสอบ ARC-AGI ซึ่งเป็นการทดสอบที่ออกแบบมาเพื่อประเมินว่าระบบ AI สามารถได้รับทักษะใหม่ๆ นอกจากข้อมูลที่ได้ระบการฝึกฝนหรือไม่ 

ARC-AGI ค้นพบว่า o3 เป็นโมเดลที่ถือว่ามีความก้าวหน้าในเรื่องของความสามารถเป็นอย่างมาก แต่ค่าใช้จ่ายในการแก้โจทย์ ARC-AGI ยังถือว่าสูงอยู่ที่ราว 17-20 ดอลลาร์สหรัฐฯ ต่อข้อ แม้จะประมวลผลในโหมด low-compute (หากจ้างมนุษย์แก้โจทย์เดียวกันจะอยู่ที่ราว 5 ดอลลาร์สหรัฐฯ)

โดยทาง ARC-AGI มองว่า o3 ยังไม่ใช่ AGI ที่แท้จริงเพราะยังทำโจทย์ง่ายๆ บางข้อผิดพลาด รวมทั้งแบบทดสอบ ARC-AGI 2 ที่กำลังจะออกมาใหม่น่าจะเป็นโจทย์ที่ท้าทายสำหรับ o3 มากกว่าตอนนี้มาก และอาจทำให้คะแนนลดลงเหลือต่ำกว่า 30% 

ทาง ARC-AGI สรุปทิ้งท้ายไว้อย่างน่าสนใจว่า ถ้าวันไหนที่เราพยายามคิดโจทย์ง่ายๆ ให้มนุษย์ทำ แต่กลับพบว่า AI ก็ทำได้หมดทุกข้อ ไม่ว่าจะพยายามแค่ไหน นั่นแหละคือสัญญาณว่า AGI ได้เกิดขึ้นจริงแล้ว ซึ่งในตอนนี้ o3 ยังไปไม่ถึงจุดนั้น


อ้างอิง : techcrunch, arcprize



ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

พลังผู้หญิงเปลี่ยนโลก! CP ทลายกำแพงเพศ ดันผู้นำหญิง สร้างสังคมเท่าเทียม พร้อมผลักดันสังคมให้ก้าวหน้าอย่างแข็งแกร่ง-ยั่งยืน

8 มีนาคม วันสตรีสากล เครือเจริญโภคภัณฑ์ (CP) ได้ประกาศเจตนารมณ์ในการส่งเสริมความเท่าเทียมทางเพศ ตอกย้ำถึงความสำคัญของบทบาทสตรีในทุกระดับขององค์กร พร้อมเปิดพื้นที่ให้ผู้หญิงได้แสดงศ...

Responsive image

เปิดตัวแบตเตอรี่ทนร้อน SCiB ที่ Toshiba x naturenix ให้มอเตอร์ไซค์รับจ้างทดลองใช้

Toshiba Corporation กับ naturenix inc. สตาร์ทอัพจากแดนปลาดิบ สนใจเปิดบริการ 'แบตเตอรี่ให้เช่าสำหรับมอเตอร์ไซค์รับจ้างไฟฟ้า' ในไทย โดยชูจุดเด่นเรื่องชาร์จซ้ำได้ 20,000 รอบ และทนความ...

Responsive image

Nasket ฉลอง 10 ปี เปิดตัว ‘ตู้น้องแพค’ นวัตกรรมใหม่ลุยตลาดรีเทลคอนโดฯ เสิร์ฟน้ำดื่มถึงคอนโดฯ กว่า 1,200 แห่งทั่วประเทศ

Nasket (บริษัท นาสเกต รีเทล จำกัด) ผู้เชี่ยวชาญด้านนวัตกรรมสินค้าและบริการอัจฉริยะสำหรับคอนโดมิเนียม ประกาศฉลองครบรอบ 10 ปี ด้วยการเปิดตัว "ตู้น้องแพค พลัส กับคริสตัล" ตู้จำหน่ายน้...