
OpenAI ประกาศเปิดตัว GPT-5.3-Codex โมเดลปัญญาประดิษฐ์รุ่นใหม่ที่ยกระดับความสามารถของ Codex จากเดิมที่เป็นผู้ช่วยเขียนและตรวจโค้ด ให้กลายเป็นเอเจนต์อัจฉริยะที่สามารถทำงานระดับมืออาชีพบนคอมพิวเตอร์ได้อย่างครบวงจร ตั้งแต่งานพัฒนาโปรแกรม งานวิจัย การใช้เครื่องมือต่าง ๆ ไปจนถึงการลงมือทำงานที่ซับซ้อนและใช้เวลานาน
โมเดลใหม่นี้รวมจุดแข็งของ GPT-5.2-Codex ซึ่งโดดเด่นด้านการเขียนโค้ดระดับแนวหน้า เข้ากับความสามารถด้านการคิดวิเคราะห์ การให้เหตุผล และความรู้เชิงวิชาชีพของ GPT-5.2 ไว้ในโมเดลเดียว พร้อมเพิ่มประสิทธิภาพการทำงานให้เร็วขึ้นประมาณ 25% ช่วยให้รองรับงานที่ต้องทำต่อเนื่องยาว ๆ ได้ดีขึ้นอย่างเห็นได้ชัด
ความแตกต่างสำคัญคือ ผู้ใช้สามารถพูดคุย ซักถาม และปรับทิศทางการทำงานของ GPT-5.3-Codex ได้ระหว่างที่มันกำลังทำงานอยู่ โดยไม่ทำให้บริบทของงานหายไป ลักษณะการทำงานจึงใกล้เคียงกับการร่วมงานกับเพื่อนร่วมทีมจริง ๆ มากกว่าการรอผลลัพธ์จาก AI แบบเดิม
สิ่งที่น่าสนใจเป็นพิเศษคือ GPT-5.3-Codex เป็นโมเดลแรกของ OpenAI ที่มีบทบาทสำคัญในการพัฒนาตัวมันเอง ทีม Codex ได้นำเวอร์ชันเริ่มต้นของโมเดลมาใช้ช่วยตรวจสอบกระบวนการฝึก แก้ไขปัญหาในระบบการเทรน ดูแลการนำโมเดลขึ้นใช้งานจริง และวิเคราะห์ผลการทดสอบต่าง ๆ
ผลลัพธ์ที่ได้ทำให้ทีมงานประหลาดใจ เพราะ Codex สามารถช่วยเร่งการพัฒนาโมเดลของตัวเองได้อย่างมาก จนหลายคนในทีมมองว่าวิธีการทำงานของนักวิจัยและวิศวกรในช่วงไม่กี่เดือนที่ผ่านมา 'เปลี่ยนไปอย่างสิ้นเชิง' เมื่อมี Codex เข้ามาเป็นผู้ช่วย
OpenAI ระบุว่า GPT-5.3-Codex ทำผลงานได้โดดเด่นบนหลายเกณฑ์วัดมาตรฐานระดับอุตสาหกรรมที่ใช้ประเมินความสามารถของ AI ในงานเขียนโค้ด การทำงานแบบเอเจนต์ และการใช้งานจริงในสภาพแวดล้อมที่ซับซ้อน ได้แก่ SWE-Bench Pro, Terminal-Bench, OSWorld และ GDPval
ผลลัพธ์เหล่านี้สะท้อนว่า GPT-5.3-Codex ไม่ได้แค่เก่งงานใดงานหนึ่ง แต่กำลังขยับเข้าใกล้การเป็นเอเจนต์อเนกประสงค์ที่สามารถคิด วางแผน ลงมือทำและแก้ปัญหาได้ในโลกการทำงานจริง
ในด้านการเขียนโค้ด GPT-5.3-Codex ทำสถิติระดับสูงสุดบน SWE-Bench Pro ซึ่งเป็นการทดสอบที่จำลองงานซอฟต์แวร์จริงในอุตสาหกรรม แตกต่างจาก SWE-Bench รุ่นเดิมที่ทดสอบเฉพาะภาษา Python เพราะ SWE-Bench Pro ครอบคลุมถึง 4 ภาษา มีความยากสูงกว่า และลดโอกาสที่โมเดลจะเคยเห็นโจทย์มาก่อน
นอกจากนี้โมเดลยังทำคะแนนเหนือกว่ารุ่นก่อนอย่างชัดเจนบน Terminal-Bench 2.0 ซึ่งวัดทักษะการทำงานผ่านเทอร์มินัล เช่น การรันคำสั่ง แก้ปัญหาในระบบ และจัดการสภาพแวดล้อมการพัฒนา
จุดเด่นอีกอย่างคือ GPT-5.3-Codex สามารถทำงานเหล่านี้ได้โดยใช้จำนวนโทเคนหรือทรัพยากรน้อยกว่ารุ่นก่อน ๆ ทำให้ผู้ใช้สามารถสร้างและทดลองสิ่งต่าง ๆ ได้มากขึ้นในต้นทุนที่ใกล้เคียงเดิม
OpenAI ยังทดสอบความสามารถด้านการพัฒนาเว็บและการทำงานระยะยาว โดยให้ GPT-5.3-Codex สร้างเกมขึ้นมาใหม่ทั้งหมด 2 เกม ได้แก่ เวอร์ชันที่สองของเกมแข่งรถจากการเปิดตัว Codex app และเกมดำน้ำอีกหนึ่งเกม
ระหว่างการทดสอบ ทีมงานใช้คำสั่งทั่วไป เช่น แก้บั๊กหรือปรับปรุงเกม โดยไม่ต้องลงรายละเอียดมากโมเดลสามารถพัฒนาเกมต่อเนื่องได้ด้วยตัวเองเป็นเวลาหลายวัน ผ่านการประมวลผลหลายล้านโทเคนแสดงให้เห็นศักยภาพของการทำงานแบบเอเจนต์ที่ไม่ต้องคอยสั่งทีละขั้น
สำหรับงานเว็บไซต์ทั่วไป GPT-5.3-Codex ยังเข้าใจเจตนาของผู้ใช้ได้ดีขึ้น เมื่อได้รับคำสั่งที่สั้นหรือยังไม่ชัดเจน ระบบจะเลือกค่าเริ่มต้นที่พร้อมใช้งานจริงมากขึ้น เช่นการแสดงราคาสมาชิกแบบรายปีให้อยู่ในรูปส่วนลดรายเดือนหรือการสร้างส่วนรีวิวผู้ใช้งานหลายรายการโดยอัตโนมัติ ทำให้หน้าเว็บดูสมบูรณ์ตั้งแต่ครั้งแรกที่สร้าง
OpenAI ชี้ว่าในชีวิตจริง นักพัฒนา นักออกแบบ ผู้จัดการผลิตภัณฑ์และนักวิเคราะห์ข้อมูล ไม่ได้ทำแค่เขียนโค้ดเท่านั้น GPT-5.3-Codex จึงถูกออกแบบมาเพื่อรองรับงานตลอดทั้งวงจร ตั้งแต่การแก้ปัญหาเวลาระบบติดบั๊ก การนำระบบขึ้นใช้งาน การติดตามประสิทธิภาพ การเขียนเอกสารวางแผน แก้ไขข้อมูล ทำวิจัย กไปจนถึงการวิเคราะห์ตัวเลขและสร้างสไลด์นำเสนอ
ผลการประเมินบน GDPval ซึ่งเป็นการวัดความสามารถด้านความรู้ใน 44 อาชีพพบว่า GPT-5.3-Codex ทำผลงานได้ในระดับเดียวกับ GPT-5.2 สะท้อนว่าโมเดลนี้ไม่ได้จำกัดอยู่แค่งานเทคนิค แต่สามารถเป็นผู้ช่วยในงานสำนักงานและงานวิเคราะห์ได้เช่นกัน
บนการทดสอบ OSWorld ซึ่งจำลองการทำงานในสภาพแวดล้อมเดสก์ท็อปจริง GPT-5.3-Codex แสดงให้เห็นความสามารถในการใช้งานคอมพิวเตอร์ได้ดีกว่าโมเดล GPT รุ่นก่อน ๆ อย่างชัดเจน ทั้งการจัดการหน้าจอ โปรแกรมและขั้นตอนการทำงานที่มีหลายขั้น
OpenAI มองว่าผลลัพธ์ทั้งหมดนี้ชี้ให้เห็นว่า GPT-5.3-Codex ไม่ได้เป็นแค่ AI ที่เก่งงานเฉพาะด้าน แต่เป็นก้าวสำคัญสู่เอเจนต์ทั่วไปที่สามารถคิด สร้าง และลงมือทำงานในโลกจริงได้อย่างครบ
เมื่อเอเจนต์มีความสามารถมากขึ้น ความท้าทายจึงไม่ใช่แค่ว่า AI ทำอะไรได้บ้าง แต่คือมนุษย์จะควบคุมและทำงานร่วมกับมันได้ง่ายแค่ไหน Codex app จึงถูกพัฒนาให้ช่วยจัดการเอเจนต์หลายตัวได้สะดวกขึ้น และ GPT-5.3-Codex ก็ทำให้การสื่อสารระหว่างคนกับ AI เป็นธรรมชาติมากกว่าเดิม
ระหว่างที่โมเดลทำงาน ผู้ใช้จะได้รับอัปเดตความคืบหน้าอย่างต่อเนื่อง สามารถถามเหตุผล ปรับแนวทางหรือให้ข้อเสนอแนะได้ทันที โดยไม่ต้องรอผลลัพธ์สุดท้าย ทำให้กระบวนการทำงานร่วมกันโปร่งใสและควบคุมได้มากขึ้น
OpenAI เปิดเผยว่า การพัฒนา GPT-5.3-Codex เป็นผลลัพธ์จากงานวิจัยที่ต่อเนื่องมาหลายเดือนหรือหลายปี และ Codex เองก็มีบทบาทสำคัญในการเร่งงานเหล่านี้ ทีมวิจัยใช้ Codex เพื่อติดตามและแก้ปัญหาเวลาระบบติดบั๊กในกระบวนการฝึกโมเดล วิเคราะห์รูปแบบพฤติกรรมของโมเดลระหว่างการเทรน และสร้างเครื่องมือช่วยให้นักวิจัยเข้าใจความแตกต่างระหว่างรุ่นใหม่และรุ่นก่อนหน้าได้ชัดเจนขึ้น
ฝั่งวิศวกรรมใช้ Codex ในการปรับปรุงระบบรองรับการใช้งานจริง แก้ปัญหาที่ส่งผลต่อผู้ใช้ และจัดการโครงสร้างพื้นฐาน เช่น การปรับขนาดคลัสเตอร์ GPU ให้รองรับการใช้งานที่เพิ่มขึ้น โดยรักษาความเร็วและความเสถียรของระบบ
OpenAI ระบุว่า GPT-5.3-Codex เป็นโมเดลแรกที่ถูกจัดอยู่ในระดับ High capability ด้านงานไซเบอร์ภายใต้ Preparedness Framework และเป็นโมเดลแรกที่ได้รับการฝึกให้ตรวจจับช่องโหว่ซอฟต์แวร์โดยตรง
แม้จะยังไม่มีหลักฐานว่าโมเดลสามารถโจมตีระบบไซเบอร์แบบครบกระบวนการได้เอง OpenAI ก็เลือกใช้แนวทางป้องกันเชิงรุก ด้วยมาตรการความปลอดภัยที่ครอบคลุมที่สุด ทั้งการฝึกด้านความปลอดภัย การเฝ้าระวังอัตโนมัติ การจำกัดการเข้าถึงความสามารถขั้นสูงและการบังคับใช้ผ่านระบบข่าวกรองด้านภัยคุกคาม
พร้อมกันนี้ OpenAI ยังเปิดโครงการ Trusted Access for Cyber เพื่อสนับสนุนงานวิจัยด้านการป้องกันภัยไซเบอร์ ขยายการทดสอบเครื่องมือด้านความปลอดภัย และลงทุน API credits มูลค่า 10 ล้านดอลลาร์สหรัฐ เพื่อช่วยนักวิจัยโครงการโอเพ่นซอร์สและระบบโครงสร้างพื้นฐานสำคัญ
GPT-5.3-Codex พร้อมให้ใช้งานแล้วสำหรับผู้ใช้ ChatGPT แบบเสียเงินผ่าน Codex app, CLI, ส่วนขยายสำหรับ IDE และเวอร์ชันเว็บ โดย OpenAI กำลังเตรียมเปิดให้ใช้งานผ่าน API อย่างปลอดภัยในอนาคตอันใกล้
โมเดลนี้ถูกออกแบบและให้บริการบนระบบ NVIDIA GB200 NVL72 ซึ่งช่วยเพิ่มประสิทธิภาพและความเร็วในการประมวลผล
OpenAI สรุปว่า GPT-5.3-Codex คือจุดเปลี่ยนจากการเป็น AI ที่ 'เขียนโค้ดเก่ง' ไปสู่การเป็น 'ผู้ร่วมงานอเนกประสงค์บนคอมพิวเตอร์' ที่สามารถช่วยมนุษย์คิด วางแผนและลงมือทำงานได้ตั้งแต่ต้นจนจบ พร้อมเปิดทางให้คนทั่วไปและนักพัฒนาสร้างงานได้มากขึ้นด้วย Codex
อ้างอิง: openai
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด