OpenAI เปิดตัว GPT-5.3-Codex เอเจนต์อัจฉริยะ เร็วขึ้น 25% ใช้โทเคนน้อยลง ทำงานครบตั้งแต่เขียนโค้ดถึงวางแผน

OpenAI เปิดตัว GPT-5.3-Codex

OpenAI ประกาศเปิดตัว GPT-5.3-Codex โมเดลปัญญาประดิษฐ์รุ่นใหม่ที่ยกระดับความสามารถของ Codex จากเดิมที่เป็นผู้ช่วยเขียนและตรวจโค้ด ให้กลายเป็นเอเจนต์อัจฉริยะที่สามารถทำงานระดับมืออาชีพบนคอมพิวเตอร์ได้อย่างครบวงจร ตั้งแต่งานพัฒนาโปรแกรม งานวิจัย การใช้เครื่องมือต่าง ๆ ไปจนถึงการลงมือทำงานที่ซับซ้อนและใช้เวลานาน

โมเดลใหม่นี้รวมจุดแข็งของ GPT-5.2-Codex ซึ่งโดดเด่นด้านการเขียนโค้ดระดับแนวหน้า เข้ากับความสามารถด้านการคิดวิเคราะห์ การให้เหตุผล และความรู้เชิงวิชาชีพของ GPT-5.2 ไว้ในโมเดลเดียว พร้อมเพิ่มประสิทธิภาพการทำงานให้เร็วขึ้นประมาณ 25% ช่วยให้รองรับงานที่ต้องทำต่อเนื่องยาว ๆ ได้ดีขึ้นอย่างเห็นได้ชัด

ความแตกต่างสำคัญคือ ผู้ใช้สามารถพูดคุย ซักถาม และปรับทิศทางการทำงานของ GPT-5.3-Codex ได้ระหว่างที่มันกำลังทำงานอยู่ โดยไม่ทำให้บริบทของงานหายไป ลักษณะการทำงานจึงใกล้เคียงกับการร่วมงานกับเพื่อนร่วมทีมจริง ๆ มากกว่าการรอผลลัพธ์จาก AI แบบเดิม

โมเดล AI แรกที่เรียนรู้ต่อจากสิ่งที่ตัวเองสร้าง

สิ่งที่น่าสนใจเป็นพิเศษคือ GPT-5.3-Codex เป็นโมเดลแรกของ OpenAI ที่มีบทบาทสำคัญในการพัฒนาตัวมันเอง ทีม Codex ได้นำเวอร์ชันเริ่มต้นของโมเดลมาใช้ช่วยตรวจสอบกระบวนการฝึก แก้ไขปัญหาในระบบการเทรน ดูแลการนำโมเดลขึ้นใช้งานจริง และวิเคราะห์ผลการทดสอบต่าง ๆ

ผลลัพธ์ที่ได้ทำให้ทีมงานประหลาดใจ เพราะ Codex สามารถช่วยเร่งการพัฒนาโมเดลของตัวเองได้อย่างมาก จนหลายคนในทีมมองว่าวิธีการทำงานของนักวิจัยและวิศวกรในช่วงไม่กี่เดือนที่ผ่านมา 'เปลี่ยนไปอย่างสิ้นเชิง' เมื่อมี Codex เข้ามาเป็นผู้ช่วย

เอเจนต์อัจฉริยะ เวอร์ชันที่ทำได้มากกว่าเดิม 

OpenAI ระบุว่า GPT-5.3-Codex ทำผลงานได้โดดเด่นบนหลายเกณฑ์วัดมาตรฐานระดับอุตสาหกรรมที่ใช้ประเมินความสามารถของ AI ในงานเขียนโค้ด การทำงานแบบเอเจนต์ และการใช้งานจริงในสภาพแวดล้อมที่ซับซ้อน ได้แก่ SWE-Bench Pro, Terminal-Bench, OSWorld และ GDPval

ผลลัพธ์เหล่านี้สะท้อนว่า GPT-5.3-Codex ไม่ได้แค่เก่งงานใดงานหนึ่ง แต่กำลังขยับเข้าใกล้การเป็นเอเจนต์อเนกประสงค์ที่สามารถคิด วางแผน ลงมือทำและแก้ปัญหาได้ในโลกการทำงานจริง

ความสามารถด้านการเขียนโค้ดที่ก้าวกระโดด

ในด้านการเขียนโค้ด GPT-5.3-Codex ทำสถิติระดับสูงสุดบน SWE-Bench Pro ซึ่งเป็นการทดสอบที่จำลองงานซอฟต์แวร์จริงในอุตสาหกรรม แตกต่างจาก SWE-Bench รุ่นเดิมที่ทดสอบเฉพาะภาษา Python เพราะ SWE-Bench Pro ครอบคลุมถึง 4 ภาษา มีความยากสูงกว่า และลดโอกาสที่โมเดลจะเคยเห็นโจทย์มาก่อน

นอกจากนี้โมเดลยังทำคะแนนเหนือกว่ารุ่นก่อนอย่างชัดเจนบน Terminal-Bench 2.0 ซึ่งวัดทักษะการทำงานผ่านเทอร์มินัล เช่น การรันคำสั่ง แก้ปัญหาในระบบ และจัดการสภาพแวดล้อมการพัฒนา

จุดเด่นอีกอย่างคือ GPT-5.3-Codex สามารถทำงานเหล่านี้ได้โดยใช้จำนวนโทเคนหรือทรัพยากรน้อยกว่ารุ่นก่อน ๆ ทำให้ผู้ใช้สามารถสร้างและทดลองสิ่งต่าง ๆ ได้มากขึ้นในต้นทุนที่ใกล้เคียงเดิม

สร้างเว็บและเกมได้เองอัตโนมัติ 

OpenAI ยังทดสอบความสามารถด้านการพัฒนาเว็บและการทำงานระยะยาว โดยให้ GPT-5.3-Codex สร้างเกมขึ้นมาใหม่ทั้งหมด 2 เกม ได้แก่ เวอร์ชันที่สองของเกมแข่งรถจากการเปิดตัว Codex app และเกมดำน้ำอีกหนึ่งเกม

ระหว่างการทดสอบ ทีมงานใช้คำสั่งทั่วไป เช่น แก้บั๊กหรือปรับปรุงเกม โดยไม่ต้องลงรายละเอียดมากโมเดลสามารถพัฒนาเกมต่อเนื่องได้ด้วยตัวเองเป็นเวลาหลายวัน ผ่านการประมวลผลหลายล้านโทเคนแสดงให้เห็นศักยภาพของการทำงานแบบเอเจนต์ที่ไม่ต้องคอยสั่งทีละขั้น

สำหรับงานเว็บไซต์ทั่วไป GPT-5.3-Codex ยังเข้าใจเจตนาของผู้ใช้ได้ดีขึ้น เมื่อได้รับคำสั่งที่สั้นหรือยังไม่ชัดเจน ระบบจะเลือกค่าเริ่มต้นที่พร้อมใช้งานจริงมากขึ้น เช่นการแสดงราคาสมาชิกแบบรายปีให้อยู่ในรูปส่วนลดรายเดือนหรือการสร้างส่วนรีวิวผู้ใช้งานหลายรายการโดยอัตโนมัติ ทำให้หน้าเว็บดูสมบูรณ์ตั้งแต่ครั้งแรกที่สร้าง

ไม่ได้เก่งแค่โค้ด แต่งานครบทั้งวงจรการทำงาน

OpenAI ชี้ว่าในชีวิตจริง นักพัฒนา นักออกแบบ ผู้จัดการผลิตภัณฑ์และนักวิเคราะห์ข้อมูล ไม่ได้ทำแค่เขียนโค้ดเท่านั้น GPT-5.3-Codex จึงถูกออกแบบมาเพื่อรองรับงานตลอดทั้งวงจร ตั้งแต่การแก้ปัญหาเวลาระบบติดบั๊ก การนำระบบขึ้นใช้งาน การติดตามประสิทธิภาพ การเขียนเอกสารวางแผน แก้ไขข้อมูล ทำวิจัย กไปจนถึงการวิเคราะห์ตัวเลขและสร้างสไลด์นำเสนอ

ผลการประเมินบน GDPval ซึ่งเป็นการวัดความสามารถด้านความรู้ใน 44 อาชีพพบว่า GPT-5.3-Codex ทำผลงานได้ในระดับเดียวกับ GPT-5.2 สะท้อนว่าโมเดลนี้ไม่ได้จำกัดอยู่แค่งานเทคนิค แต่สามารถเป็นผู้ช่วยในงานสำนักงานและงานวิเคราะห์ได้เช่นกัน

ใช้งานคอมพิวเตอร์ได้ใกล้เคียงมนุษย์มากขึ้น

บนการทดสอบ OSWorld ซึ่งจำลองการทำงานในสภาพแวดล้อมเดสก์ท็อปจริง GPT-5.3-Codex แสดงให้เห็นความสามารถในการใช้งานคอมพิวเตอร์ได้ดีกว่าโมเดล GPT รุ่นก่อน ๆ อย่างชัดเจน ทั้งการจัดการหน้าจอ โปรแกรมและขั้นตอนการทำงานที่มีหลายขั้น

OpenAI มองว่าผลลัพธ์ทั้งหมดนี้ชี้ให้เห็นว่า GPT-5.3-Codex ไม่ได้เป็นแค่ AI ที่เก่งงานเฉพาะด้าน แต่เป็นก้าวสำคัญสู่เอเจนต์ทั่วไปที่สามารถคิด สร้าง และลงมือทำงานในโลกจริงได้อย่างครบ

ผู้ช่วยอัจฉริยะที่คุยและปรับงานได้ตลอดเวลา 

เมื่อเอเจนต์มีความสามารถมากขึ้น ความท้าทายจึงไม่ใช่แค่ว่า AI ทำอะไรได้บ้าง แต่คือมนุษย์จะควบคุมและทำงานร่วมกับมันได้ง่ายแค่ไหน Codex app จึงถูกพัฒนาให้ช่วยจัดการเอเจนต์หลายตัวได้สะดวกขึ้น และ GPT-5.3-Codex ก็ทำให้การสื่อสารระหว่างคนกับ AI เป็นธรรมชาติมากกว่าเดิม

ระหว่างที่โมเดลทำงาน ผู้ใช้จะได้รับอัปเดตความคืบหน้าอย่างต่อเนื่อง สามารถถามเหตุผล ปรับแนวทางหรือให้ข้อเสนอแนะได้ทันที โดยไม่ต้องรอผลลัพธ์สุดท้าย ทำให้กระบวนการทำงานร่วมกันโปร่งใสและควบคุมได้มากขึ้น

เบื้องหลังการฝึกและการนำไปใช้งานจริง

OpenAI เปิดเผยว่า การพัฒนา GPT-5.3-Codex เป็นผลลัพธ์จากงานวิจัยที่ต่อเนื่องมาหลายเดือนหรือหลายปี และ Codex เองก็มีบทบาทสำคัญในการเร่งงานเหล่านี้ ทีมวิจัยใช้ Codex เพื่อติดตามและแก้ปัญหาเวลาระบบติดบั๊กในกระบวนการฝึกโมเดล วิเคราะห์รูปแบบพฤติกรรมของโมเดลระหว่างการเทรน และสร้างเครื่องมือช่วยให้นักวิจัยเข้าใจความแตกต่างระหว่างรุ่นใหม่และรุ่นก่อนหน้าได้ชัดเจนขึ้น

ฝั่งวิศวกรรมใช้ Codex ในการปรับปรุงระบบรองรับการใช้งานจริง แก้ปัญหาที่ส่งผลต่อผู้ใช้ และจัดการโครงสร้างพื้นฐาน เช่น การปรับขนาดคลัสเตอร์ GPU ให้รองรับการใช้งานที่เพิ่มขึ้น โดยรักษาความเร็วและความเสถียรของระบบ

ระบบความปลอดภัยเข้มงวดที่สุดเท่าที่เคยมี 

OpenAI ระบุว่า GPT-5.3-Codex เป็นโมเดลแรกที่ถูกจัดอยู่ในระดับ High capability ด้านงานไซเบอร์ภายใต้ Preparedness Framework และเป็นโมเดลแรกที่ได้รับการฝึกให้ตรวจจับช่องโหว่ซอฟต์แวร์โดยตรง

แม้จะยังไม่มีหลักฐานว่าโมเดลสามารถโจมตีระบบไซเบอร์แบบครบกระบวนการได้เอง OpenAI ก็เลือกใช้แนวทางป้องกันเชิงรุก ด้วยมาตรการความปลอดภัยที่ครอบคลุมที่สุด ทั้งการฝึกด้านความปลอดภัย การเฝ้าระวังอัตโนมัติ การจำกัดการเข้าถึงความสามารถขั้นสูงและการบังคับใช้ผ่านระบบข่าวกรองด้านภัยคุกคาม

พร้อมกันนี้ OpenAI ยังเปิดโครงการ Trusted Access for Cyber เพื่อสนับสนุนงานวิจัยด้านการป้องกันภัยไซเบอร์ ขยายการทดสอบเครื่องมือด้านความปลอดภัย และลงทุน API credits มูลค่า 10 ล้านดอลลาร์สหรัฐ เพื่อช่วยนักวิจัยโครงการโอเพ่นซอร์สและระบบโครงสร้างพื้นฐานสำคัญ

การใช้งานและทิศทางในอนาคต

GPT-5.3-Codex พร้อมให้ใช้งานแล้วสำหรับผู้ใช้ ChatGPT แบบเสียเงินผ่าน Codex app, CLI, ส่วนขยายสำหรับ IDE และเวอร์ชันเว็บ โดย OpenAI กำลังเตรียมเปิดให้ใช้งานผ่าน API อย่างปลอดภัยในอนาคตอันใกล้

โมเดลนี้ถูกออกแบบและให้บริการบนระบบ NVIDIA GB200 NVL72 ซึ่งช่วยเพิ่มประสิทธิภาพและความเร็วในการประมวลผล

OpenAI สรุปว่า GPT-5.3-Codex คือจุดเปลี่ยนจากการเป็น AI ที่ 'เขียนโค้ดเก่ง' ไปสู่การเป็น 'ผู้ร่วมงานอเนกประสงค์บนคอมพิวเตอร์' ที่สามารถช่วยมนุษย์คิด วางแผนและลงมือทำงานได้ตั้งแต่ต้นจนจบ พร้อมเปิดทางให้คนทั่วไปและนักพัฒนาสร้างงานได้มากขึ้นด้วย Codex 

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ก.พ.ร. จับมือภาครัฐ ปรับการบริการให้เร็วขึ้น มุ่งสู่มาตรฐาน B-READY ของธนาคารโลก

ก.พ.ร.ได้จัดประชุม เรื่อง Business Ready: ปรับบริการรัฐ เปลี่ยนธุรกิจให้ง่ายขึ้น ณ ห้องพญาไท 4 ชั้น 6 โรงแรมอีสติน แกรนด์ พญาไท กรุงเทพฯ โดยมีวัตถุประสงค์เพื่อสื่อสารสร้างการรับรู้...

Responsive image

OpenAI เปิดตัว Frontier แพลตฟอร์มบริหาร AI Agents ปั้นเพื่อนร่วมงาน AI ให้ทำงานจริงในระดับองค์กร

OpenAI เปิดตัว Frontier แพลตฟอร์มบริหาร AI สำหรับองค์กร ยกระดับการทำงานด้วยระบบสอนงานอัตโนมัติ และการเชื่อมต่อข้อมูลทุกระบบเข้าด้วยกัน เปลี่ยน AI จากเครื่องมือสู่เพื่อนร่วมงานดิจิท...

Responsive image

สรุปทิศทาง MICE 2026 ปักหมุด ‘Trusted Gateway’ ดันไทยสู่ฮับการจัดงานระดับโลก

TCEB จึงวางทิศทางปี 2569 ให้การขับเคลื่อนชัดขึ้น โดยโฟกัส 3 เรื่องหลัก คือ การสร้างความเชื่อมั่นทั้งในและต่างประเทศ การผลักดันความยั่งยืนให้กลายเป็นจุดขายที่แข่งขันได้ และการทำให้ร...