OpenAI เปิดตัว GPT-5.3-Codex เอเจนต์อัจฉริยะ เร็วขึ้น 25% ใช้โทเคนน้อยลง ทำงานครบตั้งแต่เขียนโค้ดถึงวางแผน

OpenAI เปิดตัว GPT-5.3-Codex

OpenAI ประกาศเปิดตัว GPT-5.3-Codex โมเดลปัญญาประดิษฐ์รุ่นใหม่ที่ยกระดับความสามารถของ Codex จากเดิมที่เป็นผู้ช่วยเขียนและตรวจโค้ด ให้กลายเป็นเอเจนต์อัจฉริยะที่สามารถทำงานระดับมืออาชีพบนคอมพิวเตอร์ได้อย่างครบวงจร ตั้งแต่งานพัฒนาโปรแกรม งานวิจัย การใช้เครื่องมือต่าง ๆ ไปจนถึงการลงมือทำงานที่ซับซ้อนและใช้เวลานาน

โมเดลใหม่นี้รวมจุดแข็งของ GPT-5.2-Codex ซึ่งโดดเด่นด้านการเขียนโค้ดระดับแนวหน้า เข้ากับความสามารถด้านการคิดวิเคราะห์ การให้เหตุผล และความรู้เชิงวิชาชีพของ GPT-5.2 ไว้ในโมเดลเดียว พร้อมเพิ่มประสิทธิภาพการทำงานให้เร็วขึ้นประมาณ 25% ช่วยให้รองรับงานที่ต้องทำต่อเนื่องยาว ๆ ได้ดีขึ้นอย่างเห็นได้ชัด

ความแตกต่างสำคัญคือ ผู้ใช้สามารถพูดคุย ซักถาม และปรับทิศทางการทำงานของ GPT-5.3-Codex ได้ระหว่างที่มันกำลังทำงานอยู่ โดยไม่ทำให้บริบทของงานหายไป ลักษณะการทำงานจึงใกล้เคียงกับการร่วมงานกับเพื่อนร่วมทีมจริง ๆ มากกว่าการรอผลลัพธ์จาก AI แบบเดิม

โมเดล AI แรกที่เรียนรู้ต่อจากสิ่งที่ตัวเองสร้าง

สิ่งที่น่าสนใจเป็นพิเศษคือ GPT-5.3-Codex เป็นโมเดลแรกของ OpenAI ที่มีบทบาทสำคัญในการพัฒนาตัวมันเอง ทีม Codex ได้นำเวอร์ชันเริ่มต้นของโมเดลมาใช้ช่วยตรวจสอบกระบวนการฝึก แก้ไขปัญหาในระบบการเทรน ดูแลการนำโมเดลขึ้นใช้งานจริง และวิเคราะห์ผลการทดสอบต่าง ๆ

ผลลัพธ์ที่ได้ทำให้ทีมงานประหลาดใจ เพราะ Codex สามารถช่วยเร่งการพัฒนาโมเดลของตัวเองได้อย่างมาก จนหลายคนในทีมมองว่าวิธีการทำงานของนักวิจัยและวิศวกรในช่วงไม่กี่เดือนที่ผ่านมา 'เปลี่ยนไปอย่างสิ้นเชิง' เมื่อมี Codex เข้ามาเป็นผู้ช่วย

เอเจนต์อัจฉริยะ เวอร์ชันที่ทำได้มากกว่าเดิม 

OpenAI ระบุว่า GPT-5.3-Codex ทำผลงานได้โดดเด่นบนหลายเกณฑ์วัดมาตรฐานระดับอุตสาหกรรมที่ใช้ประเมินความสามารถของ AI ในงานเขียนโค้ด การทำงานแบบเอเจนต์ และการใช้งานจริงในสภาพแวดล้อมที่ซับซ้อน ได้แก่ SWE-Bench Pro, Terminal-Bench, OSWorld และ GDPval

ผลลัพธ์เหล่านี้สะท้อนว่า GPT-5.3-Codex ไม่ได้แค่เก่งงานใดงานหนึ่ง แต่กำลังขยับเข้าใกล้การเป็นเอเจนต์อเนกประสงค์ที่สามารถคิด วางแผน ลงมือทำและแก้ปัญหาได้ในโลกการทำงานจริง

ความสามารถด้านการเขียนโค้ดที่ก้าวกระโดด

ในด้านการเขียนโค้ด GPT-5.3-Codex ทำสถิติระดับสูงสุดบน SWE-Bench Pro ซึ่งเป็นการทดสอบที่จำลองงานซอฟต์แวร์จริงในอุตสาหกรรม แตกต่างจาก SWE-Bench รุ่นเดิมที่ทดสอบเฉพาะภาษา Python เพราะ SWE-Bench Pro ครอบคลุมถึง 4 ภาษา มีความยากสูงกว่า และลดโอกาสที่โมเดลจะเคยเห็นโจทย์มาก่อน

นอกจากนี้โมเดลยังทำคะแนนเหนือกว่ารุ่นก่อนอย่างชัดเจนบน Terminal-Bench 2.0 ซึ่งวัดทักษะการทำงานผ่านเทอร์มินัล เช่น การรันคำสั่ง แก้ปัญหาในระบบ และจัดการสภาพแวดล้อมการพัฒนา

จุดเด่นอีกอย่างคือ GPT-5.3-Codex สามารถทำงานเหล่านี้ได้โดยใช้จำนวนโทเคนหรือทรัพยากรน้อยกว่ารุ่นก่อน ๆ ทำให้ผู้ใช้สามารถสร้างและทดลองสิ่งต่าง ๆ ได้มากขึ้นในต้นทุนที่ใกล้เคียงเดิม

สร้างเว็บและเกมได้เองอัตโนมัติ 

OpenAI ยังทดสอบความสามารถด้านการพัฒนาเว็บและการทำงานระยะยาว โดยให้ GPT-5.3-Codex สร้างเกมขึ้นมาใหม่ทั้งหมด 2 เกม ได้แก่ เวอร์ชันที่สองของเกมแข่งรถจากการเปิดตัว Codex app และเกมดำน้ำอีกหนึ่งเกม

ระหว่างการทดสอบ ทีมงานใช้คำสั่งทั่วไป เช่น แก้บั๊กหรือปรับปรุงเกม โดยไม่ต้องลงรายละเอียดมากโมเดลสามารถพัฒนาเกมต่อเนื่องได้ด้วยตัวเองเป็นเวลาหลายวัน ผ่านการประมวลผลหลายล้านโทเคนแสดงให้เห็นศักยภาพของการทำงานแบบเอเจนต์ที่ไม่ต้องคอยสั่งทีละขั้น

สำหรับงานเว็บไซต์ทั่วไป GPT-5.3-Codex ยังเข้าใจเจตนาของผู้ใช้ได้ดีขึ้น เมื่อได้รับคำสั่งที่สั้นหรือยังไม่ชัดเจน ระบบจะเลือกค่าเริ่มต้นที่พร้อมใช้งานจริงมากขึ้น เช่นการแสดงราคาสมาชิกแบบรายปีให้อยู่ในรูปส่วนลดรายเดือนหรือการสร้างส่วนรีวิวผู้ใช้งานหลายรายการโดยอัตโนมัติ ทำให้หน้าเว็บดูสมบูรณ์ตั้งแต่ครั้งแรกที่สร้าง

ไม่ได้เก่งแค่โค้ด แต่งานครบทั้งวงจรการทำงาน

OpenAI ชี้ว่าในชีวิตจริง นักพัฒนา นักออกแบบ ผู้จัดการผลิตภัณฑ์และนักวิเคราะห์ข้อมูล ไม่ได้ทำแค่เขียนโค้ดเท่านั้น GPT-5.3-Codex จึงถูกออกแบบมาเพื่อรองรับงานตลอดทั้งวงจร ตั้งแต่การแก้ปัญหาเวลาระบบติดบั๊ก การนำระบบขึ้นใช้งาน การติดตามประสิทธิภาพ การเขียนเอกสารวางแผน แก้ไขข้อมูล ทำวิจัย กไปจนถึงการวิเคราะห์ตัวเลขและสร้างสไลด์นำเสนอ

ผลการประเมินบน GDPval ซึ่งเป็นการวัดความสามารถด้านความรู้ใน 44 อาชีพพบว่า GPT-5.3-Codex ทำผลงานได้ในระดับเดียวกับ GPT-5.2 สะท้อนว่าโมเดลนี้ไม่ได้จำกัดอยู่แค่งานเทคนิค แต่สามารถเป็นผู้ช่วยในงานสำนักงานและงานวิเคราะห์ได้เช่นกัน

ใช้งานคอมพิวเตอร์ได้ใกล้เคียงมนุษย์มากขึ้น

บนการทดสอบ OSWorld ซึ่งจำลองการทำงานในสภาพแวดล้อมเดสก์ท็อปจริง GPT-5.3-Codex แสดงให้เห็นความสามารถในการใช้งานคอมพิวเตอร์ได้ดีกว่าโมเดล GPT รุ่นก่อน ๆ อย่างชัดเจน ทั้งการจัดการหน้าจอ โปรแกรมและขั้นตอนการทำงานที่มีหลายขั้น

OpenAI มองว่าผลลัพธ์ทั้งหมดนี้ชี้ให้เห็นว่า GPT-5.3-Codex ไม่ได้เป็นแค่ AI ที่เก่งงานเฉพาะด้าน แต่เป็นก้าวสำคัญสู่เอเจนต์ทั่วไปที่สามารถคิด สร้าง และลงมือทำงานในโลกจริงได้อย่างครบ

ผู้ช่วยอัจฉริยะที่คุยและปรับงานได้ตลอดเวลา 

เมื่อเอเจนต์มีความสามารถมากขึ้น ความท้าทายจึงไม่ใช่แค่ว่า AI ทำอะไรได้บ้าง แต่คือมนุษย์จะควบคุมและทำงานร่วมกับมันได้ง่ายแค่ไหน Codex app จึงถูกพัฒนาให้ช่วยจัดการเอเจนต์หลายตัวได้สะดวกขึ้น และ GPT-5.3-Codex ก็ทำให้การสื่อสารระหว่างคนกับ AI เป็นธรรมชาติมากกว่าเดิม

ระหว่างที่โมเดลทำงาน ผู้ใช้จะได้รับอัปเดตความคืบหน้าอย่างต่อเนื่อง สามารถถามเหตุผล ปรับแนวทางหรือให้ข้อเสนอแนะได้ทันที โดยไม่ต้องรอผลลัพธ์สุดท้าย ทำให้กระบวนการทำงานร่วมกันโปร่งใสและควบคุมได้มากขึ้น

เบื้องหลังการฝึกและการนำไปใช้งานจริง

OpenAI เปิดเผยว่า การพัฒนา GPT-5.3-Codex เป็นผลลัพธ์จากงานวิจัยที่ต่อเนื่องมาหลายเดือนหรือหลายปี และ Codex เองก็มีบทบาทสำคัญในการเร่งงานเหล่านี้ ทีมวิจัยใช้ Codex เพื่อติดตามและแก้ปัญหาเวลาระบบติดบั๊กในกระบวนการฝึกโมเดล วิเคราะห์รูปแบบพฤติกรรมของโมเดลระหว่างการเทรน และสร้างเครื่องมือช่วยให้นักวิจัยเข้าใจความแตกต่างระหว่างรุ่นใหม่และรุ่นก่อนหน้าได้ชัดเจนขึ้น

ฝั่งวิศวกรรมใช้ Codex ในการปรับปรุงระบบรองรับการใช้งานจริง แก้ปัญหาที่ส่งผลต่อผู้ใช้ และจัดการโครงสร้างพื้นฐาน เช่น การปรับขนาดคลัสเตอร์ GPU ให้รองรับการใช้งานที่เพิ่มขึ้น โดยรักษาความเร็วและความเสถียรของระบบ

ระบบความปลอดภัยเข้มงวดที่สุดเท่าที่เคยมี 

OpenAI ระบุว่า GPT-5.3-Codex เป็นโมเดลแรกที่ถูกจัดอยู่ในระดับ High capability ด้านงานไซเบอร์ภายใต้ Preparedness Framework และเป็นโมเดลแรกที่ได้รับการฝึกให้ตรวจจับช่องโหว่ซอฟต์แวร์โดยตรง

แม้จะยังไม่มีหลักฐานว่าโมเดลสามารถโจมตีระบบไซเบอร์แบบครบกระบวนการได้เอง OpenAI ก็เลือกใช้แนวทางป้องกันเชิงรุก ด้วยมาตรการความปลอดภัยที่ครอบคลุมที่สุด ทั้งการฝึกด้านความปลอดภัย การเฝ้าระวังอัตโนมัติ การจำกัดการเข้าถึงความสามารถขั้นสูงและการบังคับใช้ผ่านระบบข่าวกรองด้านภัยคุกคาม

พร้อมกันนี้ OpenAI ยังเปิดโครงการ Trusted Access for Cyber เพื่อสนับสนุนงานวิจัยด้านการป้องกันภัยไซเบอร์ ขยายการทดสอบเครื่องมือด้านความปลอดภัย และลงทุน API credits มูลค่า 10 ล้านดอลลาร์สหรัฐ เพื่อช่วยนักวิจัยโครงการโอเพ่นซอร์สและระบบโครงสร้างพื้นฐานสำคัญ

การใช้งานและทิศทางในอนาคต

GPT-5.3-Codex พร้อมให้ใช้งานแล้วสำหรับผู้ใช้ ChatGPT แบบเสียเงินผ่าน Codex app, CLI, ส่วนขยายสำหรับ IDE และเวอร์ชันเว็บ โดย OpenAI กำลังเตรียมเปิดให้ใช้งานผ่าน API อย่างปลอดภัยในอนาคตอันใกล้

โมเดลนี้ถูกออกแบบและให้บริการบนระบบ NVIDIA GB200 NVL72 ซึ่งช่วยเพิ่มประสิทธิภาพและความเร็วในการประมวลผล

OpenAI สรุปว่า GPT-5.3-Codex คือจุดเปลี่ยนจากการเป็น AI ที่ 'เขียนโค้ดเก่ง' ไปสู่การเป็น 'ผู้ร่วมงานอเนกประสงค์บนคอมพิวเตอร์' ที่สามารถช่วยมนุษย์คิด วางแผนและลงมือทำงานได้ตั้งแต่ต้นจนจบ พร้อมเปิดทางให้คนทั่วไปและนักพัฒนาสร้างงานได้มากขึ้นด้วย Codex 

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

IMF เชื่อมั่นไทยมีโอกาส หลุดกับดัก ‘รายได้ปานกลาง’ หากใช้ประโยชน์กลุ่มเศรษฐกิจในภูมิภาค และการเร่งนำเทคโนโลยี AI มาใช้

IMF มองไทยอย่างไรในปี 2050? สรุปประเด็นสำคัญจากสุนทรพจน์ MD ของ IMF ที่กรุงเทพฯ ตั้งแต่การรับมือ AI, สังคมสูงวัย ไปจนถึงความล้ำของระบบการเงินดิจิทัลที่อาเซียนชนะขาดระดับโลก...

Responsive image

BOI ถก 4 สมาคมยานยนต์ ชง 3 มาตรการเร่งด่วน พลิกฟื้นอุตสาหกรรมยานยนต์ไทย เพื่อเสนอรัฐบาลใหม่กู้วิกฤตตลาดรถ

BOI หารือ 4 สมาคมยานยนต์ เตรียมชงแพ็กเกจใหญ่เสนอรัฐบาลใหม่ ดัน 3 ข้อเสนอหนุนอุตสาหกรรม xEV กระตุ้นยอดขายด้วยมาตรการรถเก่าแลกใหม่ และดันการใช้ชิ้นส่วนในประเทศ (Localization) รักษาแช...

Responsive image

BYD ทดสอบระบบชาร์จ 1,500kW ‘Flash Charging’ เติมพลังงานได้ 249 ไมล์ในเวลาแค่ 5 นาที ค่าบริการสุดถูก หน่วยละไม่ถึง 7 บาท

BYD ทดสอบสถานีชาร์จ 'Flash Charging' 1,500kW ในจีน ชาร์จแค่ 5 นาทีวิ่งได้ 400 กม. เร็วกว่า Supercharger ถึง 3 เท่า พร้อมค่าบริการสุดถูก เตรียมปูพรมขยายกว่า 4,000 สาขา พลิกโฉมอนาคตว...