ในโลกที่ AI กำลังพัฒนาอย่างก้าวกระโดด OpenAI ได้ประกาศเปิดตัวเครื่องมือใหม่ล่าสุดในชื่อ Responses API ซึ่งถือเป็นอีกก้าวสำคัญในการผลักดันการพัฒนา AI Agents หรือระบบอัตโนมัติที่สามารถปฏิบัติภารกิจต่าง ๆ ได้ด้วยตนเอง โดยใช้โมเดลและเฟรมเวิร์กของ OpenAI เอง
AI Agent ไม่ใช่แค่แชทบอทที่ตอบคำถามง่าย ๆ อีกต่อไป แต่เป็นระบบอัตโนมัติที่สามารถค้นหาเว็บ สแกนเอกสารบริษัท นำทางเว็บไซต์ และทำงานที่ซับซ้อนอื่น ๆ ได้ด้วยตัวเอง OpenAI หวังว่า Responses API จะช่วยให้นักพัฒนาสร้าง AI Agent ที่มีความสามารถเหล่านี้ได้ง่ายขึ้น และทำให้ AI กลายเป็น "เพื่อนร่วมงาน" ที่แท้จริงในอนาคต
เครื่องมือเหล่านี้เป็นส่วนหนึ่งของ Responses API ซึ่งช่วยให้ธุรกิจสามารถพัฒนา AI Agents ที่สามารถค้นหาข้อมูลบนเว็บ สแกนไฟล์ขององค์กร และนำทางเว็บไซต์ได้ โดยมีความสามารถคล้ายกับผลิตภัณฑ์ Operator ของ OpenAI นอกจากนี้ Responses API ยังเข้ามาแทนที่ Assistants API ซึ่ง OpenAI มีแผนจะเลิกให้บริการภายในครึ่งแรกของปี 2026
แม้ว่ากระแสของ AI Agents จะเติบโตขึ้นอย่างรวดเร็วในช่วงไม่กี่ปีที่ผ่านมา แต่วงการเทคโนโลยียังคงประสบปัญหาในการให้คำนิยามที่ชัดเจนว่า AI Agents คืออะไร และจะสามารถนำไปใช้ประโยชน์ได้จริงอย่างไร ล่าสุด บริษัท Butterfly Effect จากจีนได้รับความสนใจจากแพลตฟอร์ม AI Agent ชื่อ Manus แต่ถูกวิจารณ์ว่าไม่สามารถทำงานได้ตามที่สัญญาไว้ ดังนั้น การพัฒนา AI Agents ของ OpenAI จึงเป็นความท้าทายที่ต้องพิสูจน์ความสามารถให้ได้
Olivier Godement หัวหน้าฝ่ายผลิตภัณฑ์ API ของ OpenAI กล่าวว่า “การสาธิต AI Agent เป็นเรื่องง่าย แต่การขยายขีดความสามารถให้ใช้งานได้จริงและมีผู้ใช้งานจำนวนมากเป็นเรื่องยาก”
เมื่อต้นปีที่ผ่านมา OpenAI ได้เปิดตัว AI Agents สองตัวใน ChatGPT ได้แก่ Operator ซึ่งสามารถนำทางบนเว็บไซต์แทนผู้ใช้งาน และ Deep Research ที่ช่วยสรุปข้อมูลการวิจัย อย่างไรก็ตาม ทั้งสองยังมีข้อจำกัดด้านความเป็นอิสระในการทำงาน
Responses API ของ OpenAI มุ่งหวังที่จะเป็นเครื่องมือสำคัญที่ช่วยให้นักพัฒนาสามารถสร้าง AI Agents ที่มีความเป็นอัตโนมัติมากขึ้น โดยใช้ประโยชน์จากโมเดล AI ที่อยู่เบื้องหลัง ChatGPT Search เช่น GPT-4o Search และ GPT-4o Mini Search ซึ่งมีความแม่นยำสูงในการค้นหาข้อมูลบนเว็บ พร้อมทั้งอ้างอิงแหล่งที่มาของข้อมูล
Responses API ยังมาพร้อมฟีเจอร์ File Search ที่สามารถสแกนข้อมูลในระบบขององค์กรได้อย่างรวดเร็ว (OpenAI ยืนยันว่าจะไม่ใช้ข้อมูลเหล่านี้ในการฝึกโมเดล) และยังรองรับโมเดล Computer-Using Agent (CUA) ซึ่งเป็นเทคโนโลยีที่อยู่เบื้องหลัง Operator ที่สามารถป้อนข้อมูลและการทำงานในแอปพลิเคชันต่าง ๆ แบบอัตโนมัติ
สำหรับองค์กรที่ต้องการความเป็นส่วนตัว OpenAI อนุญาตให้เรียกใช้โมเดล CUA บนระบบของตนเองได้ แต่เวอร์ชันที่เปิดให้ผู้ใช้ทั่วไปใช้งานผ่าน Operator จะสามารถดำเนินการได้เฉพาะบนเว็บเท่านั้น
ถึงแม้ว่า Responses API จะช่วยเพิ่มขีดความสามารถให้กับ AI Agents แต่ OpenAI ก็ยอมรับว่ายังมีข้อจำกัด เช่น โมเดล CUA ยังไม่สามารถทำงานอัตโนมัติบนระบบปฏิบัติการได้อย่างแม่นยำ และยังมีโอกาสเกิดข้อผิดพลาดโดยไม่ได้ตั้งใจ OpenAI ระบุว่านี่เป็นเพียงเวอร์ชันเริ่มต้น และบริษัทกำลังพัฒนาให้ดียิ่งขึ้นอย่างต่อเนื่อง
นอกจากนี้ OpenAI ยังเปิดตัว Agents SDK ซึ่งเป็นชุดเครื่องมือโอเพ่นซอร์สที่ช่วยให้นักพัฒนาสามารถผสาน AI Agents เข้ากับระบบภายในขององค์กร ตั้งค่าความปลอดภัย และตรวจสอบการทำงานของ AI เพื่อดีบั๊กและปรับปรุงประสิทธิภาพ
Agents SDK ถือเป็นภาคต่อของ Swarm ซึ่งเป็นเฟรมเวิร์กสำหรับการทำงานร่วมกันของหลาย ๆ AI Agents ที่ OpenAI เปิดตัวเมื่อปลายปีที่แล้ว
Olivier Godement กล่าวว่าการพัฒนา AI Agents ให้สามารถนำไปใช้งานจริงเป็นสิ่งสำคัญที่สุดของ OpenAI ในปีนี้ ซึ่งสอดคล้องกับคำกล่าวของ Sam Altman ซีอีโอของ OpenAI ที่เคยประกาศว่า ปี 2025 จะเป็นปีที่ AI Agents เข้าสู่โลกการทำงานอย่างเต็มตัว
แม้ว่าจะยังไม่มีใครสามารถยืนยันได้ว่า AI Agents จะเปลี่ยนโลกได้ภายในปี 2025 หรือไม่ แต่การเปิดตัว Responses API และ Agents SDK แสดงให้เห็นว่า OpenAI กำลังก้าวข้ามจากการสร้าง AI Agents เพื่อโชว์ศักยภาพ มาสู่การพัฒนาเครื่องมือที่มีประโยชน์จริงสำหรับธุรกิจและนักพัฒนา
อ้างอิง: techcrunch
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด