OpenAI เปิดตัวฟีเจอร์ Image Generation ใน GPT-4o

OpenAI เปิดตัวฟีเจอร์ใหม่ใน GPT-4o ที่หลายคนรอคอย “Image Generation” หรือความสามารถในการเจนภาพตามคำสั่ง Prompt นั่นเอง โดยระบบสร้างภาพอัจฉริยะนี้ไม่ได้แค่สามารถสร้างภาพสวย ๆ แต่มาแบบเน้นประโยชน์ ใช้ทำงานได้จริง ไม่ว่าจะเป็นภาพสำหรับพรีเซนต์ ออกแบบโลโก้ ทำไดอะแกรม หรือแม้แต่สร้างตัวละครในเกม ก็ทำได้หมด

เจนภาพ GPT-4o

Image Generation เจนภาพบน GPT-4o ใช้งานได้จริง

ภาพที่สร้างจาก GPT-4o ไม่ใช่แนวแฟนตาซีเวอร์ ๆ แบบเดิมอีกต่อไป แต่ทำได้ตั้งแต่โลโก้ แผนภาพ จนถึงภาพประกอบที่ต้องใช้ในงานจริง เช่น ทำสไลด์ เสนอโปรเจกต์ หรือออกแบบโปรดักต์ ภาพที่มีตัวหนังสือหรือไดอะแกรมก็ทำได้ชัดเป๊ะ เหมาะมากกับคนทำงานสายครีเอทีฟ นักเรียน หรือเจ้าของธุรกิจ

5 จุดแข็งหลักของ GPT-4o Image Generation

  1. เข้าใจบริบทและคำสั่งซับซ้อนได้ลึกกว่าเดิม: รองรับการสร้างภาพที่มีวัตถุหลากหลายมากขึ้น (10-20 ชิ้นในภาพเดียว) พร้อมจัดวางความสัมพันธ์ของแต่ละองค์ประกอบอย่างถูกต้อง
  2. สื่อสารกับภาพได้ต่อเนื่อง (Multi-turn Generation): สามารถแก้ไขและพัฒนาภาพผ่านบทสนทนาแบบต่อเนื่อง ตัวอย่างเช่น การออกแบบคาแรกเตอร์ในเกมให้สอดคล้องกันในทุกเวอร์ชัน
  3. ปรับแต่งได้ตามใจนึก: ผู้ใช้สามารถระบุขนาดภาพ สีแบบ Hex หรือขอพื้นหลังโปร่งใสได้ พร้อมเรนเดอร์ภาพที่มีความละเอียดสูงภายในประมาณ 1 นาที
  4. เรียนรู้จากภาพที่อัปโหลดได้ทันที: GPT-4o สามารถใช้ภาพจากผู้ใช้เป็นข้อมูลประกอบ ช่วยให้สร้างภาพใหม่ที่ตรงกับสไตล์หรือรายละเอียดเดิม
  5. เชื่อมโยงความรู้จากโลกจริงได้แม่นยำ: ผสานความรู้จากทั้งข้อความและภาพเข้าด้วยกัน ทำให้ภาพที่สร้างออกมามีความ “เข้าใจโลก” มากขึ้น เช่น รู้ว่าตึกแบบไหนอยู่ในเมืองไหน หรือแฟชั่นแนวไหนมาจากวัฒนธรรมใด

นอกจากนี้ OpenAI ยังเข้มงวดเรื่องความปลอดภัย ภาพที่สร้างมาทุกภาพจะฝังข้อมูลไว้เลยว่า “ภาพนี้มาจาก GPT-4o” (ผ่านระบบที่เรียกว่า C2PA) ป้องกันคนเอาไปใช้มั่ว หรือทำ Deepfake

  • ระบบจะไม่อนุญาตให้สร้างภาพที่ผิดจริยธรรม เช่น รูปลามก ภาพรุนแรง หรือภาพที่เกี่ยวกับเด็กแบบไม่เหมาะสม
  • ถ้าในบทสนทนามีคนจริงเข้ามาเกี่ยวข้อง (เช่น ใส่ภาพคนดังหรือชื่อคนจริง) GPT-4o จะเข้มงวดมากเป็นพิเศษ
  • ยังมีระบบ AI ตัวพิเศษที่ช่วยกลั่นกรองเนื้อหาให้ปลอดภัยก่อนปล่อยภาพออกมาด้วย

เริ่มใช้ได้แล้ววันนี้ใน ChatGPT

ตอนนี้ใครใช้ ChatGPT แบบ Free, Plus, Pro หรือ Team ก็สามารถใช้ฟีเจอร์สร้างภาพนี้ได้เลย โดยเป็นระบบเริ่มต้นของ GPT-4o ส่วนใครใช้แบบ Enterprise หรือ Edu ก็รออีกนิด กำลังทยอยเปิดให้ใช้

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ROLI ‘AI Music Coach’ AI ที่เห็นวิธีการเล่นเปียโนของผู้ใช้ พร้อมวิเคราะห์ท่าทางและเทคนิคแบบ Real-time

ROLI เปิดตัว AI Music Coach และฮาร์ดแวร์ Airwave ที่ใช้กล้องอินฟราเรดตรวจจับท่าทางการวางมือ 27 จุดแบบเรียลไทม์ ช่วยสอนและแก้ไขเทคนิคการเล่นเปียโนได้เหมือนมีครูส่วนตัว พร้อมระบบโต้ต...

Responsive image

ก.พ.ร. จับมือภาครัฐ ปรับการบริการให้เร็วขึ้น มุ่งสู่มาตรฐาน B-READY ของธนาคารโลก

ก.พ.ร.ได้จัดประชุม เรื่อง Business Ready: ปรับบริการรัฐ เปลี่ยนธุรกิจให้ง่ายขึ้น ณ ห้องพญาไท 4 ชั้น 6 โรงแรมอีสติน แกรนด์ พญาไท กรุงเทพฯ โดยมีวัตถุประสงค์เพื่อสื่อสารสร้างการรับรู้...

Responsive image

OpenAI เปิดตัว GPT-5.3-Codex เอเจนต์อัจฉริยะ เร็วขึ้น 25% ใช้โทเคนน้อยลง ทำงานครบตั้งแต่เขียนโค้ดถึงวางแผน

OpenAI ประกาศเปิดตัว GPT-5.3-Codex โมเดลปัญญาประดิษฐ์รุ่นใหม่ที่ยกระดับความสามารถของ Codex จากเดิมที่เป็นผู้ช่วยเขียนและตรวจโค้ด ให้กลายเป็นเอเจนต์อัจฉริยะที่สามารถทำงานระดับมืออาช...