OpenAI เปิดตัวฟีเจอร์ Image Generation ใน GPT-4o

OpenAI เปิดตัวฟีเจอร์ใหม่ใน GPT-4o ที่หลายคนรอคอย “Image Generation” หรือความสามารถในการเจนภาพตามคำสั่ง Prompt นั่นเอง โดยระบบสร้างภาพอัจฉริยะนี้ไม่ได้แค่สามารถสร้างภาพสวย ๆ แต่มาแบบเน้นประโยชน์ ใช้ทำงานได้จริง ไม่ว่าจะเป็นภาพสำหรับพรีเซนต์ ออกแบบโลโก้ ทำไดอะแกรม หรือแม้แต่สร้างตัวละครในเกม ก็ทำได้หมด

เจนภาพ GPT-4o

Image Generation เจนภาพบน GPT-4o ใช้งานได้จริง

ภาพที่สร้างจาก GPT-4o ไม่ใช่แนวแฟนตาซีเวอร์ ๆ แบบเดิมอีกต่อไป แต่ทำได้ตั้งแต่โลโก้ แผนภาพ จนถึงภาพประกอบที่ต้องใช้ในงานจริง เช่น ทำสไลด์ เสนอโปรเจกต์ หรือออกแบบโปรดักต์ ภาพที่มีตัวหนังสือหรือไดอะแกรมก็ทำได้ชัดเป๊ะ เหมาะมากกับคนทำงานสายครีเอทีฟ นักเรียน หรือเจ้าของธุรกิจ

5 จุดแข็งหลักของ GPT-4o Image Generation

  1. เข้าใจบริบทและคำสั่งซับซ้อนได้ลึกกว่าเดิม: รองรับการสร้างภาพที่มีวัตถุหลากหลายมากขึ้น (10-20 ชิ้นในภาพเดียว) พร้อมจัดวางความสัมพันธ์ของแต่ละองค์ประกอบอย่างถูกต้อง
  2. สื่อสารกับภาพได้ต่อเนื่อง (Multi-turn Generation): สามารถแก้ไขและพัฒนาภาพผ่านบทสนทนาแบบต่อเนื่อง ตัวอย่างเช่น การออกแบบคาแรกเตอร์ในเกมให้สอดคล้องกันในทุกเวอร์ชัน
  3. ปรับแต่งได้ตามใจนึก: ผู้ใช้สามารถระบุขนาดภาพ สีแบบ Hex หรือขอพื้นหลังโปร่งใสได้ พร้อมเรนเดอร์ภาพที่มีความละเอียดสูงภายในประมาณ 1 นาที
  4. เรียนรู้จากภาพที่อัปโหลดได้ทันที: GPT-4o สามารถใช้ภาพจากผู้ใช้เป็นข้อมูลประกอบ ช่วยให้สร้างภาพใหม่ที่ตรงกับสไตล์หรือรายละเอียดเดิม
  5. เชื่อมโยงความรู้จากโลกจริงได้แม่นยำ: ผสานความรู้จากทั้งข้อความและภาพเข้าด้วยกัน ทำให้ภาพที่สร้างออกมามีความ “เข้าใจโลก” มากขึ้น เช่น รู้ว่าตึกแบบไหนอยู่ในเมืองไหน หรือแฟชั่นแนวไหนมาจากวัฒนธรรมใด

นอกจากนี้ OpenAI ยังเข้มงวดเรื่องความปลอดภัย ภาพที่สร้างมาทุกภาพจะฝังข้อมูลไว้เลยว่า “ภาพนี้มาจาก GPT-4o” (ผ่านระบบที่เรียกว่า C2PA) ป้องกันคนเอาไปใช้มั่ว หรือทำ Deepfake

  • ระบบจะไม่อนุญาตให้สร้างภาพที่ผิดจริยธรรม เช่น รูปลามก ภาพรุนแรง หรือภาพที่เกี่ยวกับเด็กแบบไม่เหมาะสม
  • ถ้าในบทสนทนามีคนจริงเข้ามาเกี่ยวข้อง (เช่น ใส่ภาพคนดังหรือชื่อคนจริง) GPT-4o จะเข้มงวดมากเป็นพิเศษ
  • ยังมีระบบ AI ตัวพิเศษที่ช่วยกลั่นกรองเนื้อหาให้ปลอดภัยก่อนปล่อยภาพออกมาด้วย

เริ่มใช้ได้แล้ววันนี้ใน ChatGPT

ตอนนี้ใครใช้ ChatGPT แบบ Free, Plus, Pro หรือ Team ก็สามารถใช้ฟีเจอร์สร้างภาพนี้ได้เลย โดยเป็นระบบเริ่มต้นของ GPT-4o ส่วนใครใช้แบบ Enterprise หรือ Edu ก็รออีกนิด กำลังทยอยเปิดให้ใช้

อ้างอิง: openai

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

เปิดรับสมัครแล้ว! หลักสูตร City Innovation Alliance (CIA) พัฒนาศักยภาพผู้นำและนวัตกรเมือง ผ่านกรอบคิด Innovative Resilient City โดย NIA Academy

NIA Academy เปิดตัวหลักสูตร 'City Innovation Alliance (CIA)' พัฒนาศักยภาพผู้นำและนวัตกรเมือง (City Innovators) ให้สามารถคิดเชิงอนาคต บริหารบริหารจัดการความเสี่ยง และนำแนวคิดนวัตกรร...

Responsive image

EV ลดการใช้น้ำมันโลกวันละ 1.7–2.3 ล้านบาร์เรล เทียบเท่า 70% การส่งออกน้ำมันอิหร่าน เซฟเงิน 600,000 ล้านดอลลาร์ต่อปี

EV ลดความต้องการใช้น้ำมันโลก 1.7–2.3 ล้านบาร์เรล/วัน เทียบ 70% การส่งออกอิหร่าน พร้อมประหยัดค่านำเข้าพลังงานระดับแสนล้านดอลลาร์...

Responsive image

AI Agents ที่ดีเริ่มที่ความเรียบง่าย: สรุป “Building effective agents” ปรัชญาการสร้าง AI Agents ในแบบฉบับ Anthropic

สรุปแนวทางสร้าง AI Agents จาก Anthropic ตั้งแต่ Augmented LLM แนวคิด Progressive Complexity ไปจนถึงการออกแบบระบบที่เริ่มจากความเรียบง่ายและขยายได้จริง...