เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E”

เมื่อ A.I. สร้างภาพจำลองได้เหมือนจริง โดยที่เราไม่ต้องเขียนโค้ดที่ยุ่งยากแต่อย่างใด เพียงใส่ข้อความ โปรแกรม text-to-image แปลงข้อความเป็นรูปภาพที่เรียกว่า DALL-E ก็จะใช้แบบจำลองปัญญาประดิษฐ์ หาข้อมูลที่เกี่ยวข้องจาก search engine ที่มีอยู่มาวิเคราะห์เป็นภาพ เป็นอีกขั้นของการให้ AI ทำงานให้เราอย่างง่ายดาย

เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E”

โมเดล AI “DALL-E” มาจากซอฟต์แวร์ Imagen ของ Google และ OpenAI ซึ่งเป็นสตาร์ทอัพที่ได้รับการสนับสนุนจาก Microsoft เป็นผู้พัฒนา 

ในการใช้งาน เพียงกรอกข้อความลงไป ตัวอย่างเช่น เมื่อพิมพ์ข้อความ “Cat on the UFO” จากนั้น AI ก็จะคาดเดาในการแสดงคำศัพท์เหล่านั้น ซึ่งวิศวกรได้ฝึกฝนโมเดล Imagen ด้วยชิป AI ในตัวหลายร้อยตัวบนคู่ของข้อความรูปภาพที่มีอยู่ภายในระบบ 460 ล้านคู่ที่เกี่ยวกับคอลเลกชั่นคำและรูปภาพมากมายจากเว็บ รวมถึงรูปภาพที่ผู้คนโพสต์บน Flickr จากนั้นภาพก็จะแสดงผลออกมา

การใช้งานส่วนใหญ่ในตอนนี้ ยังใช้งานกันในกลุ่มเล็กๆ ที่แชร์รูปภาพให้กันเพื่อความบันเทิง นั่นเป็นเพราะ Google และ OpenAI ยังไม่ได้เผยแพร่เทคโนโลยีอย่างจริงจังต่อสาธารณชนในวงกว้าง โดย Joanne Jang แห่ง OpenAI เขียนไว้ในหน้าเว็บไซต์ของบริษัทว่า “เรากำลังทำงานอย่างหนักเพื่อเร่งการเข้าถึง แต่อาจต้องใช้เวลาสักระยะจนกว่าที่จะมีการใช้งานกันในวงกว้าง”

เริ่มทดลองให้ใช้ด้วย DALL-E Mini

ส่วนหนึ่งของระบบที่เปิดเผยให้ทดลองใช้ในตอนนี้ คือ DALL-E Mini ซึ่งใช้รหัสโอเพนซอร์ซจากทีมนักพัฒนาที่จัดระเบียบอย่างคร่าวๆ ซึ่งผู้คนก็ให้ความสนใจในจำนวนมาก 

ขณะเดียวกันทาง OpenAI ได้มีมาตรการในเรื่องภาพที่อาจไม่เหมาะสมด้วย โดยจะมี Moderator ควบคุมและลบเนื้อหาที่มีความรุนแรงออกจากข้อมูลการเทรนของ Machine และมีตัวกรองที่หยุด DALL-E 2 จากการสร้างภาพหากผู้ใช้ส่งการแจ้งเตือนที่อาจละเมิดนโยบายของบริษัทเกี่ยวกับภาพอนาจาร ความรุนแรง การก่อการร้าย หรือเนื้อหาทางการเมือง

ทั้งนี้ โมเดลสร้างภาพยังไม่ได้สมบูรณ์แบบและไม่ได้ให้ผลลัพธ์ที่สื่อถึงความหมายได้อย่างแม่นยำเสมอไป นอกจากนี้ทาง OpenAI ยังมีแพลนที่จะให้บริการ DALL-E 2 ซึ่งจะสร้างภาพให้มีความสมจริงมากกว่านี้ในอนาคต

ทดลองสร้างภาพด้วย AI ได้ที่ huggingface 

อ้างอิงจาก CNBC






ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ปรากฏการณ์ OpenClaw ในจีน เมื่อคนจีนแห่ติดตั้งสิ่งนี้

เจาะลึกกระแส OpenClaw ในจีน! AI Agent สุดล้ำที่ทำงานแทนมนุษย์ได้ทุกอย่าง ทำไมคนจีนยอมเสี่ยงความปลอดภัยเพื่อเลี้ยงกุ้ง...

Responsive image

สรุปวิสัยทัศน์เซ็นทรัล รีเทล ปี 2026 เมื่อปัญญาประดิษฐ์คือกุญแจสำคัญ สู่การเป็นผู้นำค้าปลีกแห่งเอเชียตะวันออกเฉียงใต้

เจาะลึกวิสัยทัศน์ เซ็นทรัล รีเทล (CRC) ปี 2026 ชูกลยุทธ์นวัตกรรมและปัญญาประดิษฐ์พลิกโฉมค้าปลีก เร่งเครื่องบุกตลาดเวียดนาม พร้อมเผยความสำเร็จ ไทวัสดุ ที่โตสวนกระแสเศรษฐกิจ มุ่งสู่กา...

Responsive image

Techsauce บุกบรูไน เปิดโลกใหม่ ทำไมบรูไนถึงไม่ใช่แค่ประเทศค้าน้ำมัน แต่คือ Hub นวัตกรรมที่กำลังตื่นตัว

เจาะลึกทำไมบรูไน ประเทศที่เล็กกว่าไทย 70 เท่า ถึงเป็น Strategic Hub ที่น่าจับตามอง พร้อมบทบาทของ Techsauce ในการดันไทยเป็น Trusted Connector เชื่อมโยงสตาร์ทอัพสู่อาเซียน...