เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E” | Techsauce

เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E”

เมื่อ A.I. สร้างภาพจำลองได้เหมือนจริง โดยที่เราไม่ต้องเขียนโค้ดที่ยุ่งยากแต่อย่างใด เพียงใส่ข้อความ โปรแกรม text-to-image แปลงข้อความเป็นรูปภาพที่เรียกว่า DALL-E ก็จะใช้แบบจำลองปัญญาประดิษฐ์ หาข้อมูลที่เกี่ยวข้องจาก search engine ที่มีอยู่มาวิเคราะห์เป็นภาพ เป็นอีกขั้นของการให้ AI ทำงานให้เราอย่างง่ายดาย

เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E”

โมเดล AI “DALL-E” มาจากซอฟต์แวร์ Imagen ของ Google และ OpenAI ซึ่งเป็นสตาร์ทอัพที่ได้รับการสนับสนุนจาก Microsoft เป็นผู้พัฒนา 

ในการใช้งาน เพียงกรอกข้อความลงไป ตัวอย่างเช่น เมื่อพิมพ์ข้อความ “Cat on the UFO” จากนั้น AI ก็จะคาดเดาในการแสดงคำศัพท์เหล่านั้น ซึ่งวิศวกรได้ฝึกฝนโมเดล Imagen ด้วยชิป AI ในตัวหลายร้อยตัวบนคู่ของข้อความรูปภาพที่มีอยู่ภายในระบบ 460 ล้านคู่ที่เกี่ยวกับคอลเลกชั่นคำและรูปภาพมากมายจากเว็บ รวมถึงรูปภาพที่ผู้คนโพสต์บน Flickr จากนั้นภาพก็จะแสดงผลออกมา

การใช้งานส่วนใหญ่ในตอนนี้ ยังใช้งานกันในกลุ่มเล็กๆ ที่แชร์รูปภาพให้กันเพื่อความบันเทิง นั่นเป็นเพราะ Google และ OpenAI ยังไม่ได้เผยแพร่เทคโนโลยีอย่างจริงจังต่อสาธารณชนในวงกว้าง โดย Joanne Jang แห่ง OpenAI เขียนไว้ในหน้าเว็บไซต์ของบริษัทว่า “เรากำลังทำงานอย่างหนักเพื่อเร่งการเข้าถึง แต่อาจต้องใช้เวลาสักระยะจนกว่าที่จะมีการใช้งานกันในวงกว้าง”

เริ่มทดลองให้ใช้ด้วย DALL-E Mini

ส่วนหนึ่งของระบบที่เปิดเผยให้ทดลองใช้ในตอนนี้ คือ DALL-E Mini ซึ่งใช้รหัสโอเพนซอร์ซจากทีมนักพัฒนาที่จัดระเบียบอย่างคร่าวๆ ซึ่งผู้คนก็ให้ความสนใจในจำนวนมาก 

ขณะเดียวกันทาง OpenAI ได้มีมาตรการในเรื่องภาพที่อาจไม่เหมาะสมด้วย โดยจะมี Moderator ควบคุมและลบเนื้อหาที่มีความรุนแรงออกจากข้อมูลการเทรนของ Machine และมีตัวกรองที่หยุด DALL-E 2 จากการสร้างภาพหากผู้ใช้ส่งการแจ้งเตือนที่อาจละเมิดนโยบายของบริษัทเกี่ยวกับภาพอนาจาร ความรุนแรง การก่อการร้าย หรือเนื้อหาทางการเมือง

ทั้งนี้ โมเดลสร้างภาพยังไม่ได้สมบูรณ์แบบและไม่ได้ให้ผลลัพธ์ที่สื่อถึงความหมายได้อย่างแม่นยำเสมอไป นอกจากนี้ทาง OpenAI ยังมีแพลนที่จะให้บริการ DALL-E 2 ซึ่งจะสร้างภาพให้มีความสมจริงมากกว่านี้ในอนาคต

ทดลองสร้างภาพด้วย AI ได้ที่ huggingface 

อ้างอิงจาก CNBC






ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Qwen2.5-Max คืออะไร หมัดสองจาก AI จีนโดยยักษ์ใหญ่ Alibaba ที่เก่งกว่า Deepseek R1

Qwen2.5-Max โมเดล AI ใหม่จาก Alibaba ท้าชน DeepSeek R1 และ GPT-4o ด้วยประสิทธิภาพสูงกว่า ใช้พลังงานน้อยลง และอาจเปลี่ยนสมดุลอุตสาหกรรม AI ระดับโลก...

Responsive image

NIA เปิดข้อมูลระบบนิเวศสตาร์ทอัพ รับเทรนด์เติบโต 2025 และจัดหาสเปซสำหรับ Deep Tech

สรุปข้อมูลหลังจากทีมเทคซอสร่วมล้อมวงพูดคุยกับ ดร.กริชผกา บุญเฟื่อง ผู้อำนวยการสำนักงานนวัตกรรมแห่งชาติ หรือ NIA ทั้งภาพรวมการเติบโตของสตาร์ทอัพไทย เทรนด์การเติบโตของสตาร์ทอัพในปี 2...

Responsive image

KBank-Orbix Tech พลิกโฉมการเงิน ด้วย Project Carina โอนเงินข้ามประเทศด้วย Blockchain

ค้นพบ ‘Project Carina’ นวัตกรรมบล็อกเชนที่ปฏิวัติการโอนเงินข้ามประเทศให้รวดเร็วเพียง 5 นาที ด้วยความร่วมมือระหว่าง KBank และ J.P. Morgan Chase ที่พร้อมสร้างมาตรฐานใหม่สำหรับธุรกิจย...