เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E”

เมื่อ A.I. สร้างภาพจำลองได้เหมือนจริง โดยที่เราไม่ต้องเขียนโค้ดที่ยุ่งยากแต่อย่างใด เพียงใส่ข้อความ โปรแกรม text-to-image แปลงข้อความเป็นรูปภาพที่เรียกว่า DALL-E ก็จะใช้แบบจำลองปัญญาประดิษฐ์ หาข้อมูลที่เกี่ยวข้องจาก search engine ที่มีอยู่มาวิเคราะห์เป็นภาพ เป็นอีกขั้นของการให้ AI ทำงานให้เราอย่างง่ายดาย

เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E”

โมเดล AI “DALL-E” มาจากซอฟต์แวร์ Imagen ของ Google และ OpenAI ซึ่งเป็นสตาร์ทอัพที่ได้รับการสนับสนุนจาก Microsoft เป็นผู้พัฒนา 

ในการใช้งาน เพียงกรอกข้อความลงไป ตัวอย่างเช่น เมื่อพิมพ์ข้อความ “Cat on the UFO” จากนั้น AI ก็จะคาดเดาในการแสดงคำศัพท์เหล่านั้น ซึ่งวิศวกรได้ฝึกฝนโมเดล Imagen ด้วยชิป AI ในตัวหลายร้อยตัวบนคู่ของข้อความรูปภาพที่มีอยู่ภายในระบบ 460 ล้านคู่ที่เกี่ยวกับคอลเลกชั่นคำและรูปภาพมากมายจากเว็บ รวมถึงรูปภาพที่ผู้คนโพสต์บน Flickr จากนั้นภาพก็จะแสดงผลออกมา

การใช้งานส่วนใหญ่ในตอนนี้ ยังใช้งานกันในกลุ่มเล็กๆ ที่แชร์รูปภาพให้กันเพื่อความบันเทิง นั่นเป็นเพราะ Google และ OpenAI ยังไม่ได้เผยแพร่เทคโนโลยีอย่างจริงจังต่อสาธารณชนในวงกว้าง โดย Joanne Jang แห่ง OpenAI เขียนไว้ในหน้าเว็บไซต์ของบริษัทว่า “เรากำลังทำงานอย่างหนักเพื่อเร่งการเข้าถึง แต่อาจต้องใช้เวลาสักระยะจนกว่าที่จะมีการใช้งานกันในวงกว้าง”

เริ่มทดลองให้ใช้ด้วย DALL-E Mini

ส่วนหนึ่งของระบบที่เปิดเผยให้ทดลองใช้ในตอนนี้ คือ DALL-E Mini ซึ่งใช้รหัสโอเพนซอร์ซจากทีมนักพัฒนาที่จัดระเบียบอย่างคร่าวๆ ซึ่งผู้คนก็ให้ความสนใจในจำนวนมาก 

ขณะเดียวกันทาง OpenAI ได้มีมาตรการในเรื่องภาพที่อาจไม่เหมาะสมด้วย โดยจะมี Moderator ควบคุมและลบเนื้อหาที่มีความรุนแรงออกจากข้อมูลการเทรนของ Machine และมีตัวกรองที่หยุด DALL-E 2 จากการสร้างภาพหากผู้ใช้ส่งการแจ้งเตือนที่อาจละเมิดนโยบายของบริษัทเกี่ยวกับภาพอนาจาร ความรุนแรง การก่อการร้าย หรือเนื้อหาทางการเมือง

ทั้งนี้ โมเดลสร้างภาพยังไม่ได้สมบูรณ์แบบและไม่ได้ให้ผลลัพธ์ที่สื่อถึงความหมายได้อย่างแม่นยำเสมอไป นอกจากนี้ทาง OpenAI ยังมีแพลนที่จะให้บริการ DALL-E 2 ซึ่งจะสร้างภาพให้มีความสมจริงมากกว่านี้ในอนาคต

ทดลองสร้างภาพด้วย AI ได้ที่ huggingface 

อ้างอิงจาก CNBC






ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

AWS ประเทศไทย ประกาศทิศทางปี 2569 ดัน ‘Frontier Agent’ สู่ยุคพนักงาน AI เต็มรูปแบบ

AWS ประเทศไทยประกาศทิศทางธุรกิจปี 2569 เดินหน้าเร่ง Thailand Region ควบคู่กับการผลักดัน Frontier Agent เทคโนโลยี Agentic AI ที่ทำงานแทนมนุษย์ได้จริง พร้อมเปิดตัว Amazon Nova 2, Bed...

Responsive image

สรุปวิสัยทัศน์ Demis Hassabis อนาคต AI และหุ่นยนต์ DeepMind ปี 2026

เจาะลึกวิสัยทัศน์ Demis Hassabis เมื่อ AI กำลังจะมีร่างทำไม Robotics ถึงเป็นพรมแดนถัดไปที่จะเปลี่ยนโลก และหุ่นยนต์ยุคใหม่จะ "เข้าใจโลก" เหมือนมนุษย์ได้อย่างไรในอีก 3 ปีข้างหน้า...

Responsive image

ปิดฉากยุคเลขบัตร 16 หลัก! Visa ผนึกกำลัง Omise ร่วมกันผลักดันนวัตกรรม ‘Tokenisation’ เทคโนโลยีเบื้องหลังที่ลดการฉ้อโกงได้ถึง 58%

Visa และ Omise เปิดตัว Network Token ในไทย เทคโนโลยีความปลอดภัยใหม่ที่แปลงเลขบัตร 16 หลักเป็น Token ช่วยลดการทุจริตออนไลน์ได้ถึง 58% และเพิ่มโอกาสอนุมัติธุรกรรม พลิกโฉม E-Payment ส...