Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney | Techsauce

Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney

หากใครเคยใช้ Midjourney สร้างงานรูปภาพศิลปะมาแล้ว ก็จะเข้าใจถึงศักยภาพ AI ที่สร้างงาน ขึ้นมาว่ามันโหดแค่ไหน แต่ไม่นานมานี้ Nvidia ได้เผยงานวิจัยเกี่ยวกับ Perfusion แพลตฟอร์มสร้างรูปภาพด้วย AI ที่โหดกว่าเดิม ซึ่งมีการจัดแสดงโชว์ในงาน SIGGRAPH 2023 ที่จัดขึ้นที่ Los Angeles สหรัฐอเมริกา

AI

รายละเอียดของ Perfusion

Perfusion เป็น AI สร้างรูปภาพแบบ text-to-image แบบเดียวกันกับ Midjourney ซึ่งเป็นความร่วมมือในการวิจัยและพัฒนาโดย Nvidia และ Tel-Aviv University ในอิสราเอล โดยขนาดสเปคอยู่ที่ 100 KB AI ใช้เวลาเรียนรู้โดยรวม 4 นาที 

ในโมเดล AI ของ Perfusion มีเทคโนโลยี Key-Locking หรือการ “ล็อคข้อความ” นี้ทำงานโดยการเชื่อมต่อ คำใหม่ๆที่ผู้ใช้ต้องการเพิ่ม เช่นเมื่อเราใส่ Keyword ว่า 

A teddy dress like a Super Hero หรือ A teddy dressed in a blue suit is cooking a gourmet meal

AI

ภาพจาก : Nvidia 

จะสังเกตได้ว่าคำว่า Teddy ถูกล็อคคำไว้เรียบร้อยและเมื่อเราเพิ่มคำอื่นลงไป AI ก็จะไม่สร้างรูปผิดเพี้ยนและวิธีนี้จะไม่ทำให้เกิดการ Overfitting นั่นคือการที่โมเดล AI ไม่สามารถเรียนรู้ในสภาวะที่ซับซ้อนเกินไปได้หรือมีชุดข้อมูลไม่เพียงพอ 

ซึ่งนอกจากจะล็อคข้อความแล้วตัวเทคโนโลยียังล็อครูปแบบของภาพที่เราใส่ Keyword ไว้ด้วยและยังสามารถสร้างรูปแบบออกมาได้หลากหลายและละเอียดอีกต่างหาก

AI

ภาพจาก : Nvidia

หากอยากศึกษาถึงระบบการทำงานของโมเดล AI ที่ Perfusion ใช้เพิ่มเติมสามารถไปดูได้ที่เว็บไซต์ Nvidia.com

เปิดตัวชิปตัวใหม่ที่ดีกว่าและถูกลง

Nvidia ยังเปิดตัวชิป AI ตัวใหม่ในชื่อ Nvidia GH200 มี GPU แบบเดียวกับรุ่น H100 ซึ่งเป็นชิป AI ระดับสูงสุดของบริษัทในปัจจุบัน แต่ GH200 นี้จะมี GPU ที่มีหน่วยความจำถึง 141 กิกะไบต์ รวมถึงโปรเซสเซอร์กลาง ARM 72-Core และจะวางจำหน่ายในไตรมาสที่ 2 ในปีหน้า 

ปกติแล้วการพัฒนาหรือฝึก AI ให้เรียนรู้ในตอนนี้ย่อมมีต้นทุนและค่าใช้จ่ายที่สูงและบางครั้งต้องใช้ GPU หลายพันตัวและข้อมูลมหาศาล จากนั้นโมเดลจะถูกใช้ในซอฟต์แวร์เพื่อทำการคาดการณ์ หรือสร้างเนื้อหา โดยใช้กระบวนการที่เรียกว่าการอนุมาน

แน่นอนว่าการอนุมานมีค่าใช้จ่ายสูงในการคำนวณ และต้องใช้พลังการประมวลผลจำนวนมากทุกครั้ง ที่ซอฟต์แวร์ทำงานและต้องทำงานตลอดเวลา เช่น เมื่อสร้างข้อความหรือรูปภาพ แตกต่างจากการฝึก AI ที่ใช้การอัปเดตโมเดล AI เท่านั้น

แต่ Nvidia GH200 ถูกพัฒนาขึ้นมาสำหรับการประมวลแบบอนุมานโดยเฉพาะและหน่วยความจำ มีความจุมากขึ้นทำให้สามารถใส่โมเดล AI ขนาดใหญ่เข้าไปในระบบเดียวได้

การเปิดตัวชิป AI ใหม่ในครั้งนี้คือการประกาศสงครามกันระหว่าง Nvidia และผู้ผลิตชิปประมวลผลเจ้าอื่น รวมไปถึงบริษัทเทคโนโลยียักษ์ใหญ่มากมาย เช่น AMD, Google และ Amazon นอกจากนี้ Nvidia ยังครองส่วนแบ่งการตลาดชิป AI ถึง 80% และ GPU ของ Nvidia ยังคงเป็นที่ต้องการของบริษัทที่กำลังพัฒนาเทคโนโลยี Generative AI 

ที่มา : Decrypt, Nvidia Research, CNBC

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

สรุป Microsoft Build เยือน ‘ไทย-อินโด-มาเลย์’ ลงทุนประเทศไหน ‘มากที่สุด’

Satya Nadella CEO ของ Microsoft ก็เดินทางมาร่วมแสดงวิสัยทัศน์ในงาน Microsoft Build: AI Day เรามาดูกันว่าในบรรดา 3 ประเทศที่ Microsoft เลือกลงทุนนี้ ใครจะได้อะไรไปบ้าง...

Responsive image

AI Palette ระดมทุน Series A1 Extension มูลค่า 500,000 ดอลลาร์สหรัฐ จาก ORZON Ventures เสริมแกร่งการขยายตลาด CPG

AI Palette ผู้นำด้านการใช้ AI ในการให้บริการโซลูชันสำหรับพัฒนาผลิตภัณฑ์ในกลุ่มสินค้าบรรจุภัณฑ์สำหรับผู้บริโภค ประกาศความสำเร็จในการระดมทุน 500,000 ดอลลาร์ ในรอบ Series A1 extension...

Responsive image

YouTrip เผยหยุดยาวคนไทยแห่เที่ยว "ญี่ปุ่น-จีน" ยอดใช้จ่ายเพิ่มขึ้น 150%

ในช่วงเทศกาลสงกรานต์ YouTrip พบว่า การใช้จ่ายเพิ่มขึ้นอย่างมีนัยสำคัญ โดยมียอดใช้จ่ายด้านการท่องเที่ยวในต่างประเทศเพิ่มขึ้น 150% เมื่อเทียบกับปีก่อน...