Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney | Techsauce

Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney

หากใครเคยใช้ Midjourney สร้างงานรูปภาพศิลปะมาแล้ว ก็จะเข้าใจถึงศักยภาพ AI ที่สร้างงาน ขึ้นมาว่ามันโหดแค่ไหน แต่ไม่นานมานี้ Nvidia ได้เผยงานวิจัยเกี่ยวกับ Perfusion แพลตฟอร์มสร้างรูปภาพด้วย AI ที่โหดกว่าเดิม ซึ่งมีการจัดแสดงโชว์ในงาน SIGGRAPH 2023 ที่จัดขึ้นที่ Los Angeles สหรัฐอเมริกา

AI

รายละเอียดของ Perfusion

Perfusion เป็น AI สร้างรูปภาพแบบ text-to-image แบบเดียวกันกับ Midjourney ซึ่งเป็นความร่วมมือในการวิจัยและพัฒนาโดย Nvidia และ Tel-Aviv University ในอิสราเอล โดยขนาดสเปคอยู่ที่ 100 KB AI ใช้เวลาเรียนรู้โดยรวม 4 นาที 

ในโมเดล AI ของ Perfusion มีเทคโนโลยี Key-Locking หรือการ “ล็อคข้อความ” นี้ทำงานโดยการเชื่อมต่อ คำใหม่ๆที่ผู้ใช้ต้องการเพิ่ม เช่นเมื่อเราใส่ Keyword ว่า 

A teddy dress like a Super Hero หรือ A teddy dressed in a blue suit is cooking a gourmet meal

AI

ภาพจาก : Nvidia 

จะสังเกตได้ว่าคำว่า Teddy ถูกล็อคคำไว้เรียบร้อยและเมื่อเราเพิ่มคำอื่นลงไป AI ก็จะไม่สร้างรูปผิดเพี้ยนและวิธีนี้จะไม่ทำให้เกิดการ Overfitting นั่นคือการที่โมเดล AI ไม่สามารถเรียนรู้ในสภาวะที่ซับซ้อนเกินไปได้หรือมีชุดข้อมูลไม่เพียงพอ 

ซึ่งนอกจากจะล็อคข้อความแล้วตัวเทคโนโลยียังล็อครูปแบบของภาพที่เราใส่ Keyword ไว้ด้วยและยังสามารถสร้างรูปแบบออกมาได้หลากหลายและละเอียดอีกต่างหาก

AI

ภาพจาก : Nvidia

หากอยากศึกษาถึงระบบการทำงานของโมเดล AI ที่ Perfusion ใช้เพิ่มเติมสามารถไปดูได้ที่เว็บไซต์ Nvidia.com

เปิดตัวชิปตัวใหม่ที่ดีกว่าและถูกลง

Nvidia ยังเปิดตัวชิป AI ตัวใหม่ในชื่อ Nvidia GH200 มี GPU แบบเดียวกับรุ่น H100 ซึ่งเป็นชิป AI ระดับสูงสุดของบริษัทในปัจจุบัน แต่ GH200 นี้จะมี GPU ที่มีหน่วยความจำถึง 141 กิกะไบต์ รวมถึงโปรเซสเซอร์กลาง ARM 72-Core และจะวางจำหน่ายในไตรมาสที่ 2 ในปีหน้า 

ปกติแล้วการพัฒนาหรือฝึก AI ให้เรียนรู้ในตอนนี้ย่อมมีต้นทุนและค่าใช้จ่ายที่สูงและบางครั้งต้องใช้ GPU หลายพันตัวและข้อมูลมหาศาล จากนั้นโมเดลจะถูกใช้ในซอฟต์แวร์เพื่อทำการคาดการณ์ หรือสร้างเนื้อหา โดยใช้กระบวนการที่เรียกว่าการอนุมาน

แน่นอนว่าการอนุมานมีค่าใช้จ่ายสูงในการคำนวณ และต้องใช้พลังการประมวลผลจำนวนมากทุกครั้ง ที่ซอฟต์แวร์ทำงานและต้องทำงานตลอดเวลา เช่น เมื่อสร้างข้อความหรือรูปภาพ แตกต่างจากการฝึก AI ที่ใช้การอัปเดตโมเดล AI เท่านั้น

แต่ Nvidia GH200 ถูกพัฒนาขึ้นมาสำหรับการประมวลแบบอนุมานโดยเฉพาะและหน่วยความจำ มีความจุมากขึ้นทำให้สามารถใส่โมเดล AI ขนาดใหญ่เข้าไปในระบบเดียวได้

การเปิดตัวชิป AI ใหม่ในครั้งนี้คือการประกาศสงครามกันระหว่าง Nvidia และผู้ผลิตชิปประมวลผลเจ้าอื่น รวมไปถึงบริษัทเทคโนโลยียักษ์ใหญ่มากมาย เช่น AMD, Google และ Amazon นอกจากนี้ Nvidia ยังครองส่วนแบ่งการตลาดชิป AI ถึง 80% และ GPU ของ Nvidia ยังคงเป็นที่ต้องการของบริษัทที่กำลังพัฒนาเทคโนโลยี Generative AI 

ที่มา : Decrypt, Nvidia Research, CNBC

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

จีนตรวจสอบนโยบาย Apple ต่อต้านการผูกขาดบน App Store เหตุเก็บค่าธรรมเนียมนักพัฒนาสูงถึง 30%

รัฐบาลจีนกำลังเพิ่มความเข้มงวดในการตรวจสอบบริษัทเทคโนโลยีต่างชาติ โดยล่าสุด Apple เตรียมถูกตรวจสอบจากเรื่องค่าธรรมเนียมที่สูงเกินไปและการจำกัดการแข่งขันใน App Store...

Responsive image

กล้องโทรทรรศน์ตรวจพบ Monster Radio Jet ที่เปล่งออกมาจาก Quasar ในยุคแรกของจักรวาล

นักดาราศาสตร์พบ Monster Radio Jet จาก Quasar ที่เกิดขึ้นตั้งแต่จักรวาลยุคแรก สัญญาณพลังงานที่เดินทางมานานกว่า 13,000 ล้านปี อาจเป็นกุญแจไขความลับ จุดกำเนิดของจักรวาล และวิวัฒนาการข...

Responsive image

Amazon ประกาศเพิ่มงบ 3.4 ล้านล้านบาท เร่งลงทุน AI หวังคว้า "โอกาสทอง"

Amazon ประกาศ เพิ่มงบลงทุนเป็น 1 แสนล้านดอลลาร์สหรัฐ (ประมาณ 3.4 ล้านล้านบาท) ในปี 2025 ซึ่งสูงกว่าปีที่แล้วที่ใช้ไป 8.3 หมื่นล้านดอลลาร์ โดยเน้นหนักไปที่ AI และโครงสร้างพื้นฐานด้า...