Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney

หากใครเคยใช้ Midjourney สร้างงานรูปภาพศิลปะมาแล้ว ก็จะเข้าใจถึงศักยภาพ AI ที่สร้างงาน ขึ้นมาว่ามันโหดแค่ไหน แต่ไม่นานมานี้ Nvidia ได้เผยงานวิจัยเกี่ยวกับ Perfusion แพลตฟอร์มสร้างรูปภาพด้วย AI ที่โหดกว่าเดิม ซึ่งมีการจัดแสดงโชว์ในงาน SIGGRAPH 2023 ที่จัดขึ้นที่ Los Angeles สหรัฐอเมริกา

AI

รายละเอียดของ Perfusion

Perfusion เป็น AI สร้างรูปภาพแบบ text-to-image แบบเดียวกันกับ Midjourney ซึ่งเป็นความร่วมมือในการวิจัยและพัฒนาโดย Nvidia และ Tel-Aviv University ในอิสราเอล โดยขนาดสเปคอยู่ที่ 100 KB AI ใช้เวลาเรียนรู้โดยรวม 4 นาที 

ในโมเดล AI ของ Perfusion มีเทคโนโลยี Key-Locking หรือการ “ล็อคข้อความ” นี้ทำงานโดยการเชื่อมต่อ คำใหม่ๆที่ผู้ใช้ต้องการเพิ่ม เช่นเมื่อเราใส่ Keyword ว่า 

A teddy dress like a Super Hero หรือ A teddy dressed in a blue suit is cooking a gourmet meal

AI

ภาพจาก : Nvidia 

จะสังเกตได้ว่าคำว่า Teddy ถูกล็อคคำไว้เรียบร้อยและเมื่อเราเพิ่มคำอื่นลงไป AI ก็จะไม่สร้างรูปผิดเพี้ยนและวิธีนี้จะไม่ทำให้เกิดการ Overfitting นั่นคือการที่โมเดล AI ไม่สามารถเรียนรู้ในสภาวะที่ซับซ้อนเกินไปได้หรือมีชุดข้อมูลไม่เพียงพอ 

ซึ่งนอกจากจะล็อคข้อความแล้วตัวเทคโนโลยียังล็อครูปแบบของภาพที่เราใส่ Keyword ไว้ด้วยและยังสามารถสร้างรูปแบบออกมาได้หลากหลายและละเอียดอีกต่างหาก

AI

ภาพจาก : Nvidia

หากอยากศึกษาถึงระบบการทำงานของโมเดล AI ที่ Perfusion ใช้เพิ่มเติมสามารถไปดูได้ที่เว็บไซต์ Nvidia.com

เปิดตัวชิปตัวใหม่ที่ดีกว่าและถูกลง

Nvidia ยังเปิดตัวชิป AI ตัวใหม่ในชื่อ Nvidia GH200 มี GPU แบบเดียวกับรุ่น H100 ซึ่งเป็นชิป AI ระดับสูงสุดของบริษัทในปัจจุบัน แต่ GH200 นี้จะมี GPU ที่มีหน่วยความจำถึง 141 กิกะไบต์ รวมถึงโปรเซสเซอร์กลาง ARM 72-Core และจะวางจำหน่ายในไตรมาสที่ 2 ในปีหน้า 

ปกติแล้วการพัฒนาหรือฝึก AI ให้เรียนรู้ในตอนนี้ย่อมมีต้นทุนและค่าใช้จ่ายที่สูงและบางครั้งต้องใช้ GPU หลายพันตัวและข้อมูลมหาศาล จากนั้นโมเดลจะถูกใช้ในซอฟต์แวร์เพื่อทำการคาดการณ์ หรือสร้างเนื้อหา โดยใช้กระบวนการที่เรียกว่าการอนุมาน

แน่นอนว่าการอนุมานมีค่าใช้จ่ายสูงในการคำนวณ และต้องใช้พลังการประมวลผลจำนวนมากทุกครั้ง ที่ซอฟต์แวร์ทำงานและต้องทำงานตลอดเวลา เช่น เมื่อสร้างข้อความหรือรูปภาพ แตกต่างจากการฝึก AI ที่ใช้การอัปเดตโมเดล AI เท่านั้น

แต่ Nvidia GH200 ถูกพัฒนาขึ้นมาสำหรับการประมวลแบบอนุมานโดยเฉพาะและหน่วยความจำ มีความจุมากขึ้นทำให้สามารถใส่โมเดล AI ขนาดใหญ่เข้าไปในระบบเดียวได้

การเปิดตัวชิป AI ใหม่ในครั้งนี้คือการประกาศสงครามกันระหว่าง Nvidia และผู้ผลิตชิปประมวลผลเจ้าอื่น รวมไปถึงบริษัทเทคโนโลยียักษ์ใหญ่มากมาย เช่น AMD, Google และ Amazon นอกจากนี้ Nvidia ยังครองส่วนแบ่งการตลาดชิป AI ถึง 80% และ GPU ของ Nvidia ยังคงเป็นที่ต้องการของบริษัทที่กำลังพัฒนาเทคโนโลยี Generative AI 

ที่มา : Decrypt, Nvidia Research, CNBC

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Google เปิดตัวฟีเจอร์ Rambler ลบ "เอ่อ-อ๋อ-เอ้ย" อัตโนมัติ จับไทยคำอังกฤษคำได้แม่นยำ

Google เปิดตัว Rambler ฟีเจอร์พิมพ์ด้วยเสียงพลัง Gemini บน Gboard! ฉลาดล้ำ ตัดคำอุทาน แก้ประโยคผิดได้เอง แถมพูดสลับไทย-อังกฤษได้ลื่นไหล ไม่ต้องโหลดแอปเพิ่ม...

Responsive image

Pause Point ฟีเจอร์ 'ดึงสติ' คนติดหน้าจอ ระบบใหม่ที่มากับ Android 17 ลดพฤติกรรมไถฟีดแบบไร้จุดหมาย

หลายครั้งที่เราหยิบโทรศัพท์เปิดแอปขึ้นมาเพื่อ ‘ดูแป๊บเดียว’ แต่กลับเผลอไถหน้าจอเพลินจนเสียเวลาไปเป็นวัน ล่าสุด Android ได้เปิดตัวฟีเจอร์ใหม่ชื่อ Pause Point เพื่อช่วยลดพฤติกรรมการไ...

Responsive image

The Android Show I/O Edition 2026 อัด 9 ประกาศใหญ่ก่อน Google I/O เปลี่ยน Android เป็นระบบอัจฉริยะ ที่ Gemini ช่วยทำงานข้ามแอปฯ ได้มากขึ้น

Google จัดงาน The Android Show I/O Edition ก่อนเวที Google I/O 2026 หนึ่งสัปดาห์ อัดประกาศใหญ่ทั้ง Gemini Multi-step ข้ามแอป Android 17 Screen Reactions Pause Point Quick Share จับ...