Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney | Techsauce

Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney

หากใครเคยใช้ Midjourney สร้างงานรูปภาพศิลปะมาแล้ว ก็จะเข้าใจถึงศักยภาพ AI ที่สร้างงาน ขึ้นมาว่ามันโหดแค่ไหน แต่ไม่นานมานี้ Nvidia ได้เผยงานวิจัยเกี่ยวกับ Perfusion แพลตฟอร์มสร้างรูปภาพด้วย AI ที่โหดกว่าเดิม ซึ่งมีการจัดแสดงโชว์ในงาน SIGGRAPH 2023 ที่จัดขึ้นที่ Los Angeles สหรัฐอเมริกา

AI

รายละเอียดของ Perfusion

Perfusion เป็น AI สร้างรูปภาพแบบ text-to-image แบบเดียวกันกับ Midjourney ซึ่งเป็นความร่วมมือในการวิจัยและพัฒนาโดย Nvidia และ Tel-Aviv University ในอิสราเอล โดยขนาดสเปคอยู่ที่ 100 KB AI ใช้เวลาเรียนรู้โดยรวม 4 นาที 

ในโมเดล AI ของ Perfusion มีเทคโนโลยี Key-Locking หรือการ “ล็อคข้อความ” นี้ทำงานโดยการเชื่อมต่อ คำใหม่ๆที่ผู้ใช้ต้องการเพิ่ม เช่นเมื่อเราใส่ Keyword ว่า 

A teddy dress like a Super Hero หรือ A teddy dressed in a blue suit is cooking a gourmet meal

AI

ภาพจาก : Nvidia 

จะสังเกตได้ว่าคำว่า Teddy ถูกล็อคคำไว้เรียบร้อยและเมื่อเราเพิ่มคำอื่นลงไป AI ก็จะไม่สร้างรูปผิดเพี้ยนและวิธีนี้จะไม่ทำให้เกิดการ Overfitting นั่นคือการที่โมเดล AI ไม่สามารถเรียนรู้ในสภาวะที่ซับซ้อนเกินไปได้หรือมีชุดข้อมูลไม่เพียงพอ 

ซึ่งนอกจากจะล็อคข้อความแล้วตัวเทคโนโลยียังล็อครูปแบบของภาพที่เราใส่ Keyword ไว้ด้วยและยังสามารถสร้างรูปแบบออกมาได้หลากหลายและละเอียดอีกต่างหาก

AI

ภาพจาก : Nvidia

หากอยากศึกษาถึงระบบการทำงานของโมเดล AI ที่ Perfusion ใช้เพิ่มเติมสามารถไปดูได้ที่เว็บไซต์ Nvidia.com

เปิดตัวชิปตัวใหม่ที่ดีกว่าและถูกลง

Nvidia ยังเปิดตัวชิป AI ตัวใหม่ในชื่อ Nvidia GH200 มี GPU แบบเดียวกับรุ่น H100 ซึ่งเป็นชิป AI ระดับสูงสุดของบริษัทในปัจจุบัน แต่ GH200 นี้จะมี GPU ที่มีหน่วยความจำถึง 141 กิกะไบต์ รวมถึงโปรเซสเซอร์กลาง ARM 72-Core และจะวางจำหน่ายในไตรมาสที่ 2 ในปีหน้า 

ปกติแล้วการพัฒนาหรือฝึก AI ให้เรียนรู้ในตอนนี้ย่อมมีต้นทุนและค่าใช้จ่ายที่สูงและบางครั้งต้องใช้ GPU หลายพันตัวและข้อมูลมหาศาล จากนั้นโมเดลจะถูกใช้ในซอฟต์แวร์เพื่อทำการคาดการณ์ หรือสร้างเนื้อหา โดยใช้กระบวนการที่เรียกว่าการอนุมาน

แน่นอนว่าการอนุมานมีค่าใช้จ่ายสูงในการคำนวณ และต้องใช้พลังการประมวลผลจำนวนมากทุกครั้ง ที่ซอฟต์แวร์ทำงานและต้องทำงานตลอดเวลา เช่น เมื่อสร้างข้อความหรือรูปภาพ แตกต่างจากการฝึก AI ที่ใช้การอัปเดตโมเดล AI เท่านั้น

แต่ Nvidia GH200 ถูกพัฒนาขึ้นมาสำหรับการประมวลแบบอนุมานโดยเฉพาะและหน่วยความจำ มีความจุมากขึ้นทำให้สามารถใส่โมเดล AI ขนาดใหญ่เข้าไปในระบบเดียวได้

การเปิดตัวชิป AI ใหม่ในครั้งนี้คือการประกาศสงครามกันระหว่าง Nvidia และผู้ผลิตชิปประมวลผลเจ้าอื่น รวมไปถึงบริษัทเทคโนโลยียักษ์ใหญ่มากมาย เช่น AMD, Google และ Amazon นอกจากนี้ Nvidia ยังครองส่วนแบ่งการตลาดชิป AI ถึง 80% และ GPU ของ Nvidia ยังคงเป็นที่ต้องการของบริษัทที่กำลังพัฒนาเทคโนโลยี Generative AI 

ที่มา : Decrypt, Nvidia Research, CNBC

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

LINE MAN ประกาศจุดยืนทางธุรกิจใหม่ "ถูกสุดทุกวัน" พร้อมตอกย้ำความเป็นผู้นำตลาดฟู้ดเดลิเวอรีไทย

LINE MAN Wongnai ผู้นำในวงการฟู้ดเดลิเวอรีของไทย จัดงานแถลงทิศทางธุรกิจครั้งใหญ่ในวันที่ 3 ตุลาคม 2567 ณ Quartier Avenue ศูนย์การค้า ดิ เอ็มควอเทียร์ โดยประกาศ Positioning ใหม่ "ถู...

Responsive image

’การบินไทย‘ กางไทม์ไลน์ฟื้นฟูกิจการ เตรียมสยายปีกกลับตลาด SET

การบินไทย ก้าวข้ามวิกฤตเข้าสู่แผนฟื้นฟูกิจการ และดำเนินการตามแผนโดยไม่เกิดเหตุผิดนัด สเต็ปต่อจากนี้ บริษัทวางกลยุทธ์ออกจากแผนฟื้นฟูกิจการอย่างไร เพื่อพาการบินไทยกลับเข้ามาซื้อขายหุ...

Responsive image

SME ไทยรับมือกับความยั่งยืนอย่างไรดี ? รู้จัก UOB Sustainability Compass ตัวช่วย SMEs เริ่มต้นเส้นทางแห่งความยั่งยืน

ยุคนี้ธุรกิจต้องคำนึงถึงความยั่งยืน หรือ ESG (Environmental, Social, Governance) ไม่ใช่แค่เทรนด์ แต่เป็นสิ่งที่ลูกค้า คู่ค้า และนักลงทุน ก็ให้ความสำคัญ จากผลสำรวจ UOB Business Outl...