สร้างวิดีโอสมจริง ใช้แค่รูปนิ่งกับคลิปเสียง รู้จักโมเดล VASA-1 ที่ Microsoft กำลังวิจัย

แค่ใช้รูปถ่ายกับคลิปเสียง ก็สามารถสร้างวิดีโอของเราได้แบบสมจริง ด้วยโมเดล VASA-1 ตัวใหม่จาก Microsoft ที่ต้องบอกว่าทั้งน่าทึ่ง น่าประทับใจ และน่ากลัวด้วย

รู้จัก VASA-1 โมเดลช่วยสร้างวิดีโอจากรูปถ่ายและคลิปเสียง 

VASA-1 คือโมเดลสร้างวิดีโอที่ Microsoft กำลังวิจัย สามารถสร้างวิดีโอหน้าคนที่กำลังพูด ด้วยการใช้แค่รูปนิ่งกับคลิปเสียงของคนนั้นได้อย่างสมจริง

ทั้งการขยับปากที่ไปพร้อมกับเสียงพูดอย่างแนบเนียน ผสานกับการแสดงออกทางสีหน้าและการเคลื่อนไหวศีรษะอย่างเป็นธรรมชาติ ทื่ทำให้เรารู้สึกถึงความมีชีวิตชีวาและความสมจริง ด้วยการใช้เทคโนโลยี Holistic facial dynamics และโมเดลการสร้างการเคลื่อนไหวของศีรษะ ซึ่ง Microsoft เคลมว่ามีประสิทธิภาพเหนือกว่าโมเดลตัวอื่นในตลาด

ขณะนี้โมเดล VASA-1 อยู่ภายใต้การวิจัยของ Microsoft โดยบริษัทให้ข้อมูลว่าจะใช้เพื่อสร้าง Virtual Character หรือ ตัวละครเสมือนโดยเฉพาะ โดยภาพบุคคลที่ Microsoft นำมาเผยแพร่การวิจัยนั้น ไม่ได้มีตัวตนอยู่บนโลกจริงๆ เป็นการใช้โมเดล DALL·E-3 ในการสร้างใบหน้าคนขึ้นมา ตัวโมเดลยังสามารถรองรับการสร้างวิดีโอแบบออนไลน์ขนาด 512x512 ที่สูงถึง 40 FPS ใช้เวลาเพียง 2 นาทีโดยประมาณ

ด้วยความกังวลว่าเทคโนโลยีนี้จะถูกนำไปใช้แบบผิดๆ เช่น สร้างข้อมูลเท็จ หลอกลวงฉ้อฉล ทาง Microsoft จึงยังไม่มีแผนใดๆ ที่จะเผยแพร่โมเดล VASA-1 สู่สาธารณะ จนกว่าจะแน่ใจว่าเทคโนโลยีจะถูกนำไปใช้อย่างรับผิดชอบและมีกฎระเบียบที่เหมาะสมมาควบคุม 

อ้างอิง : microsoft, tomsguide 

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Meta พลิกเกมโซเชียล สร้างหน้าฟีดยุคใหม่ ‘AI Social Feeds’ AI สร้างคอนเทนต์ให้ดูเอง เจาะจงตามความสนใจ ไม่มีซ้ำ เลื่อนได้ไม่รู้จบ

Meta พลิกโฉมโซเชียลมีเดีย สู่ยุค 'AI Social Feeds' เมื่อหน้าฟีดไม่ได้แค่จัดเรียงโพสต์ แต่ AI สามารถสร้างคอนเทนต์ใหม่ขึ้นมาเฉพาะบุคคลแบบ On-demand เปิดอนาคตโซเชียลที่สดใหม่ เลื่อนได...

Responsive image

มากกว่าแค่กระเป๋า แต่นี่คือ ‘บ้านเคลื่อนที่’ สำหรับคนไร้บ้าน ใบเดียวครบที่พัก แหล่งไฟและอุปกรณ์กู้ชีพ

นักศึกษาในซานฟรานซิสโกออกแบบกระเป๋าเป้โซลาร์เซลล์เพื่อช่วยเหลือผู้ไร้บ้าน โดยกระเป๋าสามารถทำหน้าที่เป็นทั้งที่พักชั่วคราว แหล่งพลังงานไฟฟ้าและชุดสิ่งของจำเป็นพื้นฐาน...

Responsive image

ไม่ต้องเขียนโค้ดก็สร้างเกมได้! Google เปิดตัว Project Genie เนรมิตโลก 3D ที่เดินเล่นได้จริงผ่าน AI

ทำความรู้จัก Project Genie จาก Google DeepMind นวัตกรรมสร้างโลกเสมือนแบบโต้ตอบได้ด้วย AI ขับเคลื่อนโดยโมเดลโลก Genie 3 และ Nano Banana Pro เปิดประสบการณ์สร้างโลกจากข้อความและรูปภาพ...