สะเทือนวงการดนตรี Nvidia เปิดตัว Fugatto AI สร้างเสียงครบวงจรแค่เขียน Prompt

Nvidia ลงสนามเครื่องมือสร้างเสียงด้วย AI เปิดตัว Fugatto โมเดล AI ที่สามารถสร้างสรรค์และปรับแต่งเสียงได้อย่างเหนือชั้น เพียงแค่เขียน prompt พร้อมปฏิวัติอุตสาหกรรมหลากหลาย ตั้งแต่วงการดนตรี ภาพยนตร์ วิดีโอเกม ไปจนถึงบริการแปลภาษา

Fugatto หรือชื่อเต็มว่า Foundational Generative Audio Transformer Opus 1 โดดเด่นด้วยความสามารถที่ทำได้หลากหลายในโมเดลเดียว ครอบคลุมตั้งแต่การสังเคราะห์เสียงพูด สร้างเอฟเฟกต์เสียง และสร้างดนตรี จนถึงแปลงเสียงดนตรีเป็นให้เป็นเสียงคน เปลี่ยนอารมณ์และสำเนียงของเสียงพูด หรือแม้แต่การแปลจากภาษาหนึ่งไปอีกภาษาหนึ่งโดยคงเสียงเดิมของผู้พูดไว้ Fugatto จึงเป็นเสมือนส่วนเติมเต็มที่สมบูรณ์แบบให้กับโมเดลสร้างภาพและวิดีโออย่าง Stable Video Diffusion และ Sora 


Bryan Catanzaro รองประธานฝ่ายวิจัย applied deep learning ของ Nvidia กล่าวว่า สิ่งที่น่าตื่นเต้นเกี่ยวกับ Fugatto ความสามารถสั่งให้สร้างเสียงในรูปแบบต่างๆ ได้จากการเขียน prompt ซึ่งเป็นการเปิดโอกาสใหม่ๆ ในการสร้างสรรค์เสียงที่ไม่เคยมีมาก่อนได้อย่างง่ายได้

แม้ Catanzaro จะมอง Fugatto ว่าจะเป็นเครื่องมือสำหรับยุคใหม่สำหรับศิลปินในการสร้างสรรค์ผลงาน และอาจนำไปสู่รูปแบบดนตรีใหม่ๆ เช่นเดียวกับที่กีตาร์และเครื่องเล่นแผ่นเสียงเคยทำได้ อย่างไรก็ตาม Nvidia ยังไม่มีแผนเปิดตัว Fugatto สู่สาธารณะในเร็วๆ นี้ เนื่องจากความสัมพันธ์ที่ซับซ้อนระหว่าง AI กับวงการเพลง โดยเฉพาะความกังวลเกี่ยวกับผลกระทบต่อศิลปิน sound engineer และตำแหน่งงานอื่นๆ ที่เกี่ยวข้อง รวมถึงข้อพิพาทเรื่องลิขสิทธิ์ที่ยังคงเป็นประเด็นสำคัญ

Nvidia ตระหนักถึงศักยภาพของ Fugatto ในการสร้างประสบการณ์ทางเสียงในรูปแบบใหม่ๆ แต่ยังคงย้ำถึงความจำเป็นในการพัฒนาและใช้งานอย่างมีความรับผิดชอบ ขณะนี้อยู่ในขั้นตอนการวิจัยและประเมินเพื่อลดความเสี่ยงก่อนการเปิดตัวอย่างเป็นทางการ

อ้างอิง: reuters, yahoo

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

SCBX แจ้งกำไร Q1/2026 ที่ 10,195 ล้านบาท ลดลง 18.5% รับแรงกดดันดอกเบี้ยนโยบายขาลง แต่รายได้ค่าธรรมเนียมพุ่งถึง 17.7%

เอสซีบีเอกซ์แจ้งกำไรสุทธิไตรมาส 1/2569 ที่ 10,195 ล้านบาท ลดลง 18.5% YoY จากรายได้ดอกเบี้ยสุทธิหดตัวตามดอกเบี้ยนโยบาย แต่ค่าธรรมเนียมโต 17.7% NPL ลดเหลือ 3.23% พร้อมเปิดตัวแบงก์เอก...

Responsive image

นักวิทย์ฯ โหลดจีโนมสมบูรณ์ชุดแรก เข้าควอนตัมคอมพิวเตอร์ได้แล้ว! ตั้งเป้าวิเคราะห์พันธุกรรมมนุษย์เร็วกว่าเครื่องมือเดิม 100 เท่า

ทีมวิจัยจาก Wellcome Sanger Institute ร่วมกับ Oxford, Cambridge และ Melbourne โหลดจีโนม Hepatitis D เข้าสู่ควอนตัมคอมพิวเตอร์ IBM Heron 156 คิวบิตเป็นครั้งแรก ตั้งเป้าวิเคราะห์พันจ...

Responsive image

Amazon ลงทุนเพิ่ม 25,000 ล้านดอลลาร์ใน Anthropic แลกสัญญาคลาวด์ AWS 10 ปี มูลค่ากว่า 1 แสนล้านดอลลาร์

Amazon ประกาศลงทุนเพิ่มใน Anthropic สูงสุด 25,000 ล้านดอลลาร์ แลกสัญญาคลาวด์ AWS 10 ปี มูลค่ากว่า 100,000 ล้านดอลลาร์ พร้อมกำลังประมวลผล 5 กิกะวัตต์จากชิป Trainium และย้าย Claude P...