Gemini เปิดตัว Lyria 3 โมเดลแต่งเพลง ใช้ได้ในไทย แค่มีรูปภาพหรือไอเดียก็เปลี่ยนเป็น Track ได้ในไม่กี่วินาที

Google ตอกย้ำความเป็นผู้นำในสงคราม Generative AI อีกครั้ง ด้วยการอัปเกรดฟีเจอร์ Music Generation บนแอป Gemini โดยรอบนี้มาพร้อมโมเดล Lyria 3 จากทีม Google DeepMind ที่ไม่ได้มาแค่แต่งเพลงตามสั่ง แต่ยกระดับสู่การเป็น Creative Partner สำหรับ Creator ทั่วโลก

ความน่าสนใจของการอัปเดตครั้งนี้คือการก้าวข้ามขีดจำกัดเดิมๆ ของ AI Music อาทิ

  • Multimodal Experience ที่ไม่ใช่แค่พิมพ์สั่ง (Text-to-Track) แต่เราสามารถอัปโหลดรูปภาพหรือวิดีโอ เพื่อให้ AI วิเคราะห์มู้ดและโทน แล้วสร้างเพลงประกอบที่เข้ากันเป๊ะได้ทันที
  • Complete Lyricist ลบภาพจำ AI แต่งเพลงแบบงู ๆ ปลา ๆ เพราะ Lyria 3 สามารถแต่งเนื้อร้องให้สอดคล้องกับ Prompt ที่ได้รับอย่างแนบเนียน 
  • Professional Control ผู้ใช้งานสามารถปรับแต่งรายละเอียดได้ลึกขึ้น ตั้งแต่แนวเพลง, โทนเสียงร้อง ไปจนถึงจังหวะเพื่อให้ได้ผลลัพธ์ที่ตรงใจที่สุด

มีโซลูชันเพื่อ Creator Economy และความกังวลเรื่องลิขสิทธิ์

ในมุมของธุรกิจและ Ecosystem นั้น Google พยายามแก้ Pain Point เรื่องลิขสิทธิ์ซึ่งเป็นประเด็นร้อนในวงการ AI มาตลอด เช่น มี SynthID Watermarking หรือการฝังลายน้ำดิจิทัลที่มองไม่เห็นและหูไม่ได้ยิน เพื่อยืนยันว่าคอนเทนต์นี้ถูกสร้างโดย AI ป้องกันการแอบอ้างและการสับสนในอนาคต

และทาง Google ระบุว่าได้ทำงานร่วมกับพาร์ทเนอร์ในอุตสาหกรรมดนตรีอย่างใกล้ชิด เพื่อให้มั่นใจว่าเทคโนโลยีนี้จะช่วยเสริมศักยภาพมนุษย์มากกว่าการเข้าไปทดแทนหรือละเมิดสิทธิศิลปิน

ข่าวดีสำหรับผู้ใช้ในประเทศไทย! Google ยืนยันว่า Lyria 3 เริ่มทยอยเปิดให้ใช้งานในไทยแล้ว โดยครอบคลุมทั้งบน Desktop และแอปพลิเคชันบนมือถือ (iOS/Android) ภายในช่วงสัปดาห์นี้

แม้ในช่วง Beta จะเน้น 8 ภาษาหลักเป็นอันดับแรก แต่ระบบเข้าใจบริบทและการสั่งงานเป็นภาษาไทยได้ดีขึ้นมาก สำหรับผู้ที่สมัคร Google AI Premium (เช่นแพ็กเกจ Pro และ Ultra) จะได้รับโควตาในการสร้างเพลงที่สูงกว่า และเข้าถึงฟีเจอร์การปรับแต่งเชิงลึกได้มากกว่าผู้ใช้ทั่วไป

อ้างอิง: sea.mashable, blog.google

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

อดีตพนักงานแฉ Oracle สุ่มเลิกจ้างด้วยอัลกอริทึม มุ่งเป้ากลุ่มหัวกะทิที่ถือหุ้นเยอะ

ดราม่า Oracle ปลดพนักงาน 30,000 ตำแหน่ง! อดีตพนักงานแฉบริษัทใช้ ‘อัลกอริทึม’ คัดเฉพาะตัวท็อปเงินเดือนสูงและถือหุ้นเยอะออกก่อน...

Responsive image

Google เปิดตัว ‘Gemma 4’ AI Open Model ที่ทรงพลังที่สุด รองรับ 140 ภาษา รันได้บนมือถือ Android ยันเซิร์ฟเวอร์ระดับองค์กร

Gemma 4 สุดยอดโมเดล AI แบบเปิด (Open Model) จาก Google ที่เก่งที่สุด พร้อมฟีเจอร์ให้เหตุผลขั้นสูง รองรับกว่า 140 ภาษา รันได้ตั้งแต่มือถือไปจนถึงพีซีส่วนตัว เปิดโอกาสให้นักพัฒนาต่อย...

Responsive image

Microsoft เปิดตัว ‘MAI’ 3 AI โมเดลใหม่ Transcribe-1, Voice-1, Image-2 แปลงเสียง-สร้างวิดีโอสุดล้ำ ราคาถูกกว่าคู่แข่ง

ไมโครซอฟท์เปิดตัว 3 โมเดลปัญญาประดิษฐ์พื้นฐานใหม่ MAI-Transcribe-1, Voice-1 และ Image-2 ชูจุดเด่นฟีเจอร์ล้ำหน้าในราคาที่ถูกกว่าคู่แข่งอย่างกูเกิลและโอเพ่นเอไอ พร้อมวิสัยทัศน์เพื่อม...