เปิดความสามารถ Voice Engine ปัญญาประดิษฐ์ด้านเสียงที่ OpenAI กำลังพัฒนา

รู้จัก ‘Voice Engine’ AI โคลนนิ่งเสียงจาก OpenAI ที่ใช้เวลาเรียนรู้เสียงมนุษย์เพียง 15 วินาที ก็พูดตามได้เหมือนเป็นคนเดียวกัน 

เปิดความสามารถ Voice Engine จาก OpenAI

Voice Engine คือโมเดล AI โคลนเสียงตัวล่าสุดที่ OpenAI พัฒนามาตั้งแต่ปลายปี 2022 และเป็นโมเดลเดียวกับที่ใช้ในฟีเจอร์ ‘Read Aloud’ หรือการอ่านออกเสียงของ ChatGPTและเมื่อวันเสาร์ที่ผ่านมา (30/03/2024) บริษัทได้ออกมาเปิดข้อมูลและความสามารถของปัญญาประดิษฐ์ตัวนี้ผ่านบล็อกบนเว็บไซต์ 

โดยเผยว่า Voice Engine สามารถแปลงข้อความเป็นเสียงพูดได้โดยใช้ ‘ตัวอย่างเสียง’ และเรียนรู้จากต้นฉบับเพียงแค่ 15 วินาทีเท่านั้น หลังจากนั้นก็จะสามารถเลียนเสียงพูดต้นฉบับและแปลง text-to-voice ตามคำสั่งผู้ใช้ได้เลย ฟังตัวอย่างจาก OpenAI

แม้ AI จะได้รับเสียงต้นฉบับเพียงแค่สั้นๆ แต่ก็ยังสามารถสร้างเสียงที่ฟังดูสมจริงและสื่ออารมณ์ได้ใกล้เคียงกับต้นฉบับมากๆ  ซึ่งนับเป็นเป็นก้าวสำคัญในเทคโนโลยี AI แต่ความก้าวหน้าในครั้งนี้ก็อาจนำมาสู่ความเสี่ยงที่จะถูกนำไปใช้ในทางที่ผิดได้เช่นเดียวกัน

Jeff Harris สมาชิกของทีมผู้พัฒนา Voice Engine ให้สัมภาษณ์กับ TechCrunch ว่าโมเดลดังกล่าวได้รับการฝึกอบรมจากข้อมูล 2 ประเภท ได้แก่ Licensed Data ข้อมูลที่บริษัทได้รับสิทธิ์ในการใช้งานจากเจ้าของข้อมูล และ Publicly Available Data ข้อมูลที่ทุกคนเข้าถึงได้ ดังนั้น โมเดลนี้ OpenAI จึงจะเปิดให้นักพัฒนาประมาณ 10 คนได้ใช้งานเท่านั้น

นอกจากนี้ เพื่อป้องกันความเสี่ยงที่อาจเกิด OpenAI ได้ทดลองให้กลุ่มพันธมิตรของบริษัทใช้งาน Voice Engine ได้แก่ Age of Learning บริษัทเทคโนโลยีการศึกษา, HeyGen แพลตฟอร์มสร้างวิดีโอด้วย AI , Dimagi  ผู้ผลิตซอฟต์แวร์ด้านสุขภาพแนวหน้า, และ Lifespan ผู้สร้างแอปLivox และระบบสุขภาพ เป็นต้น 

การทดลองในครั้งนี้จะถูกนำมาเป็นแม่แบบกำหนดแนวทางการใช้ Voice Engine เมื่อปล่อยสู่สาธารณชนในอนาคต (บริษัทยังไม่แน่ใจว่าควรเปิดให้ใช้หรือไม่) และทำให้บริษัททราบว่า AI จะเกิดประโยชน์ต่ออุตสาหกรรมต่างๆ ได้อย่างไร

กฎเกณฑ์สำคัญที่ OpenAI ตกลงกับพันธมิตรที่ได้ใช้งาน Voice Engine

OpenAI ให้ความสำคัญอย่างมากกับความปลอดภัย บริษัทได้เพิ่ม ‘ลายน้ำ’ ให้กับเสียงที่ AI สร้างขึ้นมา ซึ่งทำให้สามารถติดตามที่มาของเสียงและวิธีการนำเสียงเหล่านั้นไปใช้งาน ว่ามันถูกนำไปใช้ทำอะไรบ้าง รวมถึงยังมีการสร้างข้อตกลงกับพันธมิตร เพื่อป้องกันความเสี่ยงเพิ่มเติม ดังนี้

  1. ไม่ใช้ในการแอบอ้างเป็นบุคคลอื่น เจ้าของเสียงต้นฉบับต้อง ‘ยินยอม’ ก่อนนำเสียงมาใช้ทุกครั้ง
  2. หากใช้ Voice Engine ต้องระบุว่าเสียงนี้ทำขึ้นโดย AI (AI-generated )

การเปิดตัวในครั้งนี้เป็นเพียงแค่การแสดงศักยภาพของ AI และบริษัทจะยังไม่เผยแพร่เทคโนโลยีนี้ให้ใช้งานในวงกว้างจนกว่าจะแน่ใจว่ามันปลอดภัยและไม่ก่อให้เกิดปัญหารุนแรงใดๆ ในอนาคต

อ้างอิง: openai, theverge 

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Sony อัปเกรด ‘แอร์พกพา’ Reon Pocket Pro Plus เย็นขึ้น แบตอึดสูงสุด 34 ชั่วโมง

ในช่วงไม่กี่ปีที่ผ่านมา 'แอร์พกพา' หรืออุปกรณ์ควบคุมอุณหภูมิร่างกายแบบพกพา เริ่มได้รับความสนใจมากขึ้น โดยเฉพาะในประเทศเมืองร้อนหรือสำหรับผู้ที่ต้องทำงานกลางแจ้ง ล่าสุด Sony ซึ่งเป็...

Responsive image

Haier ตั้งโรงงานอัจฉริยะ ผลิตแอร์เชิงพาณิชย์ในไทย เตรียมเป็นฐานการผลิตใหญ่สุดในอาเซียน

บริษัท ดับบลิวเอชเอ อินดัสเตรียล ดีเวลลอปเมนท์ จำกัด (มหาชน) หรือ WHAID ภายใต้กลุ่มบริษัท ดับบลิวเอชเอ คอร์ปอเรชั่น จำกัด (มหาชน) หรือ WHA Group ตอกย้ำวิสัยทัศน์การเป็น “The Ultim...

Responsive image

Amazon ลงทุน $30,000 ล้าน อินโด มาเล สิงคโปร์ และไทย ใน Cloud และ AI คาดดัน GDP โตกว่า 6.4 หมื่นล้านดอลลาร์สหรัฐ

Amazon กางแผนบิ๊กโปรเจกต์ทุ่มงบกว่า 3.3 หมื่นล้านเหรียญ ลุยปักหมุดโครงสร้างพื้นฐาน Cloud และ AI ทั่วอาเซียน รวมถึงไทย คาดดัน GDP พุ่งทะลุเป้าภายในปี 2039...