เปิดความสามารถ Voice Engine ปัญญาประดิษฐ์ด้านเสียงที่ OpenAI กำลังพัฒนา

เมษายน 1, 2024 | By Techsauce Team

รู้จัก ‘Voice Engine’ AI โคลนนิ่งเสียงจาก OpenAI ที่ใช้เวลาเรียนรู้เสียงมนุษย์เพียง 15 วินาที ก็พูดตามได้เหมือนเป็นคนเดียวกัน

เปิดความสามารถ Voice Engine จาก OpenAI

Voice Engine คือโมเดล AI โคลนเสียงตัวล่าสุดที่ OpenAI พัฒนามาตั้งแต่ปลายปี 2022 และเป็นโมเดลเดียวกับที่ใช้ในฟีเจอร์ ‘Read Aloud’ หรือการอ่านออกเสียงของ ChatGPTและเมื่อวันเสาร์ที่ผ่านมา (30/03/2024) บริษัทได้ออกมาเปิดข้อมูลและความสามารถของปัญญาประดิษฐ์ตัวนี้ผ่านบล็อกบนเว็บไซต์

โดยเผยว่า Voice Engine สามารถแปลงข้อความเป็นเสียงพูดได้โดยใช้ ‘ตัวอย่างเสียง’ และเรียนรู้จากต้นฉบับเพียงแค่ 15 วินาทีเท่านั้น หลังจากนั้นก็จะสามารถเลียนเสียงพูดต้นฉบับและแปลง text-to-voice ตามคำสั่งผู้ใช้ได้เลย ฟังตัวอย่างจาก OpenAI

แม้ AI จะได้รับเสียงต้นฉบับเพียงแค่สั้นๆ แต่ก็ยังสามารถสร้างเสียงที่ฟังดูสมจริงและสื่ออารมณ์ได้ใกล้เคียงกับต้นฉบับมากๆ ซึ่งนับเป็นเป็นก้าวสำคัญในเทคโนโลยี AI แต่ความก้าวหน้าในครั้งนี้ก็อาจนำมาสู่ความเสี่ยงที่จะถูกนำไปใช้ในทางที่ผิดได้เช่นเดียวกัน

Jeff Harris สมาชิกของทีมผู้พัฒนา Voice Engine ให้สัมภาษณ์กับ TechCrunch ว่าโมเดลดังกล่าวได้รับการฝึกอบรมจากข้อมูล 2 ประเภท ได้แก่ Licensed Data ข้อมูลที่บริษัทได้รับสิทธิ์ในการใช้งานจากเจ้าของข้อมูล และ Publicly Available Data ข้อมูลที่ทุกคนเข้าถึงได้ ดังนั้น โมเดลนี้ OpenAI จึงจะเปิดให้นักพัฒนาประมาณ 10 คนได้ใช้งานเท่านั้น

นอกจากนี้ เพื่อป้องกันความเสี่ยงที่อาจเกิด OpenAI ได้ทดลองให้กลุ่มพันธมิตรของบริษัทใช้งาน Voice Engine ได้แก่ Age of Learning บริษัทเทคโนโลยีการศึกษา, HeyGen แพลตฟอร์มสร้างวิดีโอด้วย AI , Dimagi ผู้ผลิตซอฟต์แวร์ด้านสุขภาพแนวหน้า, และ Lifespan ผู้สร้างแอปLivox และระบบสุขภาพ เป็นต้น

การทดลองในครั้งนี้จะถูกนำมาเป็นแม่แบบกำหนดแนวทางการใช้ Voice Engine เมื่อปล่อยสู่สาธารณชนในอนาคต (บริษัทยังไม่แน่ใจว่าควรเปิดให้ใช้หรือไม่) และทำให้บริษัททราบว่า AI จะเกิดประโยชน์ต่ออุตสาหกรรมต่างๆ ได้อย่างไร

กฎเกณฑ์สำคัญที่ OpenAI ตกลงกับพันธมิตรที่ได้ใช้งาน Voice Engine

OpenAI ให้ความสำคัญอย่างมากกับความปลอดภัย บริษัทได้เพิ่ม ‘ลายน้ำ’ ให้กับเสียงที่ AI สร้างขึ้นมา ซึ่งทำให้สามารถติดตามที่มาของเสียงและวิธีการนำเสียงเหล่านั้นไปใช้งาน ว่ามันถูกนำไปใช้ทำอะไรบ้าง รวมถึงยังมีการสร้างข้อตกลงกับพันธมิตร เพื่อป้องกันความเสี่ยงเพิ่มเติม ดังนี้

ไม่ใช้ในการแอบอ้างเป็นบุคคลอื่น เจ้าของเสียงต้นฉบับต้อง ‘ยินยอม’ ก่อนนำเสียงมาใช้ทุกครั้ง
หากใช้ Voice Engine ต้องระบุว่าเสียงนี้ทำขึ้นโดย AI (AI-generated )

การเปิดตัวในครั้งนี้เป็นเพียงแค่การแสดงศักยภาพของ AI และบริษัทจะยังไม่เผยแพร่เทคโนโลยีนี้ให้ใช้งานในวงกว้างจนกว่าจะแน่ใจว่ามันปลอดภัยและไม่ก่อให้เกิดปัญหารุนแรงใดๆ ในอนาคต

อ้างอิง: openai, theverge

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

เข้าสู่ระบบ
ลงทะเบียน

ลืมรหัสผ่าน?

มีบัญชีแล้วหรือยัง ?

มีบัญชีอยู่แล้ว ?

News

openai

Voice Engine

No comment

Burnout ใครว่าเรื่องเล็ก พนักงานหมดไฟ 1 คน บริษัทจะเสียเงินเท่าไหร่?

ภาวะหมดไฟ หรือ Burnout Syndrome ซึ่งไม่ได้เป็นแค่ปัญหาเล็กๆ น้อยๆ ที่คอยกัดกินสุขภาพกายและใจของเรา แต่มันคือ 'ระเบิดเวลา' ที่ถูกมองความและสร้างความเสียหายอย่างมากให้กับหลายองค์กรทั...

มีนาคม 12, 2025 | By Techsauce Team

News

burnout

ภาวะหมดไฟ

Techsauce - สภาหอการค้าไทย - มหาวิทยาลัยหอการค้า จับมือเตรียมยกระดับภาคการศึกษาและธุรกิจไทย

Techsauce สภาหอการค้าแห่งประเทศไทย และ มหาวิทยาลัยหอการค้าไทย (Harbour.Space@UTCC) ลงนาม MOU ส่งเสริมองค์ความรู้และพัฒนาศักยภาพของเยาวชนและผู้ประกอบการไทย...

มีนาคม 12, 2025 | By Techsauce Team

News

mou

techsauce

สภาหอการค้าแห่งประเทศไทย

techsauce-x-harbour-space-university-utcc

OpenAI เปิดตัว Responses API เร่งพัฒนา AI Agents ใช้จริงในโลกธุรกิจ

OpenAI ได้ประกาศเปิดตัวเครื่องมือใหม่ล่าสุดในชื่อ Responses API ซึ่งถือเป็นอีกก้าวสำคัญในการผลักดันการพัฒนา AI Agents หรือระบบอัตโนมัติที่สามารถปฏิบัติภารกิจต่าง ๆ ได้ด้วยตนเอง โดย...

มีนาคม 12, 2025 | By Techsauce Team

News

Openai

Responses API

เปิดความสามารถ Voice Engine ปัญญาประดิษฐ์ด้านเสียงที่ OpenAI กำลังพัฒนา

เปิดความสามารถ Voice Engine จาก OpenAI

กฎเกณฑ์สำคัญที่ OpenAI ตกลงกับพันธมิตรที่ได้ใช้งาน Voice Engine

RELATED ARTICLE

Burnout ใครว่าเรื่องเล็ก พนักงานหมดไฟ 1 คน บริษัทจะเสียเงินเท่าไหร่?

Techsauce - สภาหอการค้าไทย - มหาวิทยาลัยหอการค้า จับมือเตรียมยกระดับภาคการศึกษาและธุรกิจไทย

OpenAI เปิดตัว Responses API เร่งพัฒนา AI Agents ใช้จริงในโลกธุรกิจ