ถาม ChatGPT ด้วยรูปภาพและเสียงพูด OpenAI เร่งสุดตัวในสนามแข่ง AI

OpenAI ประกาศเพิ่มฟีเจอร์ “ถาม AI ได้ด้วยรูปภาพและเสียงพูด” อย่างเป็นทางการ เมื่อวันที่ 25 กันยายนที่ผ่านมา โดยมีจุดประสงค์ที่จะเป็นแพลตฟอร์มที่มากกว่า Search Engine ฟีเจอร์ใหม่นี้จะเริ่มเปิดตัวให้กับสมาชิกแบบ ChatGPT Plus และ Enterprise ในอีก 2 สัปดาห์ข้างหน้า 

ตอนนี้เราสามารถถาม AI ด้วยรูปและเสียง บน ChatGPT ได้แล้ว

ฟีเจอร์ Voice จะยังคงจำกัดอยู่แค่บนแอปพลิเคชั่นทั้ง iOS และ Android สำหรับการใช้งานสามารถเข้าไปที่ Settings และเลือก New Features

การประกาศของ OpenAI เกิดขึ้นในช่วงเวลาเดียวกันกับที่ Amazon ประกาศลงทุนกับ Anthropic มากกว่า 4 พันล้านดอลลาร์ ถือเป็นการประกาศแข่งขันด้าน AI ครั้งใหญ่ของบริษัทเทคโนโลยีระดับโลก

ฟีเจอร์ AI ที่ฉลาดกว่าเดิม

OpenAI นำโมเดลภาษาขนาดใหญ่ของตนมาพัฒนารูปแบบ Generative AI ให้ฉลาดมากขึ้น ซึ่งความฉลาดของ AI ที่พัฒนาในเวอร์ชั่นล่าสุดมีตั้งแต่ ใช้ ChatGPT แต่งนิทานก่อนนอน ด้วยคำพูดของเราได้ทันที โดยมีเสียงเตือนเล็กน้อยเพื่อเป็นแนวทางในการเล่าเรื่อง หรือผู้ใช้งานสามารถถามคำถามได้โดย ChatGPT จะให้คำตอบในรูปแบบคำพูด

ในเรื่องการถอดเสียงและจดจำเสียง OpenAI ได้ใช้นักพากย์เสียงที่มีเสียงที่แตกต่างกัน 5 รูปแบบ มาช่วยพัฒนาระบบ Whispher ซึ่งเป็นระบบถอดเสียงเป็นข้อความของ OpenAI 

นอกจากนี้ ChatGPT ยังสามารถถาม AI โดยใช้รูปภาพได้อีกด้วย เช่น เมื่อเราอัปโหลดรูปภาพสิ่งของ บางอย่าง และขอให้ ChatGPT อธิบายว่ามันคืออะไร หรือให้คำแนะนำกับเรา

Spotify ใช้ OpenAI’s voice 

ล่าสุด Spotify ได้ประกาศฟีเจอร์ใหม่ที่ใช้ AI แปลพอดแคสต์เป็นภาษาต่าง ๆ โดยใช้เสียงของเจ้าของ Podcast ได้ 

ฟีเจอร์ใหม่นี้ใช้เทคโนโลยีถอดเสียงของ OpenAI’s voice โดยในตอนนี้มี Podcast ของ Dax Shepard, Lex Fridman, Monica Padman, Steven Bartlett และ Bill Simmons ที่ใช้ฟีเจอร์นี้ 

สำหรับการแปลภาษาถูกใช้แปลไปแล้ว 3 ภาษา ได้แก่ ภาษาสเปน ฝรั่งเศส และเยอรมัน อีกทั้งให้บริการกับผู้ใช้งานแบบฟรี และสมาชิกแบบชำระเงิน ในอีกไม่กี่วันหรืออีกกี่สัปดาห์ข้างหน้า 

อ้างอิง: openai, techcrunch, cnbc

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

BOI ไฟเขียวลงทุนส่งท้ายปี! อนุมัติ Data Center 11 โครงการ มูลค่ากว่า 1.8 แสนล้านบาท ดันไทยสู่ Digital Hub เต็มตัว

BOI ภายใต้การนำของคุณเอกนิติ นิติทัณฑ์ประภาศ รองนายกรัฐมนตรี และรัฐมนตรีว่าการกระทรวงการคลัง ได้ประกาศอนุมัติการลงทุนครั้งสำคัญส่งท้ายปี โดยมียอดเงินลงทุนรวมกว่า 7,500 ล้านดอลลาร์...

Responsive image

OpenAI ดึงอดีต CEO Slack ‘Denise Dresser’ นั่งแท่น Chief Revenue Officer เร่งปั่นรายได้กลางสมรภูมิ AI

OpenAI แต่งตั้ง Denise Dresser อดีต CEO ของ Slack เป็น Chief Revenue Officer คนแรก เร่งสร้างรายได้ เดินเกมรุกตลาดองค์กร พร้อมส่งสัญญาณเปลี่ยนผ่านสู่แพลตฟอร์ม AI เชิงพาณิชย์เต็มรูป...

Responsive image

OpenAI เปิดตัว GPT-5.2 โมเดลเพื่อคนทำงาน เก่งขึ้นทั้ง Excel รูปภาพ โค้ด และงานซับซ้อน

OpenAI เปิดตัวโมเดลปัญญาประดิษฐ์ GPT-5.2 อย่างเป็นทางการ หลังมีรายงานว่า Sam Altman ซีอีโอของบริษัทได้ประกาศสถานะ “Code Red” ภายในองค์กรเมื่อต้นเดือนธันวาคม เพื่อสั่งหยุดเกือบทุกโค...