ถาม ChatGPT ด้วยรูปภาพและเสียงพูด OpenAI เร่งสุดตัวในสนามแข่ง AI

OpenAI ประกาศเพิ่มฟีเจอร์ “ถาม AI ได้ด้วยรูปภาพและเสียงพูด” อย่างเป็นทางการ เมื่อวันที่ 25 กันยายนที่ผ่านมา โดยมีจุดประสงค์ที่จะเป็นแพลตฟอร์มที่มากกว่า Search Engine ฟีเจอร์ใหม่นี้จะเริ่มเปิดตัวให้กับสมาชิกแบบ ChatGPT Plus และ Enterprise ในอีก 2 สัปดาห์ข้างหน้า 

ตอนนี้เราสามารถถาม AI ด้วยรูปและเสียง บน ChatGPT ได้แล้ว

ฟีเจอร์ Voice จะยังคงจำกัดอยู่แค่บนแอปพลิเคชั่นทั้ง iOS และ Android สำหรับการใช้งานสามารถเข้าไปที่ Settings และเลือก New Features

การประกาศของ OpenAI เกิดขึ้นในช่วงเวลาเดียวกันกับที่ Amazon ประกาศลงทุนกับ Anthropic มากกว่า 4 พันล้านดอลลาร์ ถือเป็นการประกาศแข่งขันด้าน AI ครั้งใหญ่ของบริษัทเทคโนโลยีระดับโลก

ฟีเจอร์ AI ที่ฉลาดกว่าเดิม

OpenAI นำโมเดลภาษาขนาดใหญ่ของตนมาพัฒนารูปแบบ Generative AI ให้ฉลาดมากขึ้น ซึ่งความฉลาดของ AI ที่พัฒนาในเวอร์ชั่นล่าสุดมีตั้งแต่ ใช้ ChatGPT แต่งนิทานก่อนนอน ด้วยคำพูดของเราได้ทันที โดยมีเสียงเตือนเล็กน้อยเพื่อเป็นแนวทางในการเล่าเรื่อง หรือผู้ใช้งานสามารถถามคำถามได้โดย ChatGPT จะให้คำตอบในรูปแบบคำพูด

ในเรื่องการถอดเสียงและจดจำเสียง OpenAI ได้ใช้นักพากย์เสียงที่มีเสียงที่แตกต่างกัน 5 รูปแบบ มาช่วยพัฒนาระบบ Whispher ซึ่งเป็นระบบถอดเสียงเป็นข้อความของ OpenAI 

นอกจากนี้ ChatGPT ยังสามารถถาม AI โดยใช้รูปภาพได้อีกด้วย เช่น เมื่อเราอัปโหลดรูปภาพสิ่งของ บางอย่าง และขอให้ ChatGPT อธิบายว่ามันคืออะไร หรือให้คำแนะนำกับเรา

Spotify ใช้ OpenAI’s voice 

ล่าสุด Spotify ได้ประกาศฟีเจอร์ใหม่ที่ใช้ AI แปลพอดแคสต์เป็นภาษาต่าง ๆ โดยใช้เสียงของเจ้าของ Podcast ได้ 

ฟีเจอร์ใหม่นี้ใช้เทคโนโลยีถอดเสียงของ OpenAI’s voice โดยในตอนนี้มี Podcast ของ Dax Shepard, Lex Fridman, Monica Padman, Steven Bartlett และ Bill Simmons ที่ใช้ฟีเจอร์นี้ 

สำหรับการแปลภาษาถูกใช้แปลไปแล้ว 3 ภาษา ได้แก่ ภาษาสเปน ฝรั่งเศส และเยอรมัน อีกทั้งให้บริการกับผู้ใช้งานแบบฟรี และสมาชิกแบบชำระเงิน ในอีกไม่กี่วันหรืออีกกี่สัปดาห์ข้างหน้า 

อ้างอิง: openai, techcrunch, cnbc

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

จาก Vibe Coding สู่ Vibe Selling เมื่อ AI ขยับบทบาทมาเป็นคู่หูนักขาย ช่วยดันรายได้เพิ่มขึ้น 77%

ถ้าเคยได้ยินคำว่า “Vibe Coding” ที่แค่สั่ง AI เขียนโปรแกรมด้วย ภาษาพูดง่ายๆ ก็ได้โค้ดออกมาดั่งใจ ตอนนี้เทรนด์นี้กำลังข้ามฝั่งมาที่โลกของการขาย ในชื่อที่เรียกว่า “Vibe Selling”...

Responsive image

Google สั่งระงับ AI Overviews ในคำค้นหาด้านสุขภาพบางรายการ หลังพบความเสี่ยงให้ข้อมูลคลาดเคลื่อน

Google สั่งระงับฟีเจอร์ AI Overviews ในคำค้นหาทางการแพทย์บางส่วน หลังพบข้อมูลเรื่องค่าตับคลาดเคลื่อน เสี่ยงทำผู้ใช้เข้าใจผิด ผู้เชี่ยวชาญแนะต้องแก้ที่ระบบไม่ใช่รายกรณี...

Responsive image

Gen Z 'ยอมมีหนี้ เพื่อเปย์ตัวเอง' มอง เรียบจบ-ทำงาน-มีบ้าน อาจไม่ใช่แนวคิดที่เวิร์กอีกต่อไป

จะเกิดอะไรขึ้น ถ้าคนทุกรุ่นโตมากับคำว่า “เรียนดี ทำงานหนัก เดี๋ยวก็มีบ้าน มีความมั่นคง” แต่พอโตขึ้นกลับพบว่า ทุกอย่างแพง งานหายาก และหนี้เพิ่มเร็วกว่าเงินเดือน นี่คือสิ่งที่กำลังเก...