ถาม ChatGPT ด้วยรูปภาพและเสียงพูด OpenAI เร่งสุดตัวในสนามแข่ง AI

OpenAI ประกาศเพิ่มฟีเจอร์ “ถาม AI ได้ด้วยรูปภาพและเสียงพูด” อย่างเป็นทางการ เมื่อวันที่ 25 กันยายนที่ผ่านมา โดยมีจุดประสงค์ที่จะเป็นแพลตฟอร์มที่มากกว่า Search Engine ฟีเจอร์ใหม่นี้จะเริ่มเปิดตัวให้กับสมาชิกแบบ ChatGPT Plus และ Enterprise ในอีก 2 สัปดาห์ข้างหน้า 

ตอนนี้เราสามารถถาม AI ด้วยรูปและเสียง บน ChatGPT ได้แล้ว

ฟีเจอร์ Voice จะยังคงจำกัดอยู่แค่บนแอปพลิเคชั่นทั้ง iOS และ Android สำหรับการใช้งานสามารถเข้าไปที่ Settings และเลือก New Features

การประกาศของ OpenAI เกิดขึ้นในช่วงเวลาเดียวกันกับที่ Amazon ประกาศลงทุนกับ Anthropic มากกว่า 4 พันล้านดอลลาร์ ถือเป็นการประกาศแข่งขันด้าน AI ครั้งใหญ่ของบริษัทเทคโนโลยีระดับโลก

ฟีเจอร์ AI ที่ฉลาดกว่าเดิม

OpenAI นำโมเดลภาษาขนาดใหญ่ของตนมาพัฒนารูปแบบ Generative AI ให้ฉลาดมากขึ้น ซึ่งความฉลาดของ AI ที่พัฒนาในเวอร์ชั่นล่าสุดมีตั้งแต่ ใช้ ChatGPT แต่งนิทานก่อนนอน ด้วยคำพูดของเราได้ทันที โดยมีเสียงเตือนเล็กน้อยเพื่อเป็นแนวทางในการเล่าเรื่อง หรือผู้ใช้งานสามารถถามคำถามได้โดย ChatGPT จะให้คำตอบในรูปแบบคำพูด

ในเรื่องการถอดเสียงและจดจำเสียง OpenAI ได้ใช้นักพากย์เสียงที่มีเสียงที่แตกต่างกัน 5 รูปแบบ มาช่วยพัฒนาระบบ Whispher ซึ่งเป็นระบบถอดเสียงเป็นข้อความของ OpenAI 

นอกจากนี้ ChatGPT ยังสามารถถาม AI โดยใช้รูปภาพได้อีกด้วย เช่น เมื่อเราอัปโหลดรูปภาพสิ่งของ บางอย่าง และขอให้ ChatGPT อธิบายว่ามันคืออะไร หรือให้คำแนะนำกับเรา

Spotify ใช้ OpenAI’s voice 

ล่าสุด Spotify ได้ประกาศฟีเจอร์ใหม่ที่ใช้ AI แปลพอดแคสต์เป็นภาษาต่าง ๆ โดยใช้เสียงของเจ้าของ Podcast ได้ 

ฟีเจอร์ใหม่นี้ใช้เทคโนโลยีถอดเสียงของ OpenAI’s voice โดยในตอนนี้มี Podcast ของ Dax Shepard, Lex Fridman, Monica Padman, Steven Bartlett และ Bill Simmons ที่ใช้ฟีเจอร์นี้ 

สำหรับการแปลภาษาถูกใช้แปลไปแล้ว 3 ภาษา ได้แก่ ภาษาสเปน ฝรั่งเศส และเยอรมัน อีกทั้งให้บริการกับผู้ใช้งานแบบฟรี และสมาชิกแบบชำระเงิน ในอีกไม่กี่วันหรืออีกกี่สัปดาห์ข้างหน้า 

อ้างอิง: openai, techcrunch, cnbc

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ChatGPT เปิดตัว ‘Dynamic Visual Explanations’ จำลองภาพจากสูตรคณิต-วิทย์กว่า 70 หัวข้อ ปรับตัวแปรปุ๊บ เห็นผลลัพธ์ทันที

อัปเดตล่าสุด! ChatGPT เปิดตัวฟีเจอร์ Dynamic Visual Explanations สร้างภาพจำลองคณิตศาสตร์และวิทยาศาสตร์แบบโต้ตอบได้ ช่วยให้ผู้ใช้สามารถปรับตัวแปรและเข้าใจสมการยากๆ ได้แบบเรียลไทม์...

Responsive image

Rejuran กางแผนรุกไทย ปักหมุด ‘Strategic Hub’ แห่งเอเชีย รุกตลาดความงาม 7.6 หมื่นล้านบาท รับเทรนด์ Skin Investment

ตลาดเวชศาสตร์ความงามของไทยกำลังเติบโตอย่างก้าวกระโดดด้วยมูลค่ารวมกว่า 76,500 ล้านบาท และมีอัตราการเติบโตเฉลี่ย 10-12% ต่อปี เพื่อตอบรับตัวเลขดังกล่าว ล่าสุดในปี 2026 บริษัท PharmaR...

Responsive image

Meta เปิดตัว Business AI บน Messenger ในไทย ช่วย SME แก้ปัญหาตอบแชทลูกค้าไม่ทัน สแตนด์บายปิดการขาย 24 ชั่วโมง

ปฏิเสธไม่ได้ว่าพฤติกรรม ‘การทักแชทซื้อของ’ เป็นของคู่กันกับผู้บริโภคชาวไทย ข้อมูลจาก Kantar ชี้ว่าคนไทยกว่า 80% ใช้การส่งข้อความผ่านแชทเป็นช่องทางหลักในการติดต่อร้านค้า และเพื่อตอบ...