ถาม ChatGPT ด้วยรูปภาพและเสียงพูด OpenAI เร่งสุดตัวในสนามแข่ง AI

OpenAI ประกาศเพิ่มฟีเจอร์ “ถาม AI ได้ด้วยรูปภาพและเสียงพูด” อย่างเป็นทางการ เมื่อวันที่ 25 กันยายนที่ผ่านมา โดยมีจุดประสงค์ที่จะเป็นแพลตฟอร์มที่มากกว่า Search Engine ฟีเจอร์ใหม่นี้จะเริ่มเปิดตัวให้กับสมาชิกแบบ ChatGPT Plus และ Enterprise ในอีก 2 สัปดาห์ข้างหน้า 

ตอนนี้เราสามารถถาม AI ด้วยรูปและเสียง บน ChatGPT ได้แล้ว

ฟีเจอร์ Voice จะยังคงจำกัดอยู่แค่บนแอปพลิเคชั่นทั้ง iOS และ Android สำหรับการใช้งานสามารถเข้าไปที่ Settings และเลือก New Features

การประกาศของ OpenAI เกิดขึ้นในช่วงเวลาเดียวกันกับที่ Amazon ประกาศลงทุนกับ Anthropic มากกว่า 4 พันล้านดอลลาร์ ถือเป็นการประกาศแข่งขันด้าน AI ครั้งใหญ่ของบริษัทเทคโนโลยีระดับโลก

ฟีเจอร์ AI ที่ฉลาดกว่าเดิม

OpenAI นำโมเดลภาษาขนาดใหญ่ของตนมาพัฒนารูปแบบ Generative AI ให้ฉลาดมากขึ้น ซึ่งความฉลาดของ AI ที่พัฒนาในเวอร์ชั่นล่าสุดมีตั้งแต่ ใช้ ChatGPT แต่งนิทานก่อนนอน ด้วยคำพูดของเราได้ทันที โดยมีเสียงเตือนเล็กน้อยเพื่อเป็นแนวทางในการเล่าเรื่อง หรือผู้ใช้งานสามารถถามคำถามได้โดย ChatGPT จะให้คำตอบในรูปแบบคำพูด

ในเรื่องการถอดเสียงและจดจำเสียง OpenAI ได้ใช้นักพากย์เสียงที่มีเสียงที่แตกต่างกัน 5 รูปแบบ มาช่วยพัฒนาระบบ Whispher ซึ่งเป็นระบบถอดเสียงเป็นข้อความของ OpenAI 

นอกจากนี้ ChatGPT ยังสามารถถาม AI โดยใช้รูปภาพได้อีกด้วย เช่น เมื่อเราอัปโหลดรูปภาพสิ่งของ บางอย่าง และขอให้ ChatGPT อธิบายว่ามันคืออะไร หรือให้คำแนะนำกับเรา

Spotify ใช้ OpenAI’s voice 

ล่าสุด Spotify ได้ประกาศฟีเจอร์ใหม่ที่ใช้ AI แปลพอดแคสต์เป็นภาษาต่าง ๆ โดยใช้เสียงของเจ้าของ Podcast ได้ 

ฟีเจอร์ใหม่นี้ใช้เทคโนโลยีถอดเสียงของ OpenAI’s voice โดยในตอนนี้มี Podcast ของ Dax Shepard, Lex Fridman, Monica Padman, Steven Bartlett และ Bill Simmons ที่ใช้ฟีเจอร์นี้ 

สำหรับการแปลภาษาถูกใช้แปลไปแล้ว 3 ภาษา ได้แก่ ภาษาสเปน ฝรั่งเศส และเยอรมัน อีกทั้งให้บริการกับผู้ใช้งานแบบฟรี และสมาชิกแบบชำระเงิน ในอีกไม่กี่วันหรืออีกกี่สัปดาห์ข้างหน้า 

อ้างอิง: openai, techcrunch, cnbc

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Sonnet 4.6 มาแล้ว โมเดลพื้นฐาน ‘เก่งใกล้เรือธง’

Anthropic เปิดตัว Claude Sonnet 4.6 อัปเกรดใหญ่! ชูจุดเด่น Context Window 1 ล้านทอเค็น และทักษะ Computer Use ที่ฉลาดขึ้น พร้อมทุบสถิติ Benchmark แซงหน้าโมเดลตัวท็อป อ่านสรุปฟีเจอร์...

Responsive image

นักวิทย์ฯ MIT ไขปริศนา 2,000 ปี! พบสูตรลับ ‘คอนกรีตโรมัน’ ที่สามารถซ่อมแซมตัวเองได้ ยืนยันหลักฐานจากเหตุการณ์ปอมเปอี

นักวิทย์ MIT ไขความลับคอนกรีตโรมันที่ซ่อมแซมตัวเองได้ ยืนยันด้วยหลักฐานจากปอมเปอี พร้อมเปิดตัวสตาร์ทอัพ DMAT พลิกโฉมวัสดุก่อสร้างด้วยภูมิปัญญาพันปี...

Responsive image

Alibaba เปิดตัว Qwen3.5 เร่งเกม ‘Agentic AI’ เคลมประสิทธิภาพเหนือคู่แข่งสหรัฐฯ พร้อมต้นทุนลดลง 60%

Alibaba เปิดตัว Qwen 3.5 รับยุค Agentic AI ชูจุดเด่นมองเห็นหน้าจอและทำงานข้ามแอปได้ ลดต้นทุน 60% ประสิทธิภาพเพิ่ม 8 เท่า...