ถาม ChatGPT ด้วยรูปภาพและเสียงพูด OpenAI เร่งสุดตัวในสนามแข่ง AI

กันยายน 26, 2023 | By Techsauce Team

OpenAI ประกาศเพิ่มฟีเจอร์ “ถาม AI ได้ด้วยรูปภาพและเสียงพูด” อย่างเป็นทางการ เมื่อวันที่ 25 กันยายนที่ผ่านมา โดยมีจุดประสงค์ที่จะเป็นแพลตฟอร์มที่มากกว่า Search Engine ฟีเจอร์ใหม่นี้จะเริ่มเปิดตัวให้กับสมาชิกแบบ ChatGPT Plus และ Enterprise ในอีก 2 สัปดาห์ข้างหน้า

ตอนนี้เราสามารถถาม AI ด้วยรูปและเสียง บน ChatGPT ได้แล้ว

ฟีเจอร์ Voice จะยังคงจำกัดอยู่แค่บนแอปพลิเคชั่นทั้ง iOS และ Android สำหรับการใช้งานสามารถเข้าไปที่ Settings และเลือก New Features

การประกาศของ OpenAI เกิดขึ้นในช่วงเวลาเดียวกันกับที่ Amazon ประกาศลงทุนกับ Anthropic มากกว่า 4 พันล้านดอลลาร์ ถือเป็นการประกาศแข่งขันด้าน AI ครั้งใหญ่ของบริษัทเทคโนโลยีระดับโลก

ฟีเจอร์ AI ที่ฉลาดกว่าเดิม

OpenAI นำโมเดลภาษาขนาดใหญ่ของตนมาพัฒนารูปแบบ Generative AI ให้ฉลาดมากขึ้น ซึ่งความฉลาดของ AI ที่พัฒนาในเวอร์ชั่นล่าสุดมีตั้งแต่ ใช้ ChatGPT แต่งนิทานก่อนนอน ด้วยคำพูดของเราได้ทันที โดยมีเสียงเตือนเล็กน้อยเพื่อเป็นแนวทางในการเล่าเรื่อง หรือผู้ใช้งานสามารถถามคำถามได้โดย ChatGPT จะให้คำตอบในรูปแบบคำพูด

ในเรื่องการถอดเสียงและจดจำเสียง OpenAI ได้ใช้นักพากย์เสียงที่มีเสียงที่แตกต่างกัน 5 รูปแบบ มาช่วยพัฒนาระบบ Whispher ซึ่งเป็นระบบถอดเสียงเป็นข้อความของ OpenAI

นอกจากนี้ ChatGPT ยังสามารถถาม AI โดยใช้รูปภาพได้อีกด้วย เช่น เมื่อเราอัปโหลดรูปภาพสิ่งของ บางอย่าง และขอให้ ChatGPT อธิบายว่ามันคืออะไร หรือให้คำแนะนำกับเรา

Spotify ใช้ OpenAI’s voice

ล่าสุด Spotify ได้ประกาศฟีเจอร์ใหม่ที่ใช้ AI แปลพอดแคสต์เป็นภาษาต่าง ๆ โดยใช้เสียงของเจ้าของ Podcast ได้

ฟีเจอร์ใหม่นี้ใช้เทคโนโลยีถอดเสียงของ OpenAI’s voice โดยในตอนนี้มี Podcast ของ Dax Shepard, Lex Fridman, Monica Padman, Steven Bartlett และ Bill Simmons ที่ใช้ฟีเจอร์นี้

สำหรับการแปลภาษาถูกใช้แปลไปแล้ว 3 ภาษา ได้แก่ ภาษาสเปน ฝรั่งเศส และเยอรมัน อีกทั้งให้บริการกับผู้ใช้งานแบบฟรี และสมาชิกแบบชำระเงิน ในอีกไม่กี่วันหรืออีกกี่สัปดาห์ข้างหน้า

อ้างอิง: openai, techcrunch, cnbc

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

เข้าสู่ระบบ
ลงทะเบียน

ลืมรหัสผ่าน?

มีบัญชีแล้วหรือยัง ?

มีบัญชีอยู่แล้ว ?

News

openai

chatgpt

No comment

เปิดแผน 5 ยุทธศาสตร์การลงทุนใหม่ของไทย ดึง AI ชิป การเงินสีเขียว และการแพทย์ ขับเคลื่อนประเทศ

คณะอนุกรรมการด้านการพัฒนาการลงทุนใหม่ของประเทศ ภายใต้คณะกรรมการร่วมภาครัฐและเอกชนเพื่อแก้ไขปัญหาทางเศรษฐกิจ หรือ กรอ. เห็นชอบกรอบ 5 ยุทธศาสตร์เพื่อปรับโครงสร้างเศรษฐกิจไทยผ่านการลง...

กรกฎาคม 31, 2026 | By Techsauce Team

News

เอกนิติ-นิติทัณฑ์ประภาศ

คณะกรรมการร่วมภาครัฐและเอกชนเพื่อแก้ไขปัญหาทางเศรษฐกิจ

Gemini Robotics ER 2 มาแล้ว สมองกล AI จาก DeepMind ดูวิดีโอเป็น แก้งานผิดเองได้ สั่งหุ่นยนต์หลายตัวทำงานร่วมกันได้

Google DeepMind เปิดตัว Gemini Robotics ER 2 โมเดล AI ที่เป็นสมองระดับสูงให้หุ่นยนต์ ดูวิดีโอต่อเนื่อง แก้งานผิดเองได้ และสั่งหุ่นยนต์หลายตัวทำงานร่วมกัน เปิดให้นักพัฒนาใช้แล้วผ่าน...

กรกฎาคม 31, 2026 | By Techsauce Team

บีโอไอเร่งปั้นไทยเป็นฐานผลิตโฟโตนิกส์โลก รับเม็ดเงินลงทุนกว่า 8 หมื่นล้าน

บีโอไอเดินหน้าส่งเสริมการลงทุนในอุตสาหกรรมโฟโตนิกส์ (Photonics) เทคโนโลยีที่เป็นหัวใจของโครงสร้างพื้นฐานดิจิทัลยุค AI ล่าสุดในช่วง 5 ปีที่ผ่านมา มีโครงการขอรับการส่งเสริมแล้วถึง 79...

กรกฎาคม 30, 2026 | By Techsauce Team