OpenAI เพิ่มฟีเจอร์ใหม่ใน ChatGPT วิเคราะห์-โต้ตอบวิดีโอได้แบบเรียลไทม์

OpenAI อัปเดทความสามารถ ChatGPT บนโหมดสนทนาด้วยเสียงหรือ Advanced Voice Mode สามารถวิเคราะห์และโต้ตอบจากวิดีโอได้แบบเรียลไทม์ นับเป็นการเปิดตัวฟีเจอร์ต่อเนื่องเป็นวันที่ 6 ในแคมเปญ 12 Days of OpenAI 


เปิดฟีเจอร์ใหม่ของ Advanced Voice Mode

  • ฟีเจอร์วิเคราะห์วัตถุผ่านกล้อง ผู้ใช้สามารถเปิดกล้องในแอป ChatGPT เพื่อให้ AI วิเคราะห์วัตถุที่ปรากฏในภาพแบบเรียลไทม์ เช่น อธิบายรายละเอียด หรือให้คำแนะนำที่เกี่ยวข้อง
  • ฟีเจอร์วิเคราะห์หน้าจอของอุปกรณ์ด้วยฟีเจอร์แชร์หน้าจอ (Screen Sharing) ChatGPT สามารถช่วยอธิบายเมนูการตั้งค่าบนอุปกรณ์ หรือแม้กระทั่งให้คำแนะนำเกี่ยวกับการแก้โจทย์คณิตศาสตร์
  • ใช้งานแสนง่าย
    • แตะไอคอนไมโครโฟนถัดจากช่องแชทเพื่อเปิดโหมดสนทนาด้วยเสียง
    • แตะไอคอนวิดีโอที่มุมซ้ายล่างเพื่อเริ่มใช้งานกล้อง
    • หากต้องการแชร์หน้าจอ ให้แตะเมนูสามจุดและเลือก “Share Screen”

Santa Mode: เพิ่มความสนุกในช่วงเทศกาล

นอกเหนือจากการเปิดการรองรับวิดีโอบน Advanced Voice Mode แล้ว OpenAI ยังเพิ่มความสนุกด้วย Santa Mode ที่เปลี่ยนเสียงตอบสนองของ ChatGPT ให้เป็นเสียงของซานตาคลอส ฟีเจอร์นี้สามารถเปิดใช้งานได้ง่าย ๆ โดยแตะไอคอนรูปเกล็ดหิมะบนแอป

ฟีเจอร์นี้ถือเป็นการเปิดตัวอย่างเป็นทางการหลังการทดลองครั้งแรกเมื่อ 7 เดือนก่อน โดยจะเริ่มทยอยเปิดใช้งานตั้งแต่วันนี้สำหรับสมาชิก ChatGPT Plus, Team และ Pro ขณะที่สมาชิกในกลุ่ม ChatGPT Enterprise และ Edu จะสามารถใช้งานได้ในเดือนมกราคม 2025 อย่างไรก็ตาม ผู้ใช้งานในประเทศกลุ่มสหภาพยุโรป (EU) และอีกบางประเทศยังไม่ได้รับการยืนยันเวลาการเปิดตัวอย่างเปิดทางการ

OpenAI แสดงให้เห็นถึงความมุ่งมั่นในการพัฒนา ChatGPT ให้เป็นผู้ช่วยดิจิทัลที่ทรงพลังและมีประโยชน์ยิ่งขึ้น โดยตั้งแต่การเปิดตัวแชทบอทที่ใช้ข้อความเมื่อสองปีที่แล้ว OpenAI ได้พัฒนาเทคโนโลยีที่รองรับทั้งเสียง รูปภาพ และวิดีโอ เพื่อมอบประสบการณ์ที่หลากหลายและสมจริงยิ่งขึ้น ทั้งนี้ OpenAI ยังคงเดินหน้าพัฒนาเทคโนโลยีอย่างต่อเนื่องเพื่อมอบประสบการณ์การใช้งานที่ครบครันและตอบโจทย์ความต้องการที่หลากหลายของผู้ใช้ทั่วโลก


อ่านต่อ: bloomberg, techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

อดีตพนักงานแฉ Oracle สุ่มเลิกจ้างด้วยอัลกอริทึม มุ่งเป้ากลุ่มหัวกะทิที่ถือหุ้นเยอะ

ดราม่า Oracle ปลดพนักงาน 30,000 ตำแหน่ง! อดีตพนักงานแฉบริษัทใช้ ‘อัลกอริทึม’ คัดเฉพาะตัวท็อปเงินเดือนสูงและถือหุ้นเยอะออกก่อน...

Responsive image

Google เปิดตัว ‘Gemma 4’ AI Open Model ที่ทรงพลังที่สุด รองรับ 140 ภาษา รันได้บนมือถือ Android ยันเซิร์ฟเวอร์ระดับองค์กร

Gemma 4 สุดยอดโมเดล AI แบบเปิด (Open Model) จาก Google ที่เก่งที่สุด พร้อมฟีเจอร์ให้เหตุผลขั้นสูง รองรับกว่า 140 ภาษา รันได้ตั้งแต่มือถือไปจนถึงพีซีส่วนตัว เปิดโอกาสให้นักพัฒนาต่อย...

Responsive image

Microsoft เปิดตัว ‘MAI’ 3 AI โมเดลใหม่ Transcribe-1, Voice-1, Image-2 แปลงเสียง-สร้างวิดีโอสุดล้ำ ราคาถูกกว่าคู่แข่ง

ไมโครซอฟท์เปิดตัว 3 โมเดลปัญญาประดิษฐ์พื้นฐานใหม่ MAI-Transcribe-1, Voice-1 และ Image-2 ชูจุดเด่นฟีเจอร์ล้ำหน้าในราคาที่ถูกกว่าคู่แข่งอย่างกูเกิลและโอเพ่นเอไอ พร้อมวิสัยทัศน์เพื่อม...