Google ใช้เวที I/O 2026 เปิดตัวฟีเจอร์ใหม่ใน Workspace ที่เปลี่ยนเสียงของผู้ใช้ให้กลายเป็นเอกสารหรือบันทึกได้อัตโนมัติ จุดที่ทำให้ฟีเจอร์ชุดนี้น่าสนใจ ไม่ใช่แค่การถอดเสียงเป็นข้อความ แต่คือการที่ Gemini เข้าใจเจตนาของผู้พูด แล้วช่วยจัดระเบียบความคิด และดึงข้อมูลจากแอปอื่นใน Ecosystem ของ Google มาเติมเต็มให้
Google เปิดตัวฟีเจอร์ Voice AI ใหม่สามตัวพร้อมกัน ได้แก่ Docs Live, Gmail Live และ Voice AI ใน Google Keep และเปิดตัวเครื่องมือสร้างภาพใหม่ที่ชื่อ Google Pics

Docs Live คือฟีเจอร์ใหม่ใน Google Docs ซึ่งช่วยให้ผู้ใช้สร้าง First Draft ได้เร็วขึ้นด้วยเสียง
จุดที่แตกต่างจากฟีเจอร์พูดด้วยเสียงแบบเดิม คือ Docs Live ออกแบบมารับการพูดแบบ Stream-of-Consciousness คือพูดในสิ่งที่เรานึกออกได้เลย ไม่ต้องเรียงเรียงประโยคให้สมบูรณ์ จากนั้น Gemini จะทำหน้าที่จัดระเบียบความคิด โครงสร้างเอกสาร และดึงข้อมูลที่เกี่ยวข้องจาก Workspace อื่น ๆ มาเสริม
ตัวอย่างที่ Google ยกมา เช่น ผู้ใช้สามารถสั่งให้ Gemini จัดรูปแบบเอกสารตาม Template ที่อยู่ใน Gmail หรือสร้างแผนการเดินทางที่ดึงข้อมูลจาก Gmail และ Drive โดยอัตโนมัติ
Docs Live จะเปิดให้สมาชิก Google AI Pro และ AI Ultra ใช้บน Android และ iOS ในช่วงฤดูร้อนนี้ เปิดให้ใช้ทั่วโลกพร้อมกันแต่เบื้องต้นจะรองรับภาษาอังกฤษก่อน

Gmail Live คือ Voice Agent ที่ผู้ใช้พูดคุยกับ Inbox ของตัวเองได้โดยตรง คล้ายกับการคุยกับ Gemini Live แต่ AI จะดึงข้อมูลจากอีเมลในกล่องมาตอบ
ในการเดโมที่ Google โชว์ ผู้ใช้ถามคำถามอย่าง “เที่ยวบินของฉันขึ้นเครื่องที่เกตหมายเลขอะไร?” หรือ “สัปดาห์นี้มีกิจกรรมอะไรเกิดขึ้นที่โรงเรียนของลูกฉันบ้าง?” Gemini จะค้นในกล่องอีเมลแล้วตอบโดยอัตโนมัติ
ที่น่าสนใจคือ Gmail Live เข้าใจความละเอียดอ่อนของคำที่มีความหมายใกล้เคียงกัน เช่น สามารถแยกการทัศนศึกษาออกจากทริปท่องเที่ยวทั่วไปได้ และสามารถดึงรายละเอียดเล็ก ๆ เช่น หมายเลขห้องในโรงแรม หรือคาดการถึงบุคคลที่ผู้พูดอ้างถึงได้แม้ไม่ได้ระบุชื่อ
ฟีเจอร์นี้จะเริ่มเปิดให้ Google AI Ultra ในสหรัฐอเมริกาใช้ในช่วงฤดูร้อนนี้ และจะเปิดให้ใช้สำหรับผู้ใช้ Google AI Pro ในลำดับถัดไป

Google Keep ก็ได้ใช้ฟีเจอร์ Voice AI เช่นกัน ที่น่าสนใจคือ Keep สามารถแยกความคิดของผู้พูดเป็นโน้ตหลายอันได้ในการพูดครั้งเดียว
ตัวอย่างที่ Google ยกขึ้นมาคือ ถ้าผู้ใช้พูดเรื่องการซื้อของขวัญ การเขียนรายการซื้อของชำ และการทาสีห้องไปพร้อมกัน Keep จะแยกเป็นสามโน้ตคนละก้อนโดยอัตโนมัติ ไม่ใช่บันทึกเป็นโน้ตเดียวกันยาว ๆ
โน้ตจะถูกสร้างแบบ Real-time ผู้ใช้สามารถแก้ไขด้วยเสียงระหว่างพูดได้ ก่อนกด Save to Keep จุดสำคัญที่ Google เน้นคือ ฟีเจอร์นี้ไม่ใช่แค่การถอดเสียง แต่ Gemini เข้าใจเจตนาของผู้พูดว่ากำลังพูดเรื่องอะไรอยู่จริงๆ

อีกหนึ่งเครื่องมือใหม่ที่ Google เปิดตัวคือ Google Pics ซึ่งสร้างบนพื้นฐานของ Nano Banana โมเดลสร้างภาพรุ่นล่าสุดของ Google
จุดที่แตกต่างของ Google Pics คือสามารถเลือกและแก้ไขเฉพาะส่วนของภาพได้ เช่น เปลี่ยนสีเสื้อสเวตเตอร์ หรือเปลี่ยนสุนัขเป็นแมว โดยไม่กระทบส่วนอื่นของภาพ ผู้ใช้คลิกที่จุดนั้นแล้วใส่คอมเมนต์อธิบายสิ่งที่ต้องการแก้ ไม่ต้องเขียน Prompt ใหม่ทั้งหมด
Google ระบุว่าจะนำความสามารถของ Pics ไปฝังในแอป Workspace อื่นๆ ในอนาคต เพื่อให้การแก้ภาพในเอกสารทำได้สะดวกขึ้น
Google Pics จะเปิดให้ Trusted Tester ใช้ก่อน และจะปล่อยให้ผู้ใช้ Google AI Pro กับ Ultra ในฤดูร้อนนี้
ฟีเจอร์ทั้งหมดที่ Google เปิดตัวในงานครั้งนี้ ชี้ไปทิศทางเดียวกัน คือเปลี่ยน Workspace จากเครื่องมือที่ผู้ใช้พิมพ์งาน ไปเป็นพื้นที่ที่ผู้ใช้พูดความคิดออกมาแล้ว AI ทำงานต่อให้
Google เน้นย้ำตัวเลขผู้ใช้ Workspace กว่า 4 พันล้านคน ซึ่งเป็นฐานที่ใหญ่ที่สุดในโลก หมายความว่าถ้าฟีเจอร์เหล่านี้ทำงานได้ดีจริง การเปลี่ยนพฤติกรรมการทำงานในภาพใหญ่ก็จะเกิดเร็วขึ้น
อ้างอิง : Google Blog
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด