เปิดตัว Docs Live เปลี่ยนคำพูดเป็นดราฟท์ พูดไปเรื่อย ๆ ไม่ต้องเป๊ะ AI ก็เข้าใจ แถมดึงข้อมูลจาก Gmail, Drive มาให้ได้ด้วย

Google ใช้เวที I/O 2026 เปิดตัวฟีเจอร์ใหม่ใน Workspace ที่เปลี่ยนเสียงของผู้ใช้ให้กลายเป็นเอกสารหรือบันทึกได้อัตโนมัติ จุดที่ทำให้ฟีเจอร์ชุดนี้น่าสนใจ ไม่ใช่แค่การถอดเสียงเป็นข้อความ แต่คือการที่ Gemini เข้าใจเจตนาของผู้พูด แล้วช่วยจัดระเบียบความคิด และดึงข้อมูลจากแอปอื่นใน Ecosystem ของ Google มาเติมเต็มให้

Google เปิดตัวฟีเจอร์ Voice AI ใหม่สามตัวพร้อมกัน ได้แก่ Docs Live, Gmail Live และ Voice AI ใน Google Keep และเปิดตัวเครื่องมือสร้างภาพใหม่ที่ชื่อ Google Pics

Docs Live เปลี่ยนความคิดที่กระจัดกระจายให้กลายเป็นเอกสาร

Docs Live คือฟีเจอร์ใหม่ใน Google Docs ซึ่งช่วยให้ผู้ใช้สร้าง First Draft ได้เร็วขึ้นด้วยเสียง

จุดที่แตกต่างจากฟีเจอร์พูดด้วยเสียงแบบเดิม คือ Docs Live ออกแบบมารับการพูดแบบ Stream-of-Consciousness คือพูดในสิ่งที่เรานึกออกได้เลย ไม่ต้องเรียงเรียงประโยคให้สมบูรณ์ จากนั้น Gemini จะทำหน้าที่จัดระเบียบความคิด โครงสร้างเอกสาร และดึงข้อมูลที่เกี่ยวข้องจาก Workspace อื่น ๆ มาเสริม

ตัวอย่างที่ Google ยกมา เช่น ผู้ใช้สามารถสั่งให้ Gemini จัดรูปแบบเอกสารตาม Template ที่อยู่ใน Gmail หรือสร้างแผนการเดินทางที่ดึงข้อมูลจาก Gmail และ Drive โดยอัตโนมัติ

Docs Live จะเปิดให้สมาชิก Google AI Pro และ AI Ultra ใช้บน Android และ iOS ในช่วงฤดูร้อนนี้ เปิดให้ใช้ทั่วโลกพร้อมกันแต่เบื้องต้นจะรองรับภาษาอังกฤษก่อน

Gmail Live คุยกับ Inbox ของตัวเอง

Gmail Live คือ Voice Agent ที่ผู้ใช้พูดคุยกับ Inbox ของตัวเองได้โดยตรง คล้ายกับการคุยกับ Gemini Live แต่ AI จะดึงข้อมูลจากอีเมลในกล่องมาตอบ

ในการเดโมที่ Google โชว์ ผู้ใช้ถามคำถามอย่าง “เที่ยวบินของฉันขึ้นเครื่องที่เกตหมายเลขอะไร?” หรือ “สัปดาห์นี้มีกิจกรรมอะไรเกิดขึ้นที่โรงเรียนของลูกฉันบ้าง?” Gemini จะค้นในกล่องอีเมลแล้วตอบโดยอัตโนมัติ

ที่น่าสนใจคือ Gmail Live เข้าใจความละเอียดอ่อนของคำที่มีความหมายใกล้เคียงกัน เช่น สามารถแยกการทัศนศึกษาออกจากทริปท่องเที่ยวทั่วไปได้ และสามารถดึงรายละเอียดเล็ก ๆ เช่น หมายเลขห้องในโรงแรม หรือคาดการถึงบุคคลที่ผู้พูดอ้างถึงได้แม้ไม่ได้ระบุชื่อ

ฟีเจอร์นี้จะเริ่มเปิดให้ Google AI Ultra ในสหรัฐอเมริกาใช้ในช่วงฤดูร้อนนี้ และจะเปิดให้ใช้สำหรับผู้ใช้ Google AI Pro ในลำดับถัดไป

Voice AI ใน Keep แยกความคิดให้เป็นโน้ตคนละก้อน

Google Keep ก็ได้ใช้ฟีเจอร์ Voice AI เช่นกัน ที่น่าสนใจคือ Keep สามารถแยกความคิดของผู้พูดเป็นโน้ตหลายอันได้ในการพูดครั้งเดียว

ตัวอย่างที่ Google ยกขึ้นมาคือ ถ้าผู้ใช้พูดเรื่องการซื้อของขวัญ การเขียนรายการซื้อของชำ และการทาสีห้องไปพร้อมกัน Keep จะแยกเป็นสามโน้ตคนละก้อนโดยอัตโนมัติ ไม่ใช่บันทึกเป็นโน้ตเดียวกันยาว ๆ

โน้ตจะถูกสร้างแบบ Real-time ผู้ใช้สามารถแก้ไขด้วยเสียงระหว่างพูดได้ ก่อนกด Save to Keep จุดสำคัญที่ Google เน้นคือ ฟีเจอร์นี้ไม่ใช่แค่การถอดเสียง แต่ Gemini เข้าใจเจตนาของผู้พูดว่ากำลังพูดเรื่องอะไรอยู่จริงๆ

Google Pics เครื่องมือสร้างและแก้ภาพแบบใหม่

อีกหนึ่งเครื่องมือใหม่ที่ Google เปิดตัวคือ Google Pics ซึ่งสร้างบนพื้นฐานของ Nano Banana โมเดลสร้างภาพรุ่นล่าสุดของ Google

จุดที่แตกต่างของ Google Pics คือสามารถเลือกและแก้ไขเฉพาะส่วนของภาพได้ เช่น เปลี่ยนสีเสื้อสเวตเตอร์ หรือเปลี่ยนสุนัขเป็นแมว โดยไม่กระทบส่วนอื่นของภาพ ผู้ใช้คลิกที่จุดนั้นแล้วใส่คอมเมนต์อธิบายสิ่งที่ต้องการแก้ ไม่ต้องเขียน Prompt ใหม่ทั้งหมด

Google ระบุว่าจะนำความสามารถของ Pics ไปฝังในแอป Workspace อื่นๆ ในอนาคต เพื่อให้การแก้ภาพในเอกสารทำได้สะดวกขึ้น

Google Pics จะเปิดให้ Trusted Tester ใช้ก่อน และจะปล่อยให้ผู้ใช้ Google AI Pro กับ Ultra ในฤดูร้อนนี้

ฟีเจอร์ทั้งหมดที่ Google เปิดตัวในงานครั้งนี้ ชี้ไปทิศทางเดียวกัน คือเปลี่ยน Workspace จากเครื่องมือที่ผู้ใช้พิมพ์งาน ไปเป็นพื้นที่ที่ผู้ใช้พูดความคิดออกมาแล้ว AI ทำงานต่อให้

Google เน้นย้ำตัวเลขผู้ใช้ Workspace กว่า 4 พันล้านคน ซึ่งเป็นฐานที่ใหญ่ที่สุดในโลก หมายความว่าถ้าฟีเจอร์เหล่านี้ทำงานได้ดีจริง การเปลี่ยนพฤติกรรมการทำงานในภาพใหญ่ก็จะเกิดเร็วขึ้น

อ้างอิง : Google Blog


ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ฟรีแลนซ์ถูกเบี้ยวค่าจ้าง ใช้ 'ทนาย AI' ทวงคืนสำเร็จ Garfield AI ทนาย AI ตัวแรกที่ถูกกำกับตามกฎหมาย ชนะคดีจริงในศาลอังกฤษ

บริษัทกฎหมายที่ขับเคลื่อนด้วย AI ในอังกฤษ สร้างสิ่งที่อาจเป็นปรากฏการณ์ครั้งแรกของโลก ด้วยการชนะคดีในศาลโดยใช้ 'ทนาย AI' เตรียมคดีตั้งแต่ต้นจนจบ...

Responsive image

อนาคต AI และหุ่นยนต์ 2026 เมื่อเทคโนโลยีต้องวัดกันที่ "ความรู้สึก"

เจาะลึกเทรนด์อนาคต AI และหุ่นยนต์จากงาน Summer Davos 2026 เมื่อ Physical AI ไม่ได้วัดกันที่ความฉลาด แต่อยู่ที่การออกแบบให้เข้าถึง "ความรู้สึก" ของมนุษย์...

Responsive image

เปิดตัว Claude Tag เพิ่ม AI เป็นพนักงานได้บน Slack รับคำสั่ง ตามงานแทน เช็กข้อมูลให้ คนในกลุ่มสั่งงานต่อกันได้ แค่พิมพ์ @Claude

รู้จัก Claude Tag จาก Anthropic นวัตกรรม AI ล่าสุดที่ยกระดับเป็น 'เพื่อนร่วมทีมเสมือน' บน Slack ทำงานอัตโนมัติ 24 ชม. พร้อมเจาะลึกสิ่งที่ผู้นำองค์กรต้องรู้...