Gemini 2.0 คืออะไร ใช้ทำอะไรบ้าง ? สรุปของใหม่กับ AI ที่เก่งที่สุดของ Google

หลังจาก Google เปิดตัว Gemini 1.0 ซึ่งเป็น AI แบบ Multimodal และพัฒนามาอย่างต่อเนื่องจนมีผู้ใช้มากถึง 2 พันล้านคนทั่วโลก ล่าสุดได้มีการอัปเกรดเวอร์ชันใหม่ในชื่อ Gemini 2.0 ซึ่งเป็น AI ที่ถูกสร้างมาเพื่อยุค Agentic พร้อมความสามารถใหม่อีกเพียบ

Gemini 2.0 คืออะไร ?

Gemini 2.0 เป็นโมเดล AI รุ่นล่าสุดที่ถูกสร้างขึ้นเพื่อจัดการกับงานที่หลากหลาย และเป็นโมเดลที่มีความสามารถมากที่สุดของ Google ณ ขณะนี้ โดยได้รับการอัปเกรดในหลายด้าน เช่น

  • การให้เหตุผลแบบหลายรูปแบบ (Multimodal Reasoning)
  • การเข้าใจบริบทแบบยาว (Long Context Understanding) 
  • การทำตามคำสั่งที่ซับซ้อน และการวางแผน (Complex Instruction following and planning)
  • การนำเสนอประสบการณ์การใช้งานแบบ Agentic AI

Sundar Pichai ซีอีโอของ Google อธิบายให้เห็นภาพง่ายๆ ว่า หาก Gemini 1.0 เก่งในเรื่องของการจัดระเบียบข้อมูล และการทำความเข้าใจข้อมูล Gemini 2.0 จะทำให้ข้อมูลพวกนั้นมีประโยชน์มากยิ่งขึ้น

Gemini 2.0 มีอะไรใหม่ ?

  • มีความเร็วในการประมวลผลเมื่อเทียบกับ Gemini 1.5 Pro ถึง 2 เท่า ในขณะที่ยังรักษาเวลาในการตอบสนองได้รวดเร็วใกล้เคียงกัน ซึ่งตอบสนองได้ใกล้เคียงกับการสนทนาของมนุษย์
  • รองรับ Multimodal Output สามารถสร้างผลลัพธ์ได้หลายรูปแบบ เช่น รูปภาพผสมกับข้อความเสียง
  • สามารถเรียกใช้เครื่องมือต่างๆ ได้โดยตรง เช่น Google Search, การรันโค้ด และฟังก์ชันต่างๆ ที่ผู้ใช้กำหนดเอง
  • Multimodal Live API ช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชันที่ใช้เครื่องมือพิเศษหลายๆ อย่างพร้อมกันได้ เช่น การสร้างแอปฯ วิดีโอคอล ที่สามารถใส่ฟังก์ชันการแปลภาษา อ่านสีหน้า และค้นข้อมูลไปพร้อมๆ กันได้
  • เข้าใจข้อมูลจากหลากหลายรูปแบบ เช่น ข้อความ ภาพ เสียง วิดีโอ ได้ดีมากยิ่งขึ้น
  • รองรับการประมวลผล และจดจำข้อมูลจำนวนมากในระหว่างกาสนทนา


Gemini 2.0 เอาไปใช้ทำอะไร ?

ในตอนนี้ Gemini 2.0 จะเปิดให้ใช้งานโมเดล Gemini 2.0 Flash ที่เน้นการประมวลผลรวดเร็วก่อนเป็นตัวแรก ซึ่งในตอนนี้ได้เริ่มเปิดให้ใช้งานเป็นที่เรียบร้อยแล้ว แต่สิ่งที่น่าสนใจคือ Google เริ่มนำ Gemini 2.0 ไปประยุกต์ใช้กับโครงการวิจัยใหม่ๆ เป็นที่เรียบร้อยแล้ว 


ยกตัวอย่างเช่น Project Astra ผู้ช่วย AI ที่สามารถคุยได้หลายภาษา เข้าใจสำเนียง จดจำบทสนทนาในอดีต พร้อมกับความสามารถในการใช้ Google Search, Lens และ Maps ได้ด้วยตนเอง หรือจะเป็นการนำ AI ในการทดสอบความสามารถ การตีความกฎเกณฑ์ของการเล่นเกม เพื่อให้ในอนาคตเราจะมี NPC และผู้ช่วยเล่นเกมที่ฉลาดราวกับมนุษย์


อ้างอิง : blog.google

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

จาก Vibe Coding สู่ Vibe Selling เมื่อ AI ขยับบทบาทมาเป็นคู่หูนักขาย ช่วยดันรายได้เพิ่มขึ้น 77%

ถ้าเคยได้ยินคำว่า “Vibe Coding” ที่แค่สั่ง AI เขียนโปรแกรมด้วย ภาษาพูดง่ายๆ ก็ได้โค้ดออกมาดั่งใจ ตอนนี้เทรนด์นี้กำลังข้ามฝั่งมาที่โลกของการขาย ในชื่อที่เรียกว่า “Vibe Selling”...

Responsive image

Google สั่งระงับ AI Overviews ในคำค้นหาด้านสุขภาพบางรายการ หลังพบความเสี่ยงให้ข้อมูลคลาดเคลื่อน

Google สั่งระงับฟีเจอร์ AI Overviews ในคำค้นหาทางการแพทย์บางส่วน หลังพบข้อมูลเรื่องค่าตับคลาดเคลื่อน เสี่ยงทำผู้ใช้เข้าใจผิด ผู้เชี่ยวชาญแนะต้องแก้ที่ระบบไม่ใช่รายกรณี...

Responsive image

Gen Z 'ยอมมีหนี้ เพื่อเปย์ตัวเอง' มอง เรียบจบ-ทำงาน-มีบ้าน อาจไม่ใช่แนวคิดที่เวิร์กอีกต่อไป

จะเกิดอะไรขึ้น ถ้าคนทุกรุ่นโตมากับคำว่า “เรียนดี ทำงานหนัก เดี๋ยวก็มีบ้าน มีความมั่นคง” แต่พอโตขึ้นกลับพบว่า ทุกอย่างแพง งานหายาก และหนี้เพิ่มเร็วกว่าเงินเดือน นี่คือสิ่งที่กำลังเก...