Gemini 2.0 คืออะไร ใช้ทำอะไรบ้าง ? สรุปของใหม่กับ AI ที่เก่งที่สุดของ Google

หลังจาก Google เปิดตัว Gemini 1.0 ซึ่งเป็น AI แบบ Multimodal และพัฒนามาอย่างต่อเนื่องจนมีผู้ใช้มากถึง 2 พันล้านคนทั่วโลก ล่าสุดได้มีการอัปเกรดเวอร์ชันใหม่ในชื่อ Gemini 2.0 ซึ่งเป็น AI ที่ถูกสร้างมาเพื่อยุค Agentic พร้อมความสามารถใหม่อีกเพียบ

Gemini 2.0 คืออะไร ?

Gemini 2.0 เป็นโมเดล AI รุ่นล่าสุดที่ถูกสร้างขึ้นเพื่อจัดการกับงานที่หลากหลาย และเป็นโมเดลที่มีความสามารถมากที่สุดของ Google ณ ขณะนี้ โดยได้รับการอัปเกรดในหลายด้าน เช่น

  • การให้เหตุผลแบบหลายรูปแบบ (Multimodal Reasoning)
  • การเข้าใจบริบทแบบยาว (Long Context Understanding) 
  • การทำตามคำสั่งที่ซับซ้อน และการวางแผน (Complex Instruction following and planning)
  • การนำเสนอประสบการณ์การใช้งานแบบ Agentic AI

Sundar Pichai ซีอีโอของ Google อธิบายให้เห็นภาพง่ายๆ ว่า หาก Gemini 1.0 เก่งในเรื่องของการจัดระเบียบข้อมูล และการทำความเข้าใจข้อมูล Gemini 2.0 จะทำให้ข้อมูลพวกนั้นมีประโยชน์มากยิ่งขึ้น

Gemini 2.0 มีอะไรใหม่ ?

  • มีความเร็วในการประมวลผลเมื่อเทียบกับ Gemini 1.5 Pro ถึง 2 เท่า ในขณะที่ยังรักษาเวลาในการตอบสนองได้รวดเร็วใกล้เคียงกัน ซึ่งตอบสนองได้ใกล้เคียงกับการสนทนาของมนุษย์
  • รองรับ Multimodal Output สามารถสร้างผลลัพธ์ได้หลายรูปแบบ เช่น รูปภาพผสมกับข้อความเสียง
  • สามารถเรียกใช้เครื่องมือต่างๆ ได้โดยตรง เช่น Google Search, การรันโค้ด และฟังก์ชันต่างๆ ที่ผู้ใช้กำหนดเอง
  • Multimodal Live API ช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชันที่ใช้เครื่องมือพิเศษหลายๆ อย่างพร้อมกันได้ เช่น การสร้างแอปฯ วิดีโอคอล ที่สามารถใส่ฟังก์ชันการแปลภาษา อ่านสีหน้า และค้นข้อมูลไปพร้อมๆ กันได้
  • เข้าใจข้อมูลจากหลากหลายรูปแบบ เช่น ข้อความ ภาพ เสียง วิดีโอ ได้ดีมากยิ่งขึ้น
  • รองรับการประมวลผล และจดจำข้อมูลจำนวนมากในระหว่างกาสนทนา


Gemini 2.0 เอาไปใช้ทำอะไร ?

ในตอนนี้ Gemini 2.0 จะเปิดให้ใช้งานโมเดล Gemini 2.0 Flash ที่เน้นการประมวลผลรวดเร็วก่อนเป็นตัวแรก ซึ่งในตอนนี้ได้เริ่มเปิดให้ใช้งานเป็นที่เรียบร้อยแล้ว แต่สิ่งที่น่าสนใจคือ Google เริ่มนำ Gemini 2.0 ไปประยุกต์ใช้กับโครงการวิจัยใหม่ๆ เป็นที่เรียบร้อยแล้ว 


ยกตัวอย่างเช่น Project Astra ผู้ช่วย AI ที่สามารถคุยได้หลายภาษา เข้าใจสำเนียง จดจำบทสนทนาในอดีต พร้อมกับความสามารถในการใช้ Google Search, Lens และ Maps ได้ด้วยตนเอง หรือจะเป็นการนำ AI ในการทดสอบความสามารถ การตีความกฎเกณฑ์ของการเล่นเกม เพื่อให้ในอนาคตเราจะมี NPC และผู้ช่วยเล่นเกมที่ฉลาดราวกับมนุษย์


อ้างอิง : blog.google

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ม.มหิดล อันดับ 1 โลก SDG 3 เปิดยุทธศาสตร์ ‘Holistic Wellbeing’ นิยามความเป็นอยู่ที่ดีแบบใหม่ของมหิดล ที่จะนำประเทศไปสู่ Wellness Economy

มหาวิทยาลัยมหิดลคว้าอันดับ 1 ของโลกด้าน SDG 3 ด้วยคะแนน 93.6 จาก THE Sustainability Impact Rankings 2026 พร้อมเปิดยุทธศาสตร์ Holistic Wellbeing พาไทยชิงตลาด Wellness Economy โลกที่...

Responsive image

ถอดวิสัยทัศน์ผู้ว่าฯ แบงก์ชาติ ยุคที่ธุรกิจต้องการ 'Social License to Operate' และ 'เงินทุน' ไม่ได้ไหลเข้าบริษัทที่มุ่งแต่จะทำกำไรสูงสุด

สรุปวิสัยทัศน์ วิทัย รัตนากร ผู้ว่าการธนาคารแห่งประเทศไทย จากงาน Capital with Porpose 2026 : Unlocking ESG Value through Green Finance ที่ชี้ให้เห็นว่า ความยั่งยืน ไม่ใช่ทางเลือกแต...

Responsive image

'จากการขายอินเทอร์เน็ต สู่การขายพลัง AI' Huawei ชี้อนาคตของโทรคมนาคมจะขับเคลื่อนด้วยโมเดลรายได้จาก Token Monetization

Huawei เปิดวิสัยทัศน์ Token Monetization ในงาน MWC Shanghai 2026 ชี้ AI กำลังเปลี่ยนโมเดลธุรกิจโทรคมนาคม จากการขาย Data สู่การสร้างรายได้จากบริการ AI และ 5G-A...