Gemini 3.5 Flash โมเดลที่ Google เคลมว่าเร็วกว่าคู่แข่ง 4 เท่า และเก่งกว่า Gemini 3.1 Pro แทบทุก Benchmark

Google ประกาศเปิดตัว Gemini 3.5 Flash ในงาน I/O 2026 พร้อมเคลมว่าโมเดล Flash รุ่นใหม่นี้ทำคะแนน Benchmark สูสีกับโมเดลระดับท็อปของค่ายอื่น ๆ แต่ทำงานเร็วกว่าหลายเท่า ในขณะที่ราคายังต่ำกว่าโมเดลระดับเดียวกันถึงครึ่งหนึ่ง

Sundar Pichai เล่าว่า 3.5 Flash คือโมเดลแรกในชุดใหม่ที่ Google เน้นความฉลาดแบบลงมือทำได้จริง โดยออกแบบมาให้เก่งเรื่องการเขียนโค้ด, การทำงานยาว ๆ ที่มีความซับซ้อน และเน้นใช้งานจริงในโลกธุรกิจ

โมเดลเล็กที่เก่งกว่ารุ่น Pro ของตัวเอง

ไฮไลต์แรกที่น่าจับตามองที่สุดในการเปิดตัวครั้งนี้ คือ Gemini 3.5 Flash ทำคะแนนได้ดีกว่ารุ่นที่น่าจะเหนือกว่าอย่าง Gemini 3.1 Pro ในแทบทุกมาตรวัดที่สำคัญ ซึ่งถือว่าน่าสนใจมากเพราะปกติแล้วรุ่น Flash จะเน้นความเร็วแต่ไม่ได้ฉลาดเท่ารุ่น Pro

ด้านการเขียนโค้ด 3.5 Flash สอบผ่านที่ 76.2% ชนะ 3.1 Pro ที่ทำได้ 70.3%

ด้านการใช้เครื่องมือ (Agentic) เช่น การทำหน้าที่เป็นผู้ช่วยด้านการเงิน (Finance Agent v2) 3.5 Flash ทำคะแนนกระโดดไปถึง 57.9% ชนะ 3.1 Pro ถึง 14.9 คะแนน

เร็วปรี๊ดแถมคุ้มค่า

สถาบันทดสอบ Artificial Analysis ระบุว่า 3.5 Flash สามารถประมวลผลได้เร็วกว่า 280 คำ (Token) ต่อวินาที ซึ่งถือว่าหาตัวจับยาก ทั้งเก่งและเร็วในตัวเดียว

คิดราคาที่ 1.50 ดอลลาร์ (รับข้อมูลเข้า) และ 9 ดอลลาร์ (ส่งข้อมูลออก) ต่อ 1 ล้าน Token หากใครใช้ข้อมูลเดิมซ้ำๆ ระบบก็มีส่วนลดให้ถึง 90% แถมยังรองรับข้อมูลยาวจุใจถึง 1 ล้าน Token อีกด้วย

Google คำนวณให้ดูเลยว่า ถ้าบริษัทใหญ่ๆ ย้ายงาน 80% จากที่เคยใช้โมเดลรุ่นท็อปของเจ้าอื่นมาใช้ 3.5 Flash แทน จะสามารถประหยัดเงินได้ถึง 1 พันล้านดอลลาร์ต่อปี (ประเมินจากการใช้งาน 1 ล้านล้าน Token ต่อวัน)

แต่ราคาก็แพงขึ้นจาก Flash รุ่นก่อน

แม้จะถูกกว่าคู่แข่ง แต่ถ้าเทียบกับ Gemini 3 Flash รุ่นเดิม ต้นทุนการทำงานจะสูงกว่า 5.5 เท่า และแพงกว่า 3.1 Pro ถึง 75% 

สาเหตุหลักมาจาก Google ปรับราคาขึ้น 3 เท่า (จากเดิม 0.50/3 ดอลลาร์ เป็น 1.50/9 ดอลลาร์) รวมถึงเวลาเจองานซับซ้อน ตัวโมเดลจะใช้ Token เปลืองขึ้นด้วย

หมายความว่าถ้าคุณใช้งาน Flash แบบเดิมที่ไม่ใช่ Agentic ราคาจะแพงขึ้น 3 เท่า แต่ถ้าใช้กับงานที่ Flash ใหม่เก่งกว่าจริงๆ เช่น Agent หรือ Long-Horizon Task การจ่ายแพงขึ้นก็อาจคุ้มค่า

Google ใช้เองหนักมาก

ก่อนจะปล่อยให้คนทั่วไปใช้ Google เอามาใช้เองภายในก่อนตั้งแต่เดือนมีนาคม 2026 โดยเริ่มใช้ที่ 5 แสนล้าน Token ต่อวัน และเพิ่มขึ้นเรื่อยๆ จนตอนนี้พุ่งไปถึง 3 ล้านล้าน Token ต่อวันแล้ว ซึ่ง Sundar Pichai บอกว่า การใช้งานมหาศาลในระดับนี้ ที่ช่วยพัฒนาให้ Gemimi 3.5 Flash เก่งขึ้น

ตัวอย่างการใช้งานจริงที่ Google ยกมา ได้แก่ Macquarie Bank ที่กำลังทดลองใช้ 3.5 Flash ในการ Onboarding ลูกค้าจากเอกสารการเงินกว่า 100 หน้า ส่วนบริษัท Ramp เอาไปช่วยอ่านใบแจ้งหนี้ที่จัดรูปแบบมามั่วๆ ให้เป็นระเบียบ

เริ่มใช้ได้เมื่อไหร่ ?

3.5 Flash เปิดให้ใช้งานได้ทันทีตั้งแต่วันที่ 19 พฤษภาคม 2026 ผ่านแอป Gemini, Google AI Studio, ระบบ API และฟีเจอร์ AI Mode ใน Google Search 

ส่วนโมเดลรุ่นใหญ่อย่าง Gemini 3.5 Pro จะตามมาให้ใช้กันในเดือนหน้า

อ้างอิง : LLM State, Google Blog

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

OpenAI เปิดตัว LifeSciBench ชุดทดสอบ AI 750 โจทย์วิจัยชีววิทยาระดับผู้เชี่ยวชาญ ที่แม้แต่โมเดลเก่งสุดยังสอบผ่านแค่ 36%

OpenAI เปิดตัว LifeSciBench ชุดทดสอบ AI 750 โจทย์วิจัยชีววิทยาระดับผู้เชี่ยวชาญ เขียนโดยนักวิทยาศาสตร์ 173 คน ผลทดสอบพบ GPT-Rosalind นำทุกโมเดลแต่สอบผ่านเพียง 36.1% สะท้อนว่า AI ยั...

Responsive image

รู้จัก ‘Loop Engineering’ เลิกพิมพ์สั่ง AI ทีละคำ เปลี่ยนมาออกแบบลูปให้ AI ทำงานเองจนจบ

Loop Engineering คือเทรนด์ใหม่ที่เปลี่ยนวิธีใช้ AI จากการพิมพ์สั่งทีละคำ มาเป็นการออกแบบลูปให้ AI ทำงานเองจนจบ พร้อมห้าหลักการออกแบบลูป และบทเรียนบิลค่า AI ที่พุ่งทะลุเพดานเมื่อลูป...

Responsive image

Microsoft Copilot Cowork เปิดให้ใช้งานเต็มระบบทั่วโลกแล้ว เอเจนต์ AI ที่รับงานยาว ๆ ทำเองจนจบ

Microsoft เปิด Copilot Cowork ให้ใช้ทั่วโลก เอเจนต์ AI ที่รับงานซับซ้อนยาว ๆ ทำเองจนจบ Fortune 500 กว่าครึ่งใช้แล้ว รันบนโมเดล Anthropic คิดเงินตามการใช้จริงในหน่วยเครดิต Copilot พ...