Gemini 3.5 Flash โมเดลที่ Google เคลมว่าเร็วกว่าคู่แข่ง 4 เท่า และเก่งกว่า Gemini 3.1 Pro แทบทุก Benchmark

พฤษภาคม 20, 2026 | By Techsauce Team

Google ประกาศเปิดตัว Gemini 3.5 Flash ในงาน I/O 2026 พร้อมเคลมว่าโมเดล Flash รุ่นใหม่นี้ทำคะแนน Benchmark สูสีกับโมเดลระดับท็อปของค่ายอื่น ๆ แต่ทำงานเร็วกว่าหลายเท่า ในขณะที่ราคายังต่ำกว่าโมเดลระดับเดียวกันถึงครึ่งหนึ่ง

Sundar Pichai เล่าว่า 3.5 Flash คือโมเดลแรกในชุดใหม่ที่ Google เน้นความฉลาดแบบลงมือทำได้จริง โดยออกแบบมาให้เก่งเรื่องการเขียนโค้ด, การทำงานยาว ๆ ที่มีความซับซ้อน และเน้นใช้งานจริงในโลกธุรกิจ

โมเดลเล็กที่เก่งกว่ารุ่น Pro ของตัวเอง

ไฮไลต์แรกที่น่าจับตามองที่สุดในการเปิดตัวครั้งนี้ คือ Gemini 3.5 Flash ทำคะแนนได้ดีกว่ารุ่นที่น่าจะเหนือกว่าอย่าง Gemini 3.1 Pro ในแทบทุกมาตรวัดที่สำคัญ ซึ่งถือว่าน่าสนใจมากเพราะปกติแล้วรุ่น Flash จะเน้นความเร็วแต่ไม่ได้ฉลาดเท่ารุ่น Pro

ด้านการเขียนโค้ด 3.5 Flash สอบผ่านที่ 76.2% ชนะ 3.1 Pro ที่ทำได้ 70.3%

ด้านการใช้เครื่องมือ (Agentic) เช่น การทำหน้าที่เป็นผู้ช่วยด้านการเงิน (Finance Agent v2) 3.5 Flash ทำคะแนนกระโดดไปถึง 57.9% ชนะ 3.1 Pro ถึง 14.9 คะแนน

เร็วปรี๊ดแถมคุ้มค่า

สถาบันทดสอบ Artificial Analysis ระบุว่า 3.5 Flash สามารถประมวลผลได้เร็วกว่า 280 คำ (Token) ต่อวินาที ซึ่งถือว่าหาตัวจับยาก ทั้งเก่งและเร็วในตัวเดียว

คิดราคาที่ 1.50 ดอลลาร์ (รับข้อมูลเข้า) และ 9 ดอลลาร์ (ส่งข้อมูลออก) ต่อ 1 ล้าน Token หากใครใช้ข้อมูลเดิมซ้ำๆ ระบบก็มีส่วนลดให้ถึง 90% แถมยังรองรับข้อมูลยาวจุใจถึง 1 ล้าน Token อีกด้วย

Google คำนวณให้ดูเลยว่า ถ้าบริษัทใหญ่ๆ ย้ายงาน 80% จากที่เคยใช้โมเดลรุ่นท็อปของเจ้าอื่นมาใช้ 3.5 Flash แทน จะสามารถประหยัดเงินได้ถึง 1 พันล้านดอลลาร์ต่อปี (ประเมินจากการใช้งาน 1 ล้านล้าน Token ต่อวัน)

แต่ราคาก็แพงขึ้นจาก Flash รุ่นก่อน

แม้จะถูกกว่าคู่แข่ง แต่ถ้าเทียบกับ Gemini 3 Flash รุ่นเดิม ต้นทุนการทำงานจะสูงกว่า 5.5 เท่า และแพงกว่า 3.1 Pro ถึง 75%

สาเหตุหลักมาจาก Google ปรับราคาขึ้น 3 เท่า (จากเดิม 0.50/3 ดอลลาร์ เป็น 1.50/9 ดอลลาร์) รวมถึงเวลาเจองานซับซ้อน ตัวโมเดลจะใช้ Token เปลืองขึ้นด้วย

หมายความว่าถ้าคุณใช้งาน Flash แบบเดิมที่ไม่ใช่ Agentic ราคาจะแพงขึ้น 3 เท่า แต่ถ้าใช้กับงานที่ Flash ใหม่เก่งกว่าจริงๆ เช่น Agent หรือ Long-Horizon Task การจ่ายแพงขึ้นก็อาจคุ้มค่า

Google ใช้เองหนักมาก

ก่อนจะปล่อยให้คนทั่วไปใช้ Google เอามาใช้เองภายในก่อนตั้งแต่เดือนมีนาคม 2026 โดยเริ่มใช้ที่ 5 แสนล้าน Token ต่อวัน และเพิ่มขึ้นเรื่อยๆ จนตอนนี้พุ่งไปถึง 3 ล้านล้าน Token ต่อวันแล้ว ซึ่ง Sundar Pichai บอกว่า การใช้งานมหาศาลในระดับนี้ ที่ช่วยพัฒนาให้ Gemimi 3.5 Flash เก่งขึ้น

ตัวอย่างการใช้งานจริงที่ Google ยกมา ได้แก่ Macquarie Bank ที่กำลังทดลองใช้ 3.5 Flash ในการ Onboarding ลูกค้าจากเอกสารการเงินกว่า 100 หน้า ส่วนบริษัท Ramp เอาไปช่วยอ่านใบแจ้งหนี้ที่จัดรูปแบบมามั่วๆ ให้เป็นระเบียบ