Google เปิดตัว Gemini 3.1 Flash-Lite โมเดล AI ใหม่ เร็วขึ้น 2.5 เท่า เก่งทั้งแปลภาษา เขียนโค้ด UI และแก้ปัญหาสเกลใหญ่ ในราคาที่ถูกลง

Google ได้สร้างแรงสั่นสะเทือนให้วงการปัญญาประดิษฐ์อีกครั้งด้วยการเปิดตัว ‘Gemini 3.1 Flash-Lite’ โมเดล AI ตัวใหม่ล่าสุดในตระกูลซีรีส์ 3 ที่ถูกออกแบบมาเพื่อทลายขีดจำกัดเดิมๆ โดยมุ่งเป้าไปที่กลุ่มนักพัฒนาที่ต้องการประมวลผลงานปริมาณมหาศาลแบบสเกลระดับใหญ่ แต่ยังคงต้องการคุณภาพผลลัพธ์ที่ยอดเยี่ยมในงบประมาณที่ควบคุมได้ ซึ่งในวันนี้ตัวโมเดลได้เปิดให้ทดลองใช้งานแล้วผ่าน Gemini API บน Google AI Studio สำหรับนักพัฒนาทั่วไป และผ่าน Vertex AI สำหรับลูกค้าองค์กร

หั่นต้นทุน ยกระดับความเร็วทะลุขีดจำกัด

จุดเด่นที่ทำให้นักพัฒนาต้องหันมามองโมเดลตัวนี้คือราคาที่เข้าถึงได้ง่ายอย่างเหลือเชื่อ โดยสนนราคาเพียง $0.25 ต่อ 1 ล้าน Input Tokens และ $1.50 ต่อ 1 ล้าน Output Tokens เท่านั้น แต่แม้ราคาจะถูกลง ประสิทธิภาพกลับพุ่งทะยานอย่างน่าสนใจ ข้อมูลจากแพลตฟอร์มทดสอบอย่าง Artificial Analysis ระบุชัดเจนว่า 3.1 Flash-Lite สามารถสร้างโทเค็นแรก หรือ Time to First Answer Token ได้เร็วกว่ารุ่นพี่อย่าง 2.5 Flash ถึง 2.5 เท่า และดันความเร็วในการประมวลผลผลลัพธ์ได้เพิ่มขึ้นถึง 45% ซึ่งความหน่วง (Latency) ที่ต่ำแตะพื้นระดับนี้ คือกุญแจสำคัญที่ทำให้นักพัฒนาสามารถนำไปสร้างแอปพลิเคชันที่โต้ตอบแบบเรียลไทม์ได้อย่างไร้รอยต่อ

ฉลาดล้ำ เอาชนะโมเดลรุ่นพี่อย่างขาดลอย

เรื่องของคุณภาพและตรรกะก็ไม่เป็นสองรองใคร Gemini 3.1 Flash-Lite กวาดคะแนน Elo ไปได้ถึง 1432 บนกระดานจัดอันดับของ Arena.ai และยังทำผลงานได้เหนือกว่าโมเดลในระดับเดียวกันอย่างชัดเจนในการทดสอบสุดหิน ไม่ว่าจะเป็นการกวาดคะแนน 86.9% บนแบบทดสอบ GPQA Diamond และ 76.8% บน MMMU Pro ซึ่งแสดงให้เห็นถึงความสามารถในการประมวลผลข้อมูลหลายรูปแบบ (Multimodal) ที่แม่นยำระดับเหนือชั้น จนสามารถเอาชนะโมเดลรุ่นก่อนหน้าที่ตัวใหญ่กว่าอย่าง 2.5 Flash ไปได้อย่างราบคาบ

ความน่าสนใจที่ซ่อนอยู่ใน 3.1 Flash-Lite คือฟีเจอร์ที่เรียกว่า ‘Thinking levels’ หรือระดับการคิดวิเคราะห์ ที่เปิดโอกาสให้นักพัฒนาสามารถกำหนดความลึกซึ้งในการคิดของ AI ได้ตามความเหมาะสมของงาน หากเป็นงานที่เน้นปริมาณและความเร็ว เช่น การแปลภาษาหรือการคัดกรองเนื้อหา (Content Moderation) ก็สามารถปรับให้ตอบสนองไวเพื่อประหยัดต้นทุน แต่ถ้าเป็นงานที่ซับซ้อนอย่างการเขียนโค้ดสร้าง User Interface การออกแบบแดชบอร์ด หรือการจำลองสถานการณ์ ก็สามารถสั่งให้ AI ใช้เวลา ‘คิด’ ให้ลึกซึ้งขึ้นได้เช่นกัน

สตาร์ทอัพแห่ใช้งาน พิสูจน์แล้วว่าทำได้จริง

ความเก่งกาจนี้ไม่ได้หยุดอยู่แค่ในห้องทดลอง เพราะกลุ่มผู้ใช้งานช่วงแรก (Early-access) รวมถึงบริษัทสายเทคฯ อย่าง Latitude, Cartwheel และ Whering ได้นำ 3.1 Flash-Lite ไปขับเคลื่อนระบบจริงเรียบร้อยแล้ว เสียงตอบรับจากผู้ใช้งานจริงต่างชื่นชมในความสามารถการใช้เหตุผลที่เฉียบคม การจัดการกับข้อมูลซับซ้อนได้อย่างแม่นยำเทียบเท่าโมเดลขนาดใหญ่ รวมถึงการปฏิบัติตามคำสั่งที่เคร่งครัด นี่คืออีกหนึ่งก้าวสำคัญที่น่าจับตามองว่า Gemini 3.1 Flash-Lite จะเข้ามาเป็นตัวแปรสำคัญที่ช่วยต่อยอดนวัตกรรมใหม่ๆ ในวงการดิจิทัลได้อย่างไรในอนาคตอันใกล้นี้

ที่มา: Google Blog

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

สรุปของใหม่จากงาน HP Imagine 2026 เมื่อ HP ไม่ได้แค่ขายคอมพิวเตอร์ แต่กำลังสร้าง 'โครงสร้างพื้นฐาน AI' ให้คนทำงาน

Techsauce มีโอกาสได้เป็นหนึ่งในสื่อจากทั่วโลกที่เข้าร่วมงาน HP Imagine 2026 ที่ New York สหรัฐฯ จึงไม่พลาดสรุปทุกสิ่งที่เปิดตัว พร้อมวิเคราะห์ว่าทำไม HP ถึงวางกลยุทธ์แบบนี้ในจังหวะ...

Responsive image

Grab กางแผนปี 2569 ชู “Winning with Purpose Together” รุกทั้งตลาดแมส-พรีเมียม พร้อมเร่งนวัตกรรม-ขยายตลาดใหม่ ท่ามกลางเศรษฐกิจผันผวน

เจาะทิศทางธุรกิจ Grab ในปี 2569 ตั้งแต่การขยายฐานผู้ใช้ การออกฟีเจอร์ใหม่ ไปจนถึงการสร้างสมดุลระหว่างความคุ้มค่าและบริการพรีเมียม พร้อมบทบาทในการขับเคลื่อนเศรษฐกิจดิจิทัลและโอกาสให...

Responsive image

Amity ปิดดีล Series D 100 ล้านดอลลาร์ฯ ขึ้นแท่นระดมทุน GenAI สูงสุดในอาเซียน ปักธงเตรียมเข้า IPO ปี 2570

Amity บริษัทเทคคอมพานีสัญชาติไทย ประกาศความสำเร็จในการระดมทุนรอบ Series D มูลค่า 100 ล้านดอลลาร์สหรัฐ ถือเป็นดีลด้าน Generative AI ที่มีมูลค่าสูงที่สุดในเอเชียตะวันออกเฉียงใต้ในปัจ...