
ภาพหนึ่งภาพใน 4 วินาที ด้วยต้นทุนแค่ 0.034 ดอลลาร์สหรัฐ กับวิดีโอที่สั่งแก้ได้เหมือนพิมพ์คุยกับคนตัดต่อ คือของใหม่สองชิ้นที่ Google ปล่อยออกมาให้นักพัฒนาทั่วโลกพร้อมกันในคราวเดียว และเป็นการส่งสัญญาณชัดว่าสนามแข่งของสื่อที่สร้างด้วย AI (Generative Media) กำลังขยับจากเรื่อง 'สร้างได้สวยแค่ไหน' ไปสู่เรื่อง 'สร้างได้เร็วและถูกแค่ไหน แล้วแก้ต่อได้ลื่นแค่ไหน'
Google ประกาศเปิดตัวโมเดลใหม่ 2 ตัวสำหรับนักพัฒนา ได้แก่ Nano Banana 2 Lite โมเดลสร้างภาพที่เร็วที่สุดและคุ้มค่าที่สุดในตระกูล Gemini Image และ Gemini Omni Flash โมเดลสร้างและตัดต่อวิดีโอคุณภาพสูงที่รองรับการแก้ไขผ่านบทสนทนา (Conversational Editing) โดยจุดขายสำคัญคือการใช้สองโมเดลนี้ต่อกันเป็นสายพานการผลิตคอนเทนต์ครบวงจร ตั้งแต่ปั้นภาพความเร็วสูงไปจนถึงเสกภาพนิ่งให้กลายเป็นวิดีโอ
Nano Banana 2 Lite หรือชื่อทางเทคนิคว่า Gemini 3.1 Flash Lite Image ถูกออกแบบมาเพื่องานที่ต้องระดมไอเดียเร็ว ๆ และสายพานการทำงานของนักพัฒนาที่เน้นปริมาณสูง ซึ่งความเร็วกับต้นทุนคือโจทย์ใหญ่ที่สุด โมเดลนี้สร้างภาพจากข้อความได้ภายใน 4 วินาที ในราคา 0.034 ดอลลาร์สหรัฐต่อภาพความละเอียดระดับ 1K เหมาะกับการทำต้นแบบเชิงโต้ตอบ การร่างภาพเร็ว ๆ ไปจนถึงงานที่ต้องคุมงบประมาณการประมวลผลอย่างเข้มงวด
ที่น่าสนใจคือแม้จะเป็นรุ่นที่เน้นความเร็วเป็นหลัก แต่ Google ยืนยันว่าโมเดลยังทำตามคำสั่ง (Prompt) ได้แม่นยำ รักษาความสม่ำเสมอของตัวละครในภาพได้ดี และเรนเดอร์ตัวหนังสือในภาพออกมาอ่านออกชัดเจน ซึ่งเป็นจุดที่โมเดลภาพขนาดเล็กมักพลาดกันบ่อย
สำหรับใครที่ยังใช้ Nano Banana รุ่นแรก (Gemini 2.5 Flash Image) อยู่ Google แนะนำให้ย้ายมาใช้ Nano Banana 2 Lite แทนได้ทันที เพราะได้ทั้งคุณภาพที่ดีขึ้น ความเร็วที่สูงขึ้น และค่าใช้จ่ายที่ต่ำลงในคราวเดียว

ตอนนี้ตระกูล Nano Banana มีให้เลือก 4 รุ่นตามลักษณะงาน เริ่มจาก Nano Banana 2 Lite ที่สร้างมาเพื่อความเร็วล้วน ๆ เหมาะกับงานปริมาณมหาศาลที่ต้องการความหน่วง (Latency) ต่ำจนเกือบเรียลไทม์ ถัดมาคือ Nano Banana 2 (Gemini 3.1 Flash Image) ม้างานอเนกประสงค์ที่ให้สมดุลระหว่างคุณภาพ ความเร็ว และราคาดีที่สุด ส่วน Nano Banana Pro (Gemini 3 Pro Image) คือรุ่นท็อปสำหรับงานระดับมืออาชีพที่ซับซ้อน เน้นการควบคุมละเอียดและการใช้เหตุผลขั้นสูงในงานที่ความแม่นยำสำคัญกว่าความเร็ว ปิดท้ายด้วย Nano Banana รุ่นแรกที่กลายเป็นรุ่นเก่าซึ่ง Google แนะนำให้อัปเกรดหนีได้แล้ว
นอกจากฝั่งนักพัฒนา Nano Banana 2 Lite กำลังทยอยเข้าไปอยู่ในผลิตภัณฑ์ฝั่งผู้ใช้ทั่วไปของ Google ด้วย ทั้งโหมด AI Mode ในบริการค้นหา แอป Gemini รวมถึง NotebookLM, Google Photos, Stitch, Google Flow และ Google Ads
อีกตัวที่เปิดตัวพร้อมกันคือ Gemini Omni Flash โมเดลที่ Google เผยโฉมครั้งแรกบนเวที Google I/O 2026 โดยคุณ Koray Kavukcuoglu ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยี (CTO) ของ Google DeepMind วางตำแหน่งไว้เป็นจุดบรรจบระหว่างความสามารถด้านการใช้เหตุผลแบบหลายรูปแบบ (Multimodal Reasoning) ของ Gemini กับการสร้างและตัดต่อวิดีโอ ตอนนี้โมเดลเปิดให้นักพัฒนาใช้งานแล้วในสถานะทดลองใช้แบบสาธารณะ (Public Preview) ผ่าน Gemini API และ Google AI Studio ในราคา 0.10 ดอลลาร์สหรัฐต่อวิดีโอ 1 วินาที เท่ากับ Veo 3.1 Fast พอดี

ความสามารถเด่นของ Omni Flash คือการแก้ไขวิดีโอผ่านบทสนทนา แค่พิมพ์บอกเป็นภาษาธรรมชาติว่าอยากปรับตรงไหน โมเดลจะแก้เฉพาะจุดนั้นโดยคงส่วนอื่นของวิดีโอไว้ นอกจากนี้ยังรับข้อมูลอ้างอิงได้หลายรูปแบบพร้อมกัน ทั้งภาพ ข้อความ และวิดีโอ เพื่อคุมความสม่ำเสมอของฉาก และด้วยความที่สร้างบนฐานความรู้ของ Gemini โมเดลจึงดึงความเข้าใจเรื่องประวัติศาสตร์ ชีววิทยา ตรรกะการเล่าเรื่อง ไปจนถึงหลักฟิสิกส์อย่างแรงโน้มถ่วง มาประกอบวิดีโอให้สมจริงยิ่งขึ้น รวมถึงสั่งให้ตัวหนังสือและกราฟิกในวิดีโอขยับสอดคล้องกับการเคลื่อนไหวของฉากได้ผ่านการพิมพ์คำสั่งง่าย ๆ
ข้อมูลจากเอกสารนักพัฒนาของ Google ระบุว่าโมเดลสร้างวิดีโอความละเอียด 720p ความยาว 3 ถึง 10 วินาที รองรับทั้งแนวนอน 16:9 และแนวตั้ง 9:16 ส่วนฝั่งผู้ใช้ทั่วไป Gemini Omni เปิดให้สมาชิก Google AI Plus, Pro และ Ultra ใช้งานผ่านแอป Gemini, Google Flow และ YouTube Shorts โดยไม่มีค่าใช้จ่ายเพิ่ม
Google บอกเองว่าเวทมนตร์ของจริงจะเกิดขึ้นเมื่อใช้สองโมเดลนี้ต่อกันเป็นทอด ๆ โดยให้ Nano Banana 2 Lite ทำหน้าที่ปั้นภาพความเร็วสูง แล้วส่งภาพนั้นเป็นข้อมูลอ้างอิงต่อให้ Gemini Omni Flash แปลงเป็นวิดีโอคุณภาพสูง และเมื่อใช้ร่วมกับส่วนต่อประสานโปรแกรม (API) สำหรับการโต้ตอบต่อเนื่องที่ชื่อ Interactions API ระบบจะจดจำประวัติการแก้ไขในเซสชันนั้นไว้ ทำให้ผู้ใช้สั่งแก้ต่อเนื่องซ้อนกันได้สูงสุด 3 ครั้ง
เพื่อให้เห็นภาพว่าการต่อท่อนี้ทำอะไรได้บ้าง Google ปล่อยแอปตัวอย่างมาให้ลองรื้อโค้ดเล่น 3 ตัว ตัวแรกคือ Anywhere ที่ให้ถ่ายเซลฟี่หรืออัปโหลดรูป แล้ว Nano Banana 2 Lite จะพาเราไปโผล่ตามแลนด์มาร์กดังทั่วโลกในพริบตา พอคลิกที่ภาพ Omni Flash จะเสกภาพนั้นให้กลายเป็นคลิปเคลื่อนไหวของสถานที่นั้นทันที ตัวที่สองคือ Space Lift แอปออกแบบภายในที่แค่อัปโหลดรูปห้อง ระบบจะเนรมิตคอนเซปต์การตกแต่งหลากสไตล์ให้เลือก แล้วกดปุ่มวิดีโอเพื่อดู Omni พาชมห้องใหม่แบบภาพยนตร์ก่อนลงมือทำจริง และตัวสุดท้ายคือ Omni Product Studio ที่แปลงภาพนิ่งสินค้าจาก Nano Banana 2 Lite ให้กลายเป็นวิดีโอโฆษณาอีคอมเมิร์ซสไตล์ภาพยนตร์
Gemini Omni Flash ยังอยู่ในช่วงทดลองใช้ จึงมีข้อจำกัดที่ Google แจ้งไว้ตรง ๆ หลายข้อ ตอนนี้สร้างวิดีโอได้ยาว 10 วินาที โดยความยาวที่มากกว่านี้จะตามมาเร็ว ๆ นี้ การอัปโหลดไฟล์เสียงอ้างอิงและการต่อขยายฉากยังใช้ไม่ได้ใน Gemini API ส่วนการแนบวิดีโออ้างอิงความยาวไม่เกิน 3 วินาทีนั้นระบบรับไฟล์ได้แต่โมเดลยังประมวลผลไม่ถูกต้อง และความสม่ำเสมอของตัวละครเวลาเปลี่ยนฉากหรือแพนกล้องก็ยังมีสะดุดบ้าง ซึ่ง Google บอกว่ากำลังเร่งปรับปรุงอยู่ นอกจากนี้ฟีเจอร์แก้ไขวิดีโอที่ผู้ใช้อัปโหลดเองยังไม่เปิดให้ใช้ในเขตเศรษฐกิจยุโรป สวิตเซอร์แลนด์ และสหราชอาณาจักร
ด้านความโปร่งใส ผลงานทุกชิ้นจากทั้ง Gemini Omni และ Nano Banana 2 Lite จะถูกฝังลายน้ำดิจิทัล (SynthID) ที่มองไม่เห็นด้วยตาเปล่า และตรวจสอบได้ว่าคอนเทนต์ชิ้นไหนสร้างด้วย AI ผ่านแอป Gemini, Gemini ใน Chrome หรือบริการค้นหาของ Google
ตอนนี้ Nano Banana 2 Lite เปิดให้ใช้งานแล้วผ่าน Gemini API, Google AI Studio และ Gemini Enterprise Agent Platform ส่วน Gemini Omni Flash เปิดทดลองใช้แบบสาธารณะแล้วเช่นกันใน Google AI Studio และ Gemini API
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด