Google ปล่อยหมัดเด็ด เปิดตัว Gemini 2.5 Flash Image โมเดลสร้างภาพตัวท็อป

Gemini 2.5 Flash Image

Google เดินหน้ารุกตลาด AI สร้างภาพเต็มรูปแบบ ด้วยการอัปเกรดโมเดล Gemini ให้แก้ไขภาพได้สมจริงและเนียนกว่าเดิม ก้าวสำคัญครั้งนี้มีเป้าหมายชัดเจน คือการท้าชน OpenAI และดึงผู้ใช้กลับมาจาก ChatGPT โมเดลใหม่นี้ใช้ชื่อว่า Gemini 2.5 Flash Image เปิดให้ใช้งานอย่างเป็นทางการแล้ว ทั้งสำหรับผู้ใช้ทั่วไปและนักพัฒนาผ่านแพลตฟอร์มต่าง ๆ ของ Google

จุดเด่นของ Gemini 2.5 Flash Image คืออะไร ? 

Gemini 2.5 Flash Image มีจุดเด่นอยู่ที่ความแม่นยำในการแก้ไขภาพตามคำสั่งที่ผู้ใช้ป้อนเข้าไป โมเดลนี้สามารถทำการแก้ไขเฉพาะจุดได้อย่างแนบเนียน พร้อมคงรายละเอียดสำคัญๆ ของภาพไว้ได้ครบ เช่น ใบหน้าคน, สัตว์เลี้ยง หรือพื้นหลัง ได้อย่างสมบูรณ์แบบ ซึ่งเป็นสิ่งที่ AI จากค่ายคู่แข่งหลายเจ้ายังทำได้ไม่ดีพอ

ยกตัวอย่างง่ายๆ ถ้าคุณสั่งให้ ChatGPT หรือ Grok ของ xAI เปลี่ยนสีเสื้อในรูป อาจพบว่าใบหน้าของคนในภาพบิดเบี้ยวหรือพื้นหลังเพี้ยนไป แต่สำหรับโมเดลใหม่ของ Google จะสามารถแก้ไขเฉพาะส่วนที่ต้องการได้โดยไม่มีผลกระทบต่อส่วนอื่นๆ ซึ่งความเก่งกาจของ AI ตัวนี้เริ่มเป็นที่พูดถึงในวงการเทคฯ มาสักพักแล้ว หลังจากที่มันปรากฏตัวแบบไม่เปิดเผยชื่อภายใต้โค้ดเนมว่า "nano-banana" บนแพลตฟอร์มทดสอบอย่าง LMArena และได้รับคำชื่นชมอย่างล้นหลาม จนในที่สุด Google ก็ออกมายืนยันว่าเป็นหนึ่งในความสามารถของโมเดล Gemini 2.5 Flash AI นั่นเอง

สงคราม AI สร้างภาพเริ่มร้อนแรง  

การแข่งขันด้าน AI สร้างภาพกำลังดุเดือดสุดๆ เมื่อก่อนหน้านี้ OpenAI เคยทำให้วงการสั่นสะเทือนด้วยการเปิดตัว GPT-4oที่สร้างภาพได้ และทำให้มีมภาพแนว Studio Ghibli แพร่ระบาดไปทั่วอินเทอร์เน็ตจนยอดผู้ใช้ ChatGPT พุ่งกระฉูด 

เพื่อไม่ให้ตกขบวน Meta ก็ประกาศไปเมื่อสัปดาห์ก่อนว่าจะร่วมมือกับ Midjourney ส่วนบริษัทอื่นๆ อย่าง Black Forest Labs ก็กำลังมาแรงด้วยโมเดล AI ที่ชื่อ FLUX

การอัปเดตครั้งนี้อาจช่วยให้ Gemini สามารถดึงดูดผู้ใช้งานได้มากขึ้น เพราะตอนนี้ยอดผู้ใช้รายสัปดาห์ของ ChatGPT มีมากกว่า 700 ล้านคนแล้ว ในขณะที่ Gemini มีผู้ใช้รายเดือนอยู่ที่ 450 ล้านคน ซึ่งตัวเลขผู้ใช้รายสัปดาห์ก็น่าจะยังน้อยกว่าคู่แข่งอยู่พอสมควร

คุณนิโคล บริชโตวา หัวหน้าฝ่ายผลิตภัณฑ์ของ Google Deepmind บอกว่า Google ตั้งใจสร้างโมเดลนี้มาเพื่อการใช้งานทั่วไป อย่างเช่น ช่วยให้คนแต่งภาพบ้านหรือสวนในฝันได้ง่ายขึ้น นอกจากนี้ยังมีความสามารถในการผสมผสานข้อมูลหลายอย่างเข้าด้วยกันในครั้งเดียว เช่น นำรูปโซฟา, ห้องนั่งเล่น และชุดสี มาสร้างเป็นภาพห้องใหม่ที่สมจริง

แม้จะมีความสามารถที่น่าทึ่ง แต่ Google ก็มีมาตรการป้องกันที่เข้มงวด โดยจำกัดไม่ให้ผู้ใช้สร้างภาพที่ไม่เหมาะสมหรือภาพอนาจาร และเพื่อแก้ปัญหาภาพปลอมหรือ Deepfake ทาง Google ก็ได้ใส่ลายน้ำลงในภาพที่ AI สร้างขึ้นมา รวมถึงมีรหัสระบุตัวตนซ่อนไว้ในไฟล์ด้วย เพื่อให้รู้ว่าภาพนี้เป็นภาพที่สร้างโดย AI เรียกได้ว่าเป็นการอัปเกรดที่น่าจับตา ซึ่งเราคงต้องรอดูกันต่อไปว่าการอัปเดตครั้งนี้จะทำให้ Google ทวงคืนตำแหน่งผู้นำในตลาด AI ได้หรือไม่

อ้างอิง: techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Meta เปิดตัว ‘Mango & Avocado’ AI สร้างภาพ–เขียนโค้ด กลับลำทิ้ง Metaverse หวังลุยทวงบัลลังก์ AI

Meta เปิดตัวโมเดล AI ใหม่อย่าง Mango และ Avocado เดิมพันอนาคตบริษัทด้วย AI เต็มตัว หลังถอยจาก Metaverse พร้อมสัญญาณเปลี่ยนทิศทางสู่โมเดลเชิงพาณิชย์ ท่ามกลางแรงสั่นสะเทือนภายในองค์ก...

Responsive image

50 เหตุการณ์โลกเทค ตลอด 12 เดือนที่ผ่านมาของปี 2025

ปี 2025 ไม่ใช่ปีแห่งการตื่นรู้เรื่อง AI เหมือนปี 2023-2024 อีกต่อไป แต่มันคือปีแห่งการล่องหนเทคโนโลยีแทรกซึมเข้าไปอยู่ในอากาศ ในแว่นตา ในรถยนต์ จนเราแทบแยกไม่ออกว่าเส้นแบ่งระหว่างโ...

Responsive image

พรรคประชาชนเปิดตัวเว็บไซต์ ‘Election 69’ กางนโยบายกว่า 200 ชุด วางเทคโนโลยีเป็นแกนหลัก ปั้นรัฐแพลตฟอร์ม แก้ปัญหาโครงสร้างประเทศ

พรรคประชาชน เปิดตัวเว็บไซต์นโยบายเลือกตั้ง “Election 69” อย่างเป็นทางการ รวบรวมนโยบายกว่า 200 ชุด ภายใต้วิสัยทัศน์ “ประเทศไทยอยู่แบบเดิมไม่ได้” ชูแนวคิดรัฐแพลตฟอร์ม (Platform State...