Google ปล่อยหมัดเด็ด เปิดตัว Gemini 2.5 Flash Image โมเดลสร้างภาพตัวท็อป

Gemini 2.5 Flash Image

Google เดินหน้ารุกตลาด AI สร้างภาพเต็มรูปแบบ ด้วยการอัปเกรดโมเดล Gemini ให้แก้ไขภาพได้สมจริงและเนียนกว่าเดิม ก้าวสำคัญครั้งนี้มีเป้าหมายชัดเจน คือการท้าชน OpenAI และดึงผู้ใช้กลับมาจาก ChatGPT โมเดลใหม่นี้ใช้ชื่อว่า Gemini 2.5 Flash Image เปิดให้ใช้งานอย่างเป็นทางการแล้ว ทั้งสำหรับผู้ใช้ทั่วไปและนักพัฒนาผ่านแพลตฟอร์มต่าง ๆ ของ Google

จุดเด่นของ Gemini 2.5 Flash Image คืออะไร ? 

Gemini 2.5 Flash Image มีจุดเด่นอยู่ที่ความแม่นยำในการแก้ไขภาพตามคำสั่งที่ผู้ใช้ป้อนเข้าไป โมเดลนี้สามารถทำการแก้ไขเฉพาะจุดได้อย่างแนบเนียน พร้อมคงรายละเอียดสำคัญๆ ของภาพไว้ได้ครบ เช่น ใบหน้าคน, สัตว์เลี้ยง หรือพื้นหลัง ได้อย่างสมบูรณ์แบบ ซึ่งเป็นสิ่งที่ AI จากค่ายคู่แข่งหลายเจ้ายังทำได้ไม่ดีพอ

ยกตัวอย่างง่ายๆ ถ้าคุณสั่งให้ ChatGPT หรือ Grok ของ xAI เปลี่ยนสีเสื้อในรูป อาจพบว่าใบหน้าของคนในภาพบิดเบี้ยวหรือพื้นหลังเพี้ยนไป แต่สำหรับโมเดลใหม่ของ Google จะสามารถแก้ไขเฉพาะส่วนที่ต้องการได้โดยไม่มีผลกระทบต่อส่วนอื่นๆ ซึ่งความเก่งกาจของ AI ตัวนี้เริ่มเป็นที่พูดถึงในวงการเทคฯ มาสักพักแล้ว หลังจากที่มันปรากฏตัวแบบไม่เปิดเผยชื่อภายใต้โค้ดเนมว่า "nano-banana" บนแพลตฟอร์มทดสอบอย่าง LMArena และได้รับคำชื่นชมอย่างล้นหลาม จนในที่สุด Google ก็ออกมายืนยันว่าเป็นหนึ่งในความสามารถของโมเดล Gemini 2.5 Flash AI นั่นเอง

สงคราม AI สร้างภาพเริ่มร้อนแรง  

การแข่งขันด้าน AI สร้างภาพกำลังดุเดือดสุดๆ เมื่อก่อนหน้านี้ OpenAI เคยทำให้วงการสั่นสะเทือนด้วยการเปิดตัว GPT-4oที่สร้างภาพได้ และทำให้มีมภาพแนว Studio Ghibli แพร่ระบาดไปทั่วอินเทอร์เน็ตจนยอดผู้ใช้ ChatGPT พุ่งกระฉูด 

เพื่อไม่ให้ตกขบวน Meta ก็ประกาศไปเมื่อสัปดาห์ก่อนว่าจะร่วมมือกับ Midjourney ส่วนบริษัทอื่นๆ อย่าง Black Forest Labs ก็กำลังมาแรงด้วยโมเดล AI ที่ชื่อ FLUX

การอัปเดตครั้งนี้อาจช่วยให้ Gemini สามารถดึงดูดผู้ใช้งานได้มากขึ้น เพราะตอนนี้ยอดผู้ใช้รายสัปดาห์ของ ChatGPT มีมากกว่า 700 ล้านคนแล้ว ในขณะที่ Gemini มีผู้ใช้รายเดือนอยู่ที่ 450 ล้านคน ซึ่งตัวเลขผู้ใช้รายสัปดาห์ก็น่าจะยังน้อยกว่าคู่แข่งอยู่พอสมควร

คุณนิโคล บริชโตวา หัวหน้าฝ่ายผลิตภัณฑ์ของ Google Deepmind บอกว่า Google ตั้งใจสร้างโมเดลนี้มาเพื่อการใช้งานทั่วไป อย่างเช่น ช่วยให้คนแต่งภาพบ้านหรือสวนในฝันได้ง่ายขึ้น นอกจากนี้ยังมีความสามารถในการผสมผสานข้อมูลหลายอย่างเข้าด้วยกันในครั้งเดียว เช่น นำรูปโซฟา, ห้องนั่งเล่น และชุดสี มาสร้างเป็นภาพห้องใหม่ที่สมจริง

แม้จะมีความสามารถที่น่าทึ่ง แต่ Google ก็มีมาตรการป้องกันที่เข้มงวด โดยจำกัดไม่ให้ผู้ใช้สร้างภาพที่ไม่เหมาะสมหรือภาพอนาจาร และเพื่อแก้ปัญหาภาพปลอมหรือ Deepfake ทาง Google ก็ได้ใส่ลายน้ำลงในภาพที่ AI สร้างขึ้นมา รวมถึงมีรหัสระบุตัวตนซ่อนไว้ในไฟล์ด้วย เพื่อให้รู้ว่าภาพนี้เป็นภาพที่สร้างโดย AI เรียกได้ว่าเป็นการอัปเกรดที่น่าจับตา ซึ่งเราคงต้องรอดูกันต่อไปว่าการอัปเดตครั้งนี้จะทำให้ Google ทวงคืนตำแหน่งผู้นำในตลาด AI ได้หรือไม่

อ้างอิง: techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

OpenAI เปิดตัว Prism ปฏิวัติวงการวิจัยด้วย AI Workspace ขุมพลัง GPT-5.2 ที่ออกแบบมาเพื่อนักวิทยาศาสตร์โดยเฉพาะ

OpenAI เปิดตัว Prism หรือ AI Workspace สำหรับนักวิทยาศาสตร์ ขุมพลัง GPT-5.2 ที่ช่วยทำหน้าที่ได้ตั้งแต่การประเมินสมมติฐาน การขัดเกลาสำนวนภาษาในบทความวิจัย ไปจนถึงการสืบค้นงานวิจัยใน...

Responsive image

ประเทศไทยเป็นเจ้าภาพ IMF-World Bank 2026 ‘เวทีการเงินโลก’ ครั้งที่ 2 ในรอบ 35 ปี

ประเทศไทยประกาศความพร้อมอย่างเป็นทางการในการกลับมาเป็นเจ้าภาพจัดการประชุมระดับโลกอีกครั้งในรอบ 35 ปี กับงาน การประชุมประจำปีสภาผู้ว่าการกองทุนการเงินระหว่างประเทศ (IMF) และกลุ่มธนา...

Responsive image

Meta เตรียมเปิดตัวสมาชิกพรีเมียม บน Facebook, IG และ WhatsApp จ่ายเงินเพื่อปลดล็อกฟีเจอร์ลับ

Meta เตรียมทดสอบระบบสมาชิกพรีเมียมบน Facebook, IG และ WhatsApp ปลดล็อกขุมพลัง Manus AI และฟีเจอร์ลับสายส่องเพื่อสร้าง New S-Curve ท่ามกลางศึก Subscription Fatigue ในยุค AI...