Google ปล่อยหมัดเด็ด เปิดตัว Gemini 2.5 Flash Image โมเดลสร้างภาพตัวท็อป

Gemini 2.5 Flash Image

Google เดินหน้ารุกตลาด AI สร้างภาพเต็มรูปแบบ ด้วยการอัปเกรดโมเดล Gemini ให้แก้ไขภาพได้สมจริงและเนียนกว่าเดิม ก้าวสำคัญครั้งนี้มีเป้าหมายชัดเจน คือการท้าชน OpenAI และดึงผู้ใช้กลับมาจาก ChatGPT โมเดลใหม่นี้ใช้ชื่อว่า Gemini 2.5 Flash Image เปิดให้ใช้งานอย่างเป็นทางการแล้ว ทั้งสำหรับผู้ใช้ทั่วไปและนักพัฒนาผ่านแพลตฟอร์มต่าง ๆ ของ Google

จุดเด่นของ Gemini 2.5 Flash Image คืออะไร ? 

Gemini 2.5 Flash Image มีจุดเด่นอยู่ที่ความแม่นยำในการแก้ไขภาพตามคำสั่งที่ผู้ใช้ป้อนเข้าไป โมเดลนี้สามารถทำการแก้ไขเฉพาะจุดได้อย่างแนบเนียน พร้อมคงรายละเอียดสำคัญๆ ของภาพไว้ได้ครบ เช่น ใบหน้าคน, สัตว์เลี้ยง หรือพื้นหลัง ได้อย่างสมบูรณ์แบบ ซึ่งเป็นสิ่งที่ AI จากค่ายคู่แข่งหลายเจ้ายังทำได้ไม่ดีพอ

ยกตัวอย่างง่ายๆ ถ้าคุณสั่งให้ ChatGPT หรือ Grok ของ xAI เปลี่ยนสีเสื้อในรูป อาจพบว่าใบหน้าของคนในภาพบิดเบี้ยวหรือพื้นหลังเพี้ยนไป แต่สำหรับโมเดลใหม่ของ Google จะสามารถแก้ไขเฉพาะส่วนที่ต้องการได้โดยไม่มีผลกระทบต่อส่วนอื่นๆ ซึ่งความเก่งกาจของ AI ตัวนี้เริ่มเป็นที่พูดถึงในวงการเทคฯ มาสักพักแล้ว หลังจากที่มันปรากฏตัวแบบไม่เปิดเผยชื่อภายใต้โค้ดเนมว่า "nano-banana" บนแพลตฟอร์มทดสอบอย่าง LMArena และได้รับคำชื่นชมอย่างล้นหลาม จนในที่สุด Google ก็ออกมายืนยันว่าเป็นหนึ่งในความสามารถของโมเดล Gemini 2.5 Flash AI นั่นเอง

สงคราม AI สร้างภาพเริ่มร้อนแรง  

การแข่งขันด้าน AI สร้างภาพกำลังดุเดือดสุดๆ เมื่อก่อนหน้านี้ OpenAI เคยทำให้วงการสั่นสะเทือนด้วยการเปิดตัว GPT-4oที่สร้างภาพได้ และทำให้มีมภาพแนว Studio Ghibli แพร่ระบาดไปทั่วอินเทอร์เน็ตจนยอดผู้ใช้ ChatGPT พุ่งกระฉูด 

เพื่อไม่ให้ตกขบวน Meta ก็ประกาศไปเมื่อสัปดาห์ก่อนว่าจะร่วมมือกับ Midjourney ส่วนบริษัทอื่นๆ อย่าง Black Forest Labs ก็กำลังมาแรงด้วยโมเดล AI ที่ชื่อ FLUX

การอัปเดตครั้งนี้อาจช่วยให้ Gemini สามารถดึงดูดผู้ใช้งานได้มากขึ้น เพราะตอนนี้ยอดผู้ใช้รายสัปดาห์ของ ChatGPT มีมากกว่า 700 ล้านคนแล้ว ในขณะที่ Gemini มีผู้ใช้รายเดือนอยู่ที่ 450 ล้านคน ซึ่งตัวเลขผู้ใช้รายสัปดาห์ก็น่าจะยังน้อยกว่าคู่แข่งอยู่พอสมควร

คุณนิโคล บริชโตวา หัวหน้าฝ่ายผลิตภัณฑ์ของ Google Deepmind บอกว่า Google ตั้งใจสร้างโมเดลนี้มาเพื่อการใช้งานทั่วไป อย่างเช่น ช่วยให้คนแต่งภาพบ้านหรือสวนในฝันได้ง่ายขึ้น นอกจากนี้ยังมีความสามารถในการผสมผสานข้อมูลหลายอย่างเข้าด้วยกันในครั้งเดียว เช่น นำรูปโซฟา, ห้องนั่งเล่น และชุดสี มาสร้างเป็นภาพห้องใหม่ที่สมจริง

แม้จะมีความสามารถที่น่าทึ่ง แต่ Google ก็มีมาตรการป้องกันที่เข้มงวด โดยจำกัดไม่ให้ผู้ใช้สร้างภาพที่ไม่เหมาะสมหรือภาพอนาจาร และเพื่อแก้ปัญหาภาพปลอมหรือ Deepfake ทาง Google ก็ได้ใส่ลายน้ำลงในภาพที่ AI สร้างขึ้นมา รวมถึงมีรหัสระบุตัวตนซ่อนไว้ในไฟล์ด้วย เพื่อให้รู้ว่าภาพนี้เป็นภาพที่สร้างโดย AI เรียกได้ว่าเป็นการอัปเกรดที่น่าจับตา ซึ่งเราคงต้องรอดูกันต่อไปว่าการอัปเดตครั้งนี้จะทำให้ Google ทวงคืนตำแหน่งผู้นำในตลาด AI ได้หรือไม่

อ้างอิง: techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

พาชม 7 ชั้นออฟฟิศใหม่ Agoda ณ One Bangkok: เมื่อบริษัทเทคฯ ระดับโลกออกแบบพื้นที่ทำงานที่ 'เชื่อมคน' ได้จริง

พาชมออฟฟิศใหม่ Agoda 7 ชั้น ณ One Bangkok ศูนย์รวมพนักงานกว่า 4,000 คน ที่ออกแบบมาเพื่อ 'เชื่อมคน' ผสานเทคโนโลยี ศิลปะ และ Wellness เข้าด้วยกันอย่างลงตัว...

Responsive image

ทรูมันนี่ จับมือ ร้านยากรุงเทพ เปิดมินิแอป ปรึกษาเภสัชกร-สั่งยา-ชำระเงินจบในแอปทรูมันนี่ ขยายประสบการณ์ดิจิทัลเพย์เมนท์ด้านสุขภาพ

ทรูมันนี่ จับมือ ร้านยากรุงเทพ เปิดบริการ Telepharmacy ผ่านมินิแอป ให้ผู้ใช้ปรึกษาเภสัชกร ซื้อสินค้า และชำระเงินได้ในแอปเดียว ยกระดับประสบการณ์ดิจิทัลเพย์เมนท์ด้านสุขภาพให้สะดวกและ...

Responsive image

มหิดลชูโมเดล MU Synergy ขับเคลื่อนอุตสาหกรรมอนาคต สร้าง GDP เร่งปั้นคนให้ตรงตลาดโลก

การขับเคลื่อนมหาวิทยาลัยในปัจจุบัน ไม่ได้จบแค่การผลิตองค์ความรู้ บุคคลากรหรือผลงานวิจัยอีกต่อไป แต่ต้องไปให้ถึงจุดที่สิ่งเหล่านั้น ‘สร้างผลกระทบจริง’ ต่อสังคม เศรษฐกิจและคุณภาพชีวิ...