
Google เดินหน้ารุกตลาด AI สร้างภาพเต็มรูปแบบ ด้วยการอัปเกรดโมเดล Gemini ให้แก้ไขภาพได้สมจริงและเนียนกว่าเดิม ก้าวสำคัญครั้งนี้มีเป้าหมายชัดเจน คือการท้าชน OpenAI และดึงผู้ใช้กลับมาจาก ChatGPT โมเดลใหม่นี้ใช้ชื่อว่า Gemini 2.5 Flash Image เปิดให้ใช้งานอย่างเป็นทางการแล้ว ทั้งสำหรับผู้ใช้ทั่วไปและนักพัฒนาผ่านแพลตฟอร์มต่าง ๆ ของ Google
Gemini 2.5 Flash Image มีจุดเด่นอยู่ที่ความแม่นยำในการแก้ไขภาพตามคำสั่งที่ผู้ใช้ป้อนเข้าไป โมเดลนี้สามารถทำการแก้ไขเฉพาะจุดได้อย่างแนบเนียน พร้อมคงรายละเอียดสำคัญๆ ของภาพไว้ได้ครบ เช่น ใบหน้าคน, สัตว์เลี้ยง หรือพื้นหลัง ได้อย่างสมบูรณ์แบบ ซึ่งเป็นสิ่งที่ AI จากค่ายคู่แข่งหลายเจ้ายังทำได้ไม่ดีพอ
ยกตัวอย่างง่ายๆ ถ้าคุณสั่งให้ ChatGPT หรือ Grok ของ xAI เปลี่ยนสีเสื้อในรูป อาจพบว่าใบหน้าของคนในภาพบิดเบี้ยวหรือพื้นหลังเพี้ยนไป แต่สำหรับโมเดลใหม่ของ Google จะสามารถแก้ไขเฉพาะส่วนที่ต้องการได้โดยไม่มีผลกระทบต่อส่วนอื่นๆ ซึ่งความเก่งกาจของ AI ตัวนี้เริ่มเป็นที่พูดถึงในวงการเทคฯ มาสักพักแล้ว หลังจากที่มันปรากฏตัวแบบไม่เปิดเผยชื่อภายใต้โค้ดเนมว่า "nano-banana" บนแพลตฟอร์มทดสอบอย่าง LMArena และได้รับคำชื่นชมอย่างล้นหลาม จนในที่สุด Google ก็ออกมายืนยันว่าเป็นหนึ่งในความสามารถของโมเดล Gemini 2.5 Flash AI นั่นเอง
การแข่งขันด้าน AI สร้างภาพกำลังดุเดือดสุดๆ เมื่อก่อนหน้านี้ OpenAI เคยทำให้วงการสั่นสะเทือนด้วยการเปิดตัว GPT-4oที่สร้างภาพได้ และทำให้มีมภาพแนว Studio Ghibli แพร่ระบาดไปทั่วอินเทอร์เน็ตจนยอดผู้ใช้ ChatGPT พุ่งกระฉูด
เพื่อไม่ให้ตกขบวน Meta ก็ประกาศไปเมื่อสัปดาห์ก่อนว่าจะร่วมมือกับ Midjourney ส่วนบริษัทอื่นๆ อย่าง Black Forest Labs ก็กำลังมาแรงด้วยโมเดล AI ที่ชื่อ FLUX
การอัปเดตครั้งนี้อาจช่วยให้ Gemini สามารถดึงดูดผู้ใช้งานได้มากขึ้น เพราะตอนนี้ยอดผู้ใช้รายสัปดาห์ของ ChatGPT มีมากกว่า 700 ล้านคนแล้ว ในขณะที่ Gemini มีผู้ใช้รายเดือนอยู่ที่ 450 ล้านคน ซึ่งตัวเลขผู้ใช้รายสัปดาห์ก็น่าจะยังน้อยกว่าคู่แข่งอยู่พอสมควร
คุณนิโคล บริชโตวา หัวหน้าฝ่ายผลิตภัณฑ์ของ Google Deepmind บอกว่า Google ตั้งใจสร้างโมเดลนี้มาเพื่อการใช้งานทั่วไป อย่างเช่น ช่วยให้คนแต่งภาพบ้านหรือสวนในฝันได้ง่ายขึ้น นอกจากนี้ยังมีความสามารถในการผสมผสานข้อมูลหลายอย่างเข้าด้วยกันในครั้งเดียว เช่น นำรูปโซฟา, ห้องนั่งเล่น และชุดสี มาสร้างเป็นภาพห้องใหม่ที่สมจริง
แม้จะมีความสามารถที่น่าทึ่ง แต่ Google ก็มีมาตรการป้องกันที่เข้มงวด โดยจำกัดไม่ให้ผู้ใช้สร้างภาพที่ไม่เหมาะสมหรือภาพอนาจาร และเพื่อแก้ปัญหาภาพปลอมหรือ Deepfake ทาง Google ก็ได้ใส่ลายน้ำลงในภาพที่ AI สร้างขึ้นมา รวมถึงมีรหัสระบุตัวตนซ่อนไว้ในไฟล์ด้วย เพื่อให้รู้ว่าภาพนี้เป็นภาพที่สร้างโดย AI เรียกได้ว่าเป็นการอัปเกรดที่น่าจับตา ซึ่งเราคงต้องรอดูกันต่อไปว่าการอัปเดตครั้งนี้จะทำให้ Google ทวงคืนตำแหน่งผู้นำในตลาด AI ได้หรือไม่
อ้างอิง: techcrunch
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด