Google ปล่อยหมัดเด็ด เปิดตัว Gemini 2.5 Flash Image โมเดลสร้างภาพตัวท็อป

Gemini 2.5 Flash Image

Google เดินหน้ารุกตลาด AI สร้างภาพเต็มรูปแบบ ด้วยการอัปเกรดโมเดล Gemini ให้แก้ไขภาพได้สมจริงและเนียนกว่าเดิม ก้าวสำคัญครั้งนี้มีเป้าหมายชัดเจน คือการท้าชน OpenAI และดึงผู้ใช้กลับมาจาก ChatGPT โมเดลใหม่นี้ใช้ชื่อว่า Gemini 2.5 Flash Image เปิดให้ใช้งานอย่างเป็นทางการแล้ว ทั้งสำหรับผู้ใช้ทั่วไปและนักพัฒนาผ่านแพลตฟอร์มต่าง ๆ ของ Google

จุดเด่นของ Gemini 2.5 Flash Image คืออะไร ? 

Gemini 2.5 Flash Image มีจุดเด่นอยู่ที่ความแม่นยำในการแก้ไขภาพตามคำสั่งที่ผู้ใช้ป้อนเข้าไป โมเดลนี้สามารถทำการแก้ไขเฉพาะจุดได้อย่างแนบเนียน พร้อมคงรายละเอียดสำคัญๆ ของภาพไว้ได้ครบ เช่น ใบหน้าคน, สัตว์เลี้ยง หรือพื้นหลัง ได้อย่างสมบูรณ์แบบ ซึ่งเป็นสิ่งที่ AI จากค่ายคู่แข่งหลายเจ้ายังทำได้ไม่ดีพอ

ยกตัวอย่างง่ายๆ ถ้าคุณสั่งให้ ChatGPT หรือ Grok ของ xAI เปลี่ยนสีเสื้อในรูป อาจพบว่าใบหน้าของคนในภาพบิดเบี้ยวหรือพื้นหลังเพี้ยนไป แต่สำหรับโมเดลใหม่ของ Google จะสามารถแก้ไขเฉพาะส่วนที่ต้องการได้โดยไม่มีผลกระทบต่อส่วนอื่นๆ ซึ่งความเก่งกาจของ AI ตัวนี้เริ่มเป็นที่พูดถึงในวงการเทคฯ มาสักพักแล้ว หลังจากที่มันปรากฏตัวแบบไม่เปิดเผยชื่อภายใต้โค้ดเนมว่า "nano-banana" บนแพลตฟอร์มทดสอบอย่าง LMArena และได้รับคำชื่นชมอย่างล้นหลาม จนในที่สุด Google ก็ออกมายืนยันว่าเป็นหนึ่งในความสามารถของโมเดล Gemini 2.5 Flash AI นั่นเอง

สงคราม AI สร้างภาพเริ่มร้อนแรง  

การแข่งขันด้าน AI สร้างภาพกำลังดุเดือดสุดๆ เมื่อก่อนหน้านี้ OpenAI เคยทำให้วงการสั่นสะเทือนด้วยการเปิดตัว GPT-4oที่สร้างภาพได้ และทำให้มีมภาพแนว Studio Ghibli แพร่ระบาดไปทั่วอินเทอร์เน็ตจนยอดผู้ใช้ ChatGPT พุ่งกระฉูด 

เพื่อไม่ให้ตกขบวน Meta ก็ประกาศไปเมื่อสัปดาห์ก่อนว่าจะร่วมมือกับ Midjourney ส่วนบริษัทอื่นๆ อย่าง Black Forest Labs ก็กำลังมาแรงด้วยโมเดล AI ที่ชื่อ FLUX

การอัปเดตครั้งนี้อาจช่วยให้ Gemini สามารถดึงดูดผู้ใช้งานได้มากขึ้น เพราะตอนนี้ยอดผู้ใช้รายสัปดาห์ของ ChatGPT มีมากกว่า 700 ล้านคนแล้ว ในขณะที่ Gemini มีผู้ใช้รายเดือนอยู่ที่ 450 ล้านคน ซึ่งตัวเลขผู้ใช้รายสัปดาห์ก็น่าจะยังน้อยกว่าคู่แข่งอยู่พอสมควร

คุณนิโคล บริชโตวา หัวหน้าฝ่ายผลิตภัณฑ์ของ Google Deepmind บอกว่า Google ตั้งใจสร้างโมเดลนี้มาเพื่อการใช้งานทั่วไป อย่างเช่น ช่วยให้คนแต่งภาพบ้านหรือสวนในฝันได้ง่ายขึ้น นอกจากนี้ยังมีความสามารถในการผสมผสานข้อมูลหลายอย่างเข้าด้วยกันในครั้งเดียว เช่น นำรูปโซฟา, ห้องนั่งเล่น และชุดสี มาสร้างเป็นภาพห้องใหม่ที่สมจริง

แม้จะมีความสามารถที่น่าทึ่ง แต่ Google ก็มีมาตรการป้องกันที่เข้มงวด โดยจำกัดไม่ให้ผู้ใช้สร้างภาพที่ไม่เหมาะสมหรือภาพอนาจาร และเพื่อแก้ปัญหาภาพปลอมหรือ Deepfake ทาง Google ก็ได้ใส่ลายน้ำลงในภาพที่ AI สร้างขึ้นมา รวมถึงมีรหัสระบุตัวตนซ่อนไว้ในไฟล์ด้วย เพื่อให้รู้ว่าภาพนี้เป็นภาพที่สร้างโดย AI เรียกได้ว่าเป็นการอัปเกรดที่น่าจับตา ซึ่งเราคงต้องรอดูกันต่อไปว่าการอัปเดตครั้งนี้จะทำให้ Google ทวงคืนตำแหน่งผู้นำในตลาด AI ได้หรือไม่

อ้างอิง: techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

SCBX แจ้งกำไร Q1/2026 ที่ 10,195 ล้านบาท ลดลง 18.5% รับแรงกดดันดอกเบี้ยนโยบายขาลง แต่รายได้ค่าธรรมเนียมพุ่งถึง 17.7%

เอสซีบีเอกซ์แจ้งกำไรสุทธิไตรมาส 1/2569 ที่ 10,195 ล้านบาท ลดลง 18.5% YoY จากรายได้ดอกเบี้ยสุทธิหดตัวตามดอกเบี้ยนโยบาย แต่ค่าธรรมเนียมโต 17.7% NPL ลดเหลือ 3.23% พร้อมเปิดตัวแบงก์เอก...

Responsive image

นักวิทย์ฯ โหลดจีโนมสมบูรณ์ชุดแรก เข้าควอนตัมคอมพิวเตอร์ได้แล้ว! ตั้งเป้าวิเคราะห์พันธุกรรมมนุษย์เร็วกว่าเครื่องมือเดิม 100 เท่า

ทีมวิจัยจาก Wellcome Sanger Institute ร่วมกับ Oxford, Cambridge และ Melbourne โหลดจีโนม Hepatitis D เข้าสู่ควอนตัมคอมพิวเตอร์ IBM Heron 156 คิวบิตเป็นครั้งแรก ตั้งเป้าวิเคราะห์พันจ...

Responsive image

Amazon ลงทุนเพิ่ม 25,000 ล้านดอลลาร์ใน Anthropic แลกสัญญาคลาวด์ AWS 10 ปี มูลค่ากว่า 1 แสนล้านดอลลาร์

Amazon ประกาศลงทุนเพิ่มใน Anthropic สูงสุด 25,000 ล้านดอลลาร์ แลกสัญญาคลาวด์ AWS 10 ปี มูลค่ากว่า 100,000 ล้านดอลลาร์ พร้อมกำลังประมวลผล 5 กิกะวัตต์จากชิป Trainium และย้าย Claude P...