Facebook พัฒนาระบบ AI ที่สามารถอ่านข้อความจากไฟล์รูปภาพใน Facebook และ Instagram ได้แล้ว ตั้งชื่อระบบนี้ว่า 'Rosetta' โชว์ตัวอย่างการอ่านข้อความจากภาพมีม (Meme) ที่เป็นภาพล้อเลียนได้ เตรียมรับมือกับข้อความที่ทำให้เกิดความเกลียดชัง หรือ Hate Speech Photo: Facebook

หากใช้คนดูข้อความในภาพอย่างเดียวคงจะไม่ไหว Facebook เลยพัฒนา 'Rosetta' ระบบ AI ตัวใหม่ที่สามารถอ่านข้อความที่อยู่ในภาพได้ (Optical Character Recognition: OCR) ซึ่งใช้ Machine Learning ขนาดใหญ่เพื่อช่วยให้ Facebook รับมือกับหลายข้อความที่ผิดกฎของ Facebook หรือข้อความไม่เหมาะสมจากผู้ใช้ได้

โดย Facebook ได้แสดงตัวอย่างในเว็บบล็อก Facebook Code ว่าสามารถถอดข้อความจากภาพมีม (Meme) ที่เป็นภาพล้อเลียนได้ รวมถึงเข้าใจบริบทในภาพหลังจากการถอดข้อความมมาได้อีกด้วย

"การทำความเข้าใจเกี่ยวกับข้อความในภาพพร้อมกับบริบทที่ปรากฏ จะช่วยให้ระบบของเราสามารถระบุเนื้อหาที่ไม่เหมาะสมหรือเป็นอันตรายได้ และรักษาชุมชน[Facebook]ของเราให้ปลอดภัยขึ้น" ทีมงาน Facebook กล่าว

ขั้นตอนการทำงานของ Rosetta คือ เริ่มด้วยการตรวจจับพื้นที่สี่เหลี่ยมในรูปภาพเพื่อหาบริเวณที่มีข้อความในภาพ จากนั้นก็จะใช้ Convolutional Neural Network เพื่อจำแนกและถอดข้อความออกมา โดยระบบสามารถข้อความที่เป็นภาษาอังกฤษและภาษาละติน รวมถึงยังถอดข้อความภาษาอาหรับและฮินดู(ซึ่งเป็นตัวอักษรที่มีรายละเอียดซับซ้อน)ได้อีกด้วย  โดยภาพที่ใช้ฝึกฝน (Training) ระบบนี้ก็จะมีทั้งภาพที่มนุษย์สร้างขึ้นและมีการใช้ภาพที่คอมพิวเตอร์สร้างขึ้นมาฝึกระบบด้วยเช่นกัน

โดย Rosetta ถูกนำมาใช้งานทั้งบน Facebook และ Instagram เป็นที่เรียบร้อยแล้ว ซึ่งทาง Facebook ระบุว่าจะมีการพัฒนาระบบให้การถอดข้อความภาษาอื่นๆ ให้ได้มากขึ้น รวมถึงจะพัฒนาให้ระบบสามารถถอดข้อความจากวีดีโอได้ในอนาคต

นอกจากนี้ Facebook ยังประกาศเพิ่มการแปลแบบอัตโนมัติในอีก 24 ภาษา ได้แก่ Serbian, Belarusian, Marathi, Sinhalese, Telugu, Nepali, Kannada, Urdu, Punjabi, Cambodian, Pashto, Mongolian, Zulu, Xhosa และ Somali ซึ่ง Facebook ระบุว่าระบบแปลใน 24 ภาษานี้ยังอยู่ในขั้นแรกของการเปิดให้บริการ อาจจะยังมีข้อผิดพลาดอยู่เป็นจำนวนมาก แต่ก็จะปรับปรุงให้ดีขึ้นในอนาคต รวมถึงมีแผนเพิ่มการแปลอันโนมัติสำหรับภาษาอื่นๆ อีกด้วย

อ้างอิงข้อมูลจาก The Verge และ Engadget


อ่านประกอบ


ความเห็นกองบรรณาธิการ

กองบรรณาธิการมองว่าไม่เกินความคาดหมายมากนัก เพราะเราก็เคยเห็นแล้วว่า Facebook มีระบบ AI ที่สามารถระบุได้ว่าภาพนี้มีองค์ประกอบอะไรบ้าง ถ้าใครเคยใช้ Facebook ในช่วงที่อินเทอร์เน็ตใช้งานได้ช้า เราจะเห็นคำว่า "Image may contain:" และตามด้วยสิ่งที่อยู่ในภาพ และเมื่อแอบดูโค้ดในหน้าเว็บ Facebook ก็พบดังภาพ

จะเห็นว่าจากภาพที่ผมทดลองดูโค้ด ก็พบว่า Facebook สามารถบอกองค์ประกอบที่อยู่ได้แม่นยำพอสมควร เช่น ภูเขา, ท้องฟ้า, พื้นที่กลางแจ้ง, ก้อนเมฆ และธรรมชาติ เรียกประมวลภาพได้ค่อนข้างเกือบ 100 เปอร์เซ็นต์เลยทีเดียว (ซึ่งเหลือแค่ยังบอกไม่ได้ว่ามีปีกเครื่องบินอยู่)

ซึ่งที่เรากำลังจะบอกก็คือ Facebook ก็มีความพยายามในการพัฒนา AI เกี่ยวกับรูปภาพมาอย่างต่อเนื่อง และการพัฒนา AI ที่สามารถอ่านข้อความจากภาพในครั้งนี้ อาจเป็นสิ่งที่ Facebook รับปากกับใครๆ ไว้หลายคนว่าจะทำให้ Facebook ดีขึ้น หลังจากก่อนหน้านี้ เผชิญปัญหาการถูกนำข้อมูลส่วนตัวไปใช้, การใช้ Facebook ในทางการเมือง (ระหว่างสหรัฐอเมริกาและรัสเซีย) และการสร้างข้อความที่ทำให้เกิดความเกลียดชัง (Hate Speech) ซึ่งการดีลกับข้อความปกติคงไม่เพียงพอ และการใช้คนมาวิเคราะห์รูปภาพที่มีข้อความอยู่ในนั้นก็คงไม่เพียงพอเช่นกัน

ทำให้ Facebook ต้องพัฒนาเครื่องมืออ่านข้อความในภาพเพื่อรับปัญหาต่างๆ ที่กล่าวมาข้างต้น

RELATED ARTICLE

Responsive image

Grab จับมือรัฐบาลอินโดนีเซีย หนุน Ecosystem ยานยนต์ไฟฟ้า ตั้งเป้า 2 ล้านคันในปี 2025

Grab ผู้ให้บริการบนดิจิทัลในอาเซียน ประกาศความร่วมมือกับรัฐบาลอินโดนีเซีย สร้าง Ecosystem ของยานยนต์ไฟฟ้าทั้ง 2 และ 4 ล้อ หนุนเป้าของรัฐบาลอินโดฯ ที่อยากมียานยนต์ไฟฟ้า 2 ล้านคันภาย...

Responsive image

SCG จับมือ GIZTIX พัฒนาดิจิทัลแพลตฟอร์มการขนส่งครบวงจรแก่ผู้แทนจำหน่าย SCG

SCG จับมือ GIZTIX สตาร์ทอัพด้านการบริการขนส่งผ่านระบบออนไลน์และเทคโนโลยีสำหรับผู้ขนส่ง ร่วมเดินหน้าพัฒนาดิจิทัลแพลทฟอร์มด้านการขนส่งแบบครบวงจรเสริมแกร่งร้านผู้แทนจำหน่ายสินค้าวัสดุ...

Responsive image

‘Tim Cook’ CEO Apple เผยภาพเยือนประเทศไทย พร้อมพิมพ์คำว่า “สวัสดี Thailand”

Tim Cook’ CEO Apple เผยภาพเยือนประเทศไทย เริ่มต้นที่วัดอรุณ , โรงเรียนสาธิตจุฬา พร้อมเผยภาพพบกับนักกีฬาวอลเล่ย์บอลหญิงไทย ที่ Cook ยังได้แสดงความยินดีกับการได้เหรียญทองในซีเกมส์อีก...