หากใช้คนดูข้อความในภาพอย่างเดียวคงจะไม่ไหว Facebook เลยพัฒนา 'Rosetta' ระบบ AI ตัวใหม่ที่สามารถอ่านข้อความที่อยู่ในภาพได้ (Optical Character Recognition: OCR) ซึ่งใช้ Machine Learning ขนาดใหญ่เพื่อช่วยให้ Facebook รับมือกับหลายข้อความที่ผิดกฎของ Facebook หรือข้อความไม่เหมาะสมจากผู้ใช้ได้
โดย Facebook ได้แสดงตัวอย่างในเว็บบล็อก Facebook Code ว่าสามารถถอดข้อความจากภาพมีม (Meme) ที่เป็นภาพล้อเลียนได้ รวมถึงเข้าใจบริบทในภาพหลังจากการถอดข้อความมมาได้อีกด้วย
"การทำความเข้าใจเกี่ยวกับข้อความในภาพพร้อมกับบริบทที่ปรากฏ จะช่วยให้ระบบของเราสามารถระบุเนื้อหาที่ไม่เหมาะสมหรือเป็นอันตรายได้ และรักษาชุมชน[Facebook]ของเราให้ปลอดภัยขึ้น" ทีมงาน Facebook กล่าว
ขั้นตอนการทำงานของ Rosetta คือ เริ่มด้วยการตรวจจับพื้นที่สี่เหลี่ยมในรูปภาพเพื่อหาบริเวณที่มีข้อความในภาพ จากนั้นก็จะใช้ Convolutional Neural Network เพื่อจำแนกและถอดข้อความออกมา โดยระบบสามารถข้อความที่เป็นภาษาอังกฤษและภาษาละติน รวมถึงยังถอดข้อความภาษาอาหรับและฮินดู(ซึ่งเป็นตัวอักษรที่มีรายละเอียดซับซ้อน)ได้อีกด้วย โดยภาพที่ใช้ฝึกฝน (Training) ระบบนี้ก็จะมีทั้งภาพที่มนุษย์สร้างขึ้นและมีการใช้ภาพที่คอมพิวเตอร์สร้างขึ้นมาฝึกระบบด้วยเช่นกัน
โดย Rosetta ถูกนำมาใช้งานทั้งบน Facebook และ Instagram เป็นที่เรียบร้อยแล้ว ซึ่งทาง Facebook ระบุว่าจะมีการพัฒนาระบบให้การถอดข้อความภาษาอื่นๆ ให้ได้มากขึ้น รวมถึงจะพัฒนาให้ระบบสามารถถอดข้อความจากวีดีโอได้ในอนาคต
นอกจากนี้ Facebook ยังประกาศเพิ่มการแปลแบบอัตโนมัติในอีก 24 ภาษา ได้แก่ Serbian, Belarusian, Marathi, Sinhalese, Telugu, Nepali, Kannada, Urdu, Punjabi, Cambodian, Pashto, Mongolian, Zulu, Xhosa และ Somali ซึ่ง Facebook ระบุว่าระบบแปลใน 24 ภาษานี้ยังอยู่ในขั้นแรกของการเปิดให้บริการ อาจจะยังมีข้อผิดพลาดอยู่เป็นจำนวนมาก แต่ก็จะปรับปรุงให้ดีขึ้นในอนาคต รวมถึงมีแผนเพิ่มการแปลอันโนมัติสำหรับภาษาอื่นๆ อีกด้วย
อ้างอิงข้อมูลจาก The Verge และ Engadget
อ่านประกอบ
กองบรรณาธิการมองว่าไม่เกินความคาดหมายมากนัก เพราะเราก็เคยเห็นแล้วว่า Facebook มีระบบ AI ที่สามารถระบุได้ว่าภาพนี้มีองค์ประกอบอะไรบ้าง ถ้าใครเคยใช้ Facebook ในช่วงที่อินเทอร์เน็ตใช้งานได้ช้า เราจะเห็นคำว่า "Image may contain:" และตามด้วยสิ่งที่อยู่ในภาพ และเมื่อแอบดูโค้ดในหน้าเว็บ Facebook ก็พบดังภาพ
จะเห็นว่าจากภาพที่ผมทดลองดูโค้ด ก็พบว่า Facebook สามารถบอกองค์ประกอบที่อยู่ได้แม่นยำพอสมควร เช่น ภูเขา, ท้องฟ้า, พื้นที่กลางแจ้ง, ก้อนเมฆ และธรรมชาติ เรียกประมวลภาพได้ค่อนข้างเกือบ 100 เปอร์เซ็นต์เลยทีเดียว (ซึ่งเหลือแค่ยังบอกไม่ได้ว่ามีปีกเครื่องบินอยู่)
ซึ่งที่เรากำลังจะบอกก็คือ Facebook ก็มีความพยายามในการพัฒนา AI เกี่ยวกับรูปภาพมาอย่างต่อเนื่อง และการพัฒนา AI ที่สามารถอ่านข้อความจากภาพในครั้งนี้ อาจเป็นสิ่งที่ Facebook รับปากกับใครๆ ไว้หลายคนว่าจะทำให้ Facebook ดีขึ้น หลังจากก่อนหน้านี้ เผชิญปัญหาการถูกนำข้อมูลส่วนตัวไปใช้, การใช้ Facebook ในทางการเมือง (ระหว่างสหรัฐอเมริกาและรัสเซีย) และการสร้างข้อความที่ทำให้เกิดความเกลียดชัง (Hate Speech) ซึ่งการดีลกับข้อความปกติคงไม่เพียงพอ และการใช้คนมาวิเคราะห์รูปภาพที่มีข้อความอยู่ในนั้นก็คงไม่เพียงพอเช่นกัน
ทำให้ Facebook ต้องพัฒนาเครื่องมืออ่านข้อความในภาพเพื่อรับปัญหาต่างๆ ที่กล่าวมาข้างต้น
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด