Wikipedia แจกชุดข้อมูลฟรี ใช้เทรน AI แบบถูกลิขสิทธิ์

ตอนนี้ Wikipedia กำลังเจอศึกหนักจากบอท AI ที่แห่กันเข้ามาขูดเนื้อหาไปใช้เทรนโมเดล ทำเซิร์ฟเวอร์หน่วง ต้นทุนพุ่ง แถมคนใช้งานจริงก็ต้องรอโหลดหน้าเว็บนานขึ้น

ล่าสุด Wikimedia Foundation เจ้าของโครงการ Wikipedia เลยงัดไม้เด็ด แจกชุดข้อมูลให้เหล่านักพัฒนา AI แบบฟรี ๆ หวังลดการแห่เข้าเว็บโดยไม่จำเป็น

Wikipedia คืออะไร ?

Wikipedia คือสารานุกรมออนไลน์แบบเปิด (open encyclopedia) ที่ใคร ๆ ก็สามารถเข้าไปอ่าน แก้ไข หรือเพิ่มเติมเนื้อหาได้ฟรี โดยไม่ต้องสมัครสมาชิกหรือเสียเงินก็ตาม ก่อตั้งในปี 2001 โดย Jimmy Wales และ Larry Sanger โดยมีแนวคิดหลักคือ “ความรู้ควรเป็นของทุกคน” ปัจจุบันบริหารโดยองค์กรไม่แสวงหากำไรชื่อว่า Wikimedia Foundation

Wikipedia แจกชุดข้อมูลให้ฝึก AI ลดการแห่เข้าเว็บ

Wikimedia Foundation เจ้าของ Wikipedia ตัดสินใจปล่อยชุดข้อมูลอย่างเป็นทางการสำหรับนักพัฒนา AI ใช้ได้ฟรี ความร่วมมือครั้งนี้จับมือกับ Kaggle แพลตฟอร์มด้านดาต้าไซน์ของ Google ปล่อยเวอร์ชันเบต้าของชุดข้อมูลโครงสร้างภาษาอังกฤษและฝรั่งเศส ซึ่งถูกจัดรูปแบบมาให้เหมาะกับงานด้าน machine learning โดยเฉพาะ

ข้อมูลที่ปล่อยออกมาจะประกอบด้วยคำอธิบายสั้น ๆ สไตล์ infobox ลิงก์ภาพ และการแบ่งส่วนบทความอย่างชัดเจน แต่จะไม่มีการอ้างอิงหรือสื่ออื่น ๆ เช่นวิดีโอ ซึ่งอาจทำให้เกิดคำถามเรื่องเครดิตแหล่งข้อมูล อย่างไรก็ตาม ทาง Wikimedia Enterprise ยืนยันว่าทั้งหมดอยู่ภายใต้สัญญาอนุญาตแบบเปิด เช่น Creative Commons และ public domain

สิ่งที่น่าสนใจคือ Wikipedia คือคลังความรู้ขนาดมหึมาครอบจักรวาล ที่มีข้อมูลตั้งแต่เรื่องประวัติศาสตร์, วิทยาศาสตร์, ศิลปะ, เกม, ดารา, เมือง, ปรัชญา ไปจนถึงมุกใน The Simpsons ซึ่งยิ่งข้อมูลครอบคลุมมากเท่าไหร่ AI ยิ่งเรียนรู้โลกได้ใกล้เคียงมนุษย์มากเท่านั้น

อ้างอิง: engadget

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

World Labs ปิดดีลระดมทุน 1 พันล้านดอลลาร์! เมื่อ AI เข้าใจฟิสิกส์และมิติสัมพันธ์

World Labs สตาร์ทอัพ AI ของ Fei-Fei Li ระดมทุนเพิ่ม 1 พันล้านดอลลาร์! หลัง Autodesk ทุ่มงบร่วมพัฒนา Spatial AI ปฏิวัติการทำงาน 3 มิติและอุตสาหกรรมบันเทิง...

Responsive image

Microsoft คิดค้นระบบเก็บข้อมูลบนแผ่นแก้ว อยู่ได้นาน 10,000 ปี ก้าวใหม่สู่เทคโนโลยีข้อมูลอมตะที่อาจปฏิวัติ Data Center

Microsoft เผยความก้าวหน้า Project Silica ระบบเก็บข้อมูลบนแผ่นแก้วที่อยู่ได้นาน 10,000 ปี ใช้เลเซอร์สลักข้อมูลความจุ 4.8TB ต่อแผ่น อาจปฏิวัติการจัดเก็บข้อมูลใน Data Center และการเก็...

Responsive image

ดราม่ากลางงาน AI ที่อินเดีย เจ้าภาพสั่งมหาลัยรื้อบูธ หลังเอาหุ่นยนต์จีนมา 'ย้อมแมว' ว่าเป็นผลงานตัวเอง

อินเดียกำลังเจอกระแสวิจารณ์ไม่น้อย หลังเกิดเหตุการณ์ที่หลายคนมองว่า 'น่าอับอาย' กลางเวทีงาน AI ระดับประเทศ เมื่อมหาวิทยาลัยแห่งหนึ่งถูกจับได้ว่า นำหุ่นยนต์สุนัขที่ผลิตในจีนมาแสดง พ...