Wikipedia แจกชุดข้อมูลฟรี ใช้เทรน AI แบบถูกลิขสิทธิ์

ตอนนี้ Wikipedia กำลังเจอศึกหนักจากบอท AI ที่แห่กันเข้ามาขูดเนื้อหาไปใช้เทรนโมเดล ทำเซิร์ฟเวอร์หน่วง ต้นทุนพุ่ง แถมคนใช้งานจริงก็ต้องรอโหลดหน้าเว็บนานขึ้น

ล่าสุด Wikimedia Foundation เจ้าของโครงการ Wikipedia เลยงัดไม้เด็ด แจกชุดข้อมูลให้เหล่านักพัฒนา AI แบบฟรี ๆ หวังลดการแห่เข้าเว็บโดยไม่จำเป็น

Wikipedia คืออะไร ?

Wikipedia คือสารานุกรมออนไลน์แบบเปิด (open encyclopedia) ที่ใคร ๆ ก็สามารถเข้าไปอ่าน แก้ไข หรือเพิ่มเติมเนื้อหาได้ฟรี โดยไม่ต้องสมัครสมาชิกหรือเสียเงินก็ตาม ก่อตั้งในปี 2001 โดย Jimmy Wales และ Larry Sanger โดยมีแนวคิดหลักคือ “ความรู้ควรเป็นของทุกคน” ปัจจุบันบริหารโดยองค์กรไม่แสวงหากำไรชื่อว่า Wikimedia Foundation

Wikipedia แจกชุดข้อมูลให้ฝึก AI ลดการแห่เข้าเว็บ

Wikimedia Foundation เจ้าของ Wikipedia ตัดสินใจปล่อยชุดข้อมูลอย่างเป็นทางการสำหรับนักพัฒนา AI ใช้ได้ฟรี ความร่วมมือครั้งนี้จับมือกับ Kaggle แพลตฟอร์มด้านดาต้าไซน์ของ Google ปล่อยเวอร์ชันเบต้าของชุดข้อมูลโครงสร้างภาษาอังกฤษและฝรั่งเศส ซึ่งถูกจัดรูปแบบมาให้เหมาะกับงานด้าน machine learning โดยเฉพาะ

ข้อมูลที่ปล่อยออกมาจะประกอบด้วยคำอธิบายสั้น ๆ สไตล์ infobox ลิงก์ภาพ และการแบ่งส่วนบทความอย่างชัดเจน แต่จะไม่มีการอ้างอิงหรือสื่ออื่น ๆ เช่นวิดีโอ ซึ่งอาจทำให้เกิดคำถามเรื่องเครดิตแหล่งข้อมูล อย่างไรก็ตาม ทาง Wikimedia Enterprise ยืนยันว่าทั้งหมดอยู่ภายใต้สัญญาอนุญาตแบบเปิด เช่น Creative Commons และ public domain

สิ่งที่น่าสนใจคือ Wikipedia คือคลังความรู้ขนาดมหึมาครอบจักรวาล ที่มีข้อมูลตั้งแต่เรื่องประวัติศาสตร์, วิทยาศาสตร์, ศิลปะ, เกม, ดารา, เมือง, ปรัชญา ไปจนถึงมุกใน The Simpsons ซึ่งยิ่งข้อมูลครอบคลุมมากเท่าไหร่ AI ยิ่งเรียนรู้โลกได้ใกล้เคียงมนุษย์มากเท่านั้น

อ้างอิง: engadget

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ทำไมฮ่องกงถึงกลายเป็นเบอร์ 3 แห่งโลกการเงิน เมื่อตลาดทุน + การเชื่อมจีนกับโลก + กฎ+ AI for Finance รวมตัวกันเป็นความได้เปรียบที่เมืองอื่นลอกได้ยาก

Techsauce มีโอกาสเดินทางไปร่วมงาน Asian Financial Forum 2026 ที่ฮ่องกง เพื่อหาคำตอบกับคำถามที่น่าสนใจมากข้อหนึ่งว่า ในโลกที่ศูนย์กลางการเงินแข่งขันกันดุเดือดขึ้นทุกปี ทำไมฮ่องกงยัง...

Responsive image

รู้จัก ‘Nemotron 3 Super’ Open Source ล่าสุดจาก NVIDIA โมเดล AI สำหรับระบบ Agentic Reasoning ประมวลผลเร็วกว่ารุ่นเดิม 5 เท่า

ทำความรู้จัก ‘Nemotron 3 Super’ โมเดล AI โอเพนซอร์สใหม่ล่าสุดที่ใช้สถาปัตยกรรมลูกผสม ประมวลผลเร็วขึ้น 5 เท่า ความจำระดับ 1 ล้านหน่วยคำ ตอบโจทย์การสร้างปัญญาประดิษฐ์อัตโนมัติ...

Responsive image

Microsoft เปิดตัว ‘Copilot Health’ AI สรุปข้อมูลสุขภาพ วิเคราะห์ข้อมูลจากผลตรวจสุขภาพ และ Smartwatch ปลอดภัยสูง ข้อมูลไม่ถูกนำไปเทรน AI

Microsoft เปิดตัว Copilot Health ผู้ช่วย AI อัจฉริยะที่รวบรวมข้อมูลจาก Wearable และประวัติการรักษา เพื่อวิเคราะห์และสรุปผลสุขภาพอย่างปลอดภัย ช่วยเตรียมความพร้อมก่อนพบแพทย์ พร้อมมาต...