Wikipedia แจกชุดข้อมูลฟรี ใช้เทรน AI แบบถูกลิขสิทธิ์

ตอนนี้ Wikipedia กำลังเจอศึกหนักจากบอท AI ที่แห่กันเข้ามาขูดเนื้อหาไปใช้เทรนโมเดล ทำเซิร์ฟเวอร์หน่วง ต้นทุนพุ่ง แถมคนใช้งานจริงก็ต้องรอโหลดหน้าเว็บนานขึ้น

ล่าสุด Wikimedia Foundation เจ้าของโครงการ Wikipedia เลยงัดไม้เด็ด แจกชุดข้อมูลให้เหล่านักพัฒนา AI แบบฟรี ๆ หวังลดการแห่เข้าเว็บโดยไม่จำเป็น

Wikipedia คืออะไร ?

Wikipedia คือสารานุกรมออนไลน์แบบเปิด (open encyclopedia) ที่ใคร ๆ ก็สามารถเข้าไปอ่าน แก้ไข หรือเพิ่มเติมเนื้อหาได้ฟรี โดยไม่ต้องสมัครสมาชิกหรือเสียเงินก็ตาม ก่อตั้งในปี 2001 โดย Jimmy Wales และ Larry Sanger โดยมีแนวคิดหลักคือ “ความรู้ควรเป็นของทุกคน” ปัจจุบันบริหารโดยองค์กรไม่แสวงหากำไรชื่อว่า Wikimedia Foundation

Wikipedia แจกชุดข้อมูลให้ฝึก AI ลดการแห่เข้าเว็บ

Wikimedia Foundation เจ้าของ Wikipedia ตัดสินใจปล่อยชุดข้อมูลอย่างเป็นทางการสำหรับนักพัฒนา AI ใช้ได้ฟรี ความร่วมมือครั้งนี้จับมือกับ Kaggle แพลตฟอร์มด้านดาต้าไซน์ของ Google ปล่อยเวอร์ชันเบต้าของชุดข้อมูลโครงสร้างภาษาอังกฤษและฝรั่งเศส ซึ่งถูกจัดรูปแบบมาให้เหมาะกับงานด้าน machine learning โดยเฉพาะ

ข้อมูลที่ปล่อยออกมาจะประกอบด้วยคำอธิบายสั้น ๆ สไตล์ infobox ลิงก์ภาพ และการแบ่งส่วนบทความอย่างชัดเจน แต่จะไม่มีการอ้างอิงหรือสื่ออื่น ๆ เช่นวิดีโอ ซึ่งอาจทำให้เกิดคำถามเรื่องเครดิตแหล่งข้อมูล อย่างไรก็ตาม ทาง Wikimedia Enterprise ยืนยันว่าทั้งหมดอยู่ภายใต้สัญญาอนุญาตแบบเปิด เช่น Creative Commons และ public domain

สิ่งที่น่าสนใจคือ Wikipedia คือคลังความรู้ขนาดมหึมาครอบจักรวาล ที่มีข้อมูลตั้งแต่เรื่องประวัติศาสตร์, วิทยาศาสตร์, ศิลปะ, เกม, ดารา, เมือง, ปรัชญา ไปจนถึงมุกใน The Simpsons ซึ่งยิ่งข้อมูลครอบคลุมมากเท่าไหร่ AI ยิ่งเรียนรู้โลกได้ใกล้เคียงมนุษย์มากเท่านั้น

อ้างอิง: engadget

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ม.มหิดล อันดับ 1 โลก SDG 3 เปิดยุทธศาสตร์ ‘Holistic Wellbeing’ นิยามความเป็นอยู่ที่ดีแบบใหม่ของมหิดล ที่จะนำประเทศไปสู่ Wellness Economy

มหาวิทยาลัยมหิดลคว้าอันดับ 1 ของโลกด้าน SDG 3 ด้วยคะแนน 93.6 จาก THE Sustainability Impact Rankings 2026 พร้อมเปิดยุทธศาสตร์ Holistic Wellbeing พาไทยชิงตลาด Wellness Economy โลกที่...

Responsive image

ถอดวิสัยทัศน์ผู้ว่าฯ แบงก์ชาติ ยุคที่ธุรกิจต้องการ 'Social License to Operate' และ 'เงินทุน' ไม่ได้ไหลเข้าบริษัทที่มุ่งแต่จะทำกำไรสูงสุด

สรุปวิสัยทัศน์ วิทัย รัตนากร ผู้ว่าการธนาคารแห่งประเทศไทย จากงาน Capital with Porpose 2026 : Unlocking ESG Value through Green Finance ที่ชี้ให้เห็นว่า ความยั่งยืน ไม่ใช่ทางเลือกแต...

Responsive image

'จากการขายอินเทอร์เน็ต สู่การขายพลัง AI' Huawei ชี้อนาคตของโทรคมนาคมจะขับเคลื่อนด้วยโมเดลรายได้จาก Token Monetization

Huawei เปิดวิสัยทัศน์ Token Monetization ในงาน MWC Shanghai 2026 ชี้ AI กำลังเปลี่ยนโมเดลธุรกิจโทรคมนาคม จากการขาย Data สู่การสร้างรายได้จากบริการ AI และ 5G-A...