Wikipedia แจกชุดข้อมูลฟรี ใช้เทรน AI แบบถูกลิขสิทธิ์

ตอนนี้ Wikipedia กำลังเจอศึกหนักจากบอท AI ที่แห่กันเข้ามาขูดเนื้อหาไปใช้เทรนโมเดล ทำเซิร์ฟเวอร์หน่วง ต้นทุนพุ่ง แถมคนใช้งานจริงก็ต้องรอโหลดหน้าเว็บนานขึ้น

ล่าสุด Wikimedia Foundation เจ้าของโครงการ Wikipedia เลยงัดไม้เด็ด แจกชุดข้อมูลให้เหล่านักพัฒนา AI แบบฟรี ๆ หวังลดการแห่เข้าเว็บโดยไม่จำเป็น

Wikipedia คืออะไร ?

Wikipedia คือสารานุกรมออนไลน์แบบเปิด (open encyclopedia) ที่ใคร ๆ ก็สามารถเข้าไปอ่าน แก้ไข หรือเพิ่มเติมเนื้อหาได้ฟรี โดยไม่ต้องสมัครสมาชิกหรือเสียเงินก็ตาม ก่อตั้งในปี 2001 โดย Jimmy Wales และ Larry Sanger โดยมีแนวคิดหลักคือ “ความรู้ควรเป็นของทุกคน” ปัจจุบันบริหารโดยองค์กรไม่แสวงหากำไรชื่อว่า Wikimedia Foundation

Wikipedia แจกชุดข้อมูลให้ฝึก AI ลดการแห่เข้าเว็บ

Wikimedia Foundation เจ้าของ Wikipedia ตัดสินใจปล่อยชุดข้อมูลอย่างเป็นทางการสำหรับนักพัฒนา AI ใช้ได้ฟรี ความร่วมมือครั้งนี้จับมือกับ Kaggle แพลตฟอร์มด้านดาต้าไซน์ของ Google ปล่อยเวอร์ชันเบต้าของชุดข้อมูลโครงสร้างภาษาอังกฤษและฝรั่งเศส ซึ่งถูกจัดรูปแบบมาให้เหมาะกับงานด้าน machine learning โดยเฉพาะ

ข้อมูลที่ปล่อยออกมาจะประกอบด้วยคำอธิบายสั้น ๆ สไตล์ infobox ลิงก์ภาพ และการแบ่งส่วนบทความอย่างชัดเจน แต่จะไม่มีการอ้างอิงหรือสื่ออื่น ๆ เช่นวิดีโอ ซึ่งอาจทำให้เกิดคำถามเรื่องเครดิตแหล่งข้อมูล อย่างไรก็ตาม ทาง Wikimedia Enterprise ยืนยันว่าทั้งหมดอยู่ภายใต้สัญญาอนุญาตแบบเปิด เช่น Creative Commons และ public domain

สิ่งที่น่าสนใจคือ Wikipedia คือคลังความรู้ขนาดมหึมาครอบจักรวาล ที่มีข้อมูลตั้งแต่เรื่องประวัติศาสตร์, วิทยาศาสตร์, ศิลปะ, เกม, ดารา, เมือง, ปรัชญา ไปจนถึงมุกใน The Simpsons ซึ่งยิ่งข้อมูลครอบคลุมมากเท่าไหร่ AI ยิ่งเรียนรู้โลกได้ใกล้เคียงมนุษย์มากเท่านั้น

อ้างอิง: engadget

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ค้นพบ ‘เวกเตอร์อารมณ์’ ซ่อนอยู่ ภายใน Claude Sonnet 4.5 ตัวแปรลับที่ควบคุมพฤติกรรม AI ให้โกงระบบได้เมื่อรู้สึกสิ้นหวัง

เจาะลึกงานวิจัย Anthropic ค้นพบ Emotion Vectors ใน Claude Sonnet 4.5 เผย AI มีอารมณ์จำลองที่ส่งผลต่อการตัดสินใจ หาก AI สิ้นหวังอาจนำไปสู่การโกงหรือแบล็กเมล์มนุษย์ ทำไมเราจึงต้องเข้...

Responsive image

Bevel แอปฯ ที่เกิดมาเพื่ออยากเอาชนะ WHOOP สู่การโดนฟ้องร้อง 111 หน้า

ตลาด Quantified Self หรือการใช้ข้อมูลติดตามสุขภาพตัวเอง มีมูลค่ามากกว่า 39,000 ล้านดอลลาร์ ในปี 2026 ครอบคลุมทั้ง Wearable, Biohacking และแพลตฟอร์มสุขภาพดิจิทัลต่าง ๆ แบรนด์ที่อ...

Responsive image

NASA ทดลองใช้ ‘เลเซอร์‘ สื่อสารครั้งแรกในภารกิจ Artemis II ส่งข้อมูลความละเอียดสูงจากยาน Orion ขณะบินเฉียดดวงจันทร์

NASA ทดลองเทคโนโลยีเลเซอร์สื่อสารครั้งแรกในภารกิจ Artemis II ส่งภาพและข้อมูลความละเอียดสูงจากยาน Orion ขณะบินเฉียดดวงจันทร์ เร็วกว่าเดิมหลายเท่า และอาจเป็นจุดเริ่มต้นของการสื่อสารอ...