Wikipedia แจกชุดข้อมูลฟรี ใช้เทรน AI แบบถูกลิขสิทธิ์

ตอนนี้ Wikipedia กำลังเจอศึกหนักจากบอท AI ที่แห่กันเข้ามาขูดเนื้อหาไปใช้เทรนโมเดล ทำเซิร์ฟเวอร์หน่วง ต้นทุนพุ่ง แถมคนใช้งานจริงก็ต้องรอโหลดหน้าเว็บนานขึ้น

ล่าสุด Wikimedia Foundation เจ้าของโครงการ Wikipedia เลยงัดไม้เด็ด แจกชุดข้อมูลให้เหล่านักพัฒนา AI แบบฟรี ๆ หวังลดการแห่เข้าเว็บโดยไม่จำเป็น

Wikipedia คืออะไร ?

Wikipedia คือสารานุกรมออนไลน์แบบเปิด (open encyclopedia) ที่ใคร ๆ ก็สามารถเข้าไปอ่าน แก้ไข หรือเพิ่มเติมเนื้อหาได้ฟรี โดยไม่ต้องสมัครสมาชิกหรือเสียเงินก็ตาม ก่อตั้งในปี 2001 โดย Jimmy Wales และ Larry Sanger โดยมีแนวคิดหลักคือ “ความรู้ควรเป็นของทุกคน” ปัจจุบันบริหารโดยองค์กรไม่แสวงหากำไรชื่อว่า Wikimedia Foundation

Wikipedia แจกชุดข้อมูลให้ฝึก AI ลดการแห่เข้าเว็บ

Wikimedia Foundation เจ้าของ Wikipedia ตัดสินใจปล่อยชุดข้อมูลอย่างเป็นทางการสำหรับนักพัฒนา AI ใช้ได้ฟรี ความร่วมมือครั้งนี้จับมือกับ Kaggle แพลตฟอร์มด้านดาต้าไซน์ของ Google ปล่อยเวอร์ชันเบต้าของชุดข้อมูลโครงสร้างภาษาอังกฤษและฝรั่งเศส ซึ่งถูกจัดรูปแบบมาให้เหมาะกับงานด้าน machine learning โดยเฉพาะ

ข้อมูลที่ปล่อยออกมาจะประกอบด้วยคำอธิบายสั้น ๆ สไตล์ infobox ลิงก์ภาพ และการแบ่งส่วนบทความอย่างชัดเจน แต่จะไม่มีการอ้างอิงหรือสื่ออื่น ๆ เช่นวิดีโอ ซึ่งอาจทำให้เกิดคำถามเรื่องเครดิตแหล่งข้อมูล อย่างไรก็ตาม ทาง Wikimedia Enterprise ยืนยันว่าทั้งหมดอยู่ภายใต้สัญญาอนุญาตแบบเปิด เช่น Creative Commons และ public domain

สิ่งที่น่าสนใจคือ Wikipedia คือคลังความรู้ขนาดมหึมาครอบจักรวาล ที่มีข้อมูลตั้งแต่เรื่องประวัติศาสตร์, วิทยาศาสตร์, ศิลปะ, เกม, ดารา, เมือง, ปรัชญา ไปจนถึงมุกใน The Simpsons ซึ่งยิ่งข้อมูลครอบคลุมมากเท่าไหร่ AI ยิ่งเรียนรู้โลกได้ใกล้เคียงมนุษย์มากเท่านั้น

อ้างอิง: engadget

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

จาก Vibe Coding สู่ Vibe Selling เมื่อ AI ขยับบทบาทมาเป็นคู่หูนักขาย ช่วยดันรายได้เพิ่มขึ้น 77%

ถ้าเคยได้ยินคำว่า “Vibe Coding” ที่แค่สั่ง AI เขียนโปรแกรมด้วย ภาษาพูดง่ายๆ ก็ได้โค้ดออกมาดั่งใจ ตอนนี้เทรนด์นี้กำลังข้ามฝั่งมาที่โลกของการขาย ในชื่อที่เรียกว่า “Vibe Selling”...

Responsive image

Google สั่งระงับ AI Overviews ในคำค้นหาด้านสุขภาพบางรายการ หลังพบความเสี่ยงให้ข้อมูลคลาดเคลื่อน

Google สั่งระงับฟีเจอร์ AI Overviews ในคำค้นหาทางการแพทย์บางส่วน หลังพบข้อมูลเรื่องค่าตับคลาดเคลื่อน เสี่ยงทำผู้ใช้เข้าใจผิด ผู้เชี่ยวชาญแนะต้องแก้ที่ระบบไม่ใช่รายกรณี...

Responsive image

Gen Z 'ยอมมีหนี้ เพื่อเปย์ตัวเอง' มอง เรียบจบ-ทำงาน-มีบ้าน อาจไม่ใช่แนวคิดที่เวิร์กอีกต่อไป

จะเกิดอะไรขึ้น ถ้าคนทุกรุ่นโตมากับคำว่า “เรียนดี ทำงานหนัก เดี๋ยวก็มีบ้าน มีความมั่นคง” แต่พอโตขึ้นกลับพบว่า ทุกอย่างแพง งานหายาก และหนี้เพิ่มเร็วกว่าเงินเดือน นี่คือสิ่งที่กำลังเก...