Wikipedia แจกชุดข้อมูลฟรี ใช้เทรน AI แบบถูกลิขสิทธิ์

ตอนนี้ Wikipedia กำลังเจอศึกหนักจากบอท AI ที่แห่กันเข้ามาขูดเนื้อหาไปใช้เทรนโมเดล ทำเซิร์ฟเวอร์หน่วง ต้นทุนพุ่ง แถมคนใช้งานจริงก็ต้องรอโหลดหน้าเว็บนานขึ้น

ล่าสุด Wikimedia Foundation เจ้าของโครงการ Wikipedia เลยงัดไม้เด็ด แจกชุดข้อมูลให้เหล่านักพัฒนา AI แบบฟรี ๆ หวังลดการแห่เข้าเว็บโดยไม่จำเป็น

Wikipedia คืออะไร ?

Wikipedia คือสารานุกรมออนไลน์แบบเปิด (open encyclopedia) ที่ใคร ๆ ก็สามารถเข้าไปอ่าน แก้ไข หรือเพิ่มเติมเนื้อหาได้ฟรี โดยไม่ต้องสมัครสมาชิกหรือเสียเงินก็ตาม ก่อตั้งในปี 2001 โดย Jimmy Wales และ Larry Sanger โดยมีแนวคิดหลักคือ “ความรู้ควรเป็นของทุกคน” ปัจจุบันบริหารโดยองค์กรไม่แสวงหากำไรชื่อว่า Wikimedia Foundation

Wikipedia แจกชุดข้อมูลให้ฝึก AI ลดการแห่เข้าเว็บ

Wikimedia Foundation เจ้าของ Wikipedia ตัดสินใจปล่อยชุดข้อมูลอย่างเป็นทางการสำหรับนักพัฒนา AI ใช้ได้ฟรี ความร่วมมือครั้งนี้จับมือกับ Kaggle แพลตฟอร์มด้านดาต้าไซน์ของ Google ปล่อยเวอร์ชันเบต้าของชุดข้อมูลโครงสร้างภาษาอังกฤษและฝรั่งเศส ซึ่งถูกจัดรูปแบบมาให้เหมาะกับงานด้าน machine learning โดยเฉพาะ

ข้อมูลที่ปล่อยออกมาจะประกอบด้วยคำอธิบายสั้น ๆ สไตล์ infobox ลิงก์ภาพ และการแบ่งส่วนบทความอย่างชัดเจน แต่จะไม่มีการอ้างอิงหรือสื่ออื่น ๆ เช่นวิดีโอ ซึ่งอาจทำให้เกิดคำถามเรื่องเครดิตแหล่งข้อมูล อย่างไรก็ตาม ทาง Wikimedia Enterprise ยืนยันว่าทั้งหมดอยู่ภายใต้สัญญาอนุญาตแบบเปิด เช่น Creative Commons และ public domain

สิ่งที่น่าสนใจคือ Wikipedia คือคลังความรู้ขนาดมหึมาครอบจักรวาล ที่มีข้อมูลตั้งแต่เรื่องประวัติศาสตร์, วิทยาศาสตร์, ศิลปะ, เกม, ดารา, เมือง, ปรัชญา ไปจนถึงมุกใน The Simpsons ซึ่งยิ่งข้อมูลครอบคลุมมากเท่าไหร่ AI ยิ่งเรียนรู้โลกได้ใกล้เคียงมนุษย์มากเท่านั้น

อ้างอิง: engadget

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

SCG แถลงผลประกอบการไตรมาส 1 ต่อด้วยกลยุทธ์เชิงรุก ตั้ง ‘Daily War Room’ รวมศูนย์บริหารความเสี่ยง

ผลประกอบการ ไตรมาส 1 ปี 2569 SCG มี Adjusted Cash EBITDA 14,929 ล้านบาท แกร่งขึ้น 17% จากช่วงเดียวกันของปีก่อน ส่วนสถานการณ์ตะวันออกกลาง คาดการณ์ว่าทำราคาพลังงาน-วัตถุดิบผันผวนต่อ ...

Responsive image

Doosan ยักษ์ใหญ่อิเล็กทรอนิกส์ ลงทุน $135 ล้านในไทย ตั้งฐานผลิตที่ ARAYA รับดีมานด์ AI Data Center โลก

ARAYA – The Eastern Gateway ลงนาม MOU กับ Doosan ยักษ์อิเล็กทรอนิกส์จากเกาหลีใต้ ลงทุน 135 ล้านดอลลาร์ บนพื้นที่ 45 ไร่ ตั้งฐานผลิต Copper Clad Laminates (CCL) วัสดุสำคัญสำหรับ PCB...

Responsive image

OsseoLabs จับมือรามาธิบดี เปิดตัว Osscentric Sandbox ดันนวัตกรรมอุปกรณ์การแพทย์เฉพาะบุคคล

รามาธิบดีผนึก OsseoLabs เปิดตัว Osscentric Sandbox พื้นที่เชื่อมโยงหมอและวิศวกร เพื่อร่วมกันปฏิวัติการสร้างอุปกรณ์การแพทย์เฉพาะบุคคลด้วยเทคโนโลยี 3D Printing และระบบจำลองการผ่าตัดเ...