ทำไม AI สะกด Strawberry ไม่ได้ ไขความลับวิธีสะกดคำแบบ AI

เชื่อไหมว่า ChatGPT เป็นหนึ่งใน AI ที่ฉลาดและมีความสามารถหลายด้าน แต่สิ่งหนึ่งที่ AI เหล่านี้ไม่สามารถทำได้อย่างที่หลายคนคาดไม่ถึง คือการนับตัว "r" ในคำว่า "Strawberry" เรื่องนี้กลายเป็นประเด็นที่ถูกพูดถึงอย่างมากในโลกโซเชียล 

แล้วทำไม AI ถึงนับตัว "r" ในคำว่า "Strawberry" ไม่ได้ ? มาหาคำตอบไปพร้อมกับ Techsauce ในบทความนี้กัน !

ทำไม AI สะกด Strawberry ไม่ได้

ChatGPT เป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่สามารถเขียนเรียงความและแก้สมการได้ภายในไม่กี่วินาที ซึ่ง LLM ส่วนใหญ่ก็พัฒนาต่อจากโมเดล Transformer กันทั้งนั้น เป็นวิธีการที่ทำให้ AI เรียนรู้และเข้าใจข้อความ 

Transformers คืออะไร

ด้านเว็บไซต์ของ AWS ได้อธิบายเกี่ยวกับ Transformers เอาไว้ว่า…

Transformer เป็นสถาปัตยกรรมโครงข่ายประสาทเทียมที่มีความสามารถในการประมวลผลภาษาโดยใช้การเรียนรู้บริบทและความสัมพันธ์ระหว่างคำต่างๆ ในประโยค เพื่อทำความเข้าใจบริบทและความหมายโดยรวม  พร้อมสร้างผลลัพธ์ที่ถูกต้องและเป็นธรรมชาติ  

ซึ่งการ Transformer ภาษา AI ไม่ได้มองแต่ละคำแยกกัน แต่จะใช้วิธีแบ่งข้อความออกเป็นส่วนๆ เรียกว่า "Tokens”

“Tokens” ในที่นี้หมายถึงคำ หรือส่วนของคำ เปรียบเสมือนตัวต่อเลโก้ของภาษา แต่ละตัวแทนส่วนหนึ่งของประโยค ซึ่ง AI จะแยกประโยคของเราออกเป็นชิ้นส่วนย่อยๆ เพื่อเข้าใจความหมาย เช่น ประโยค ‘ฉันชอบกินข้าว’ อาจถูกแยกเป็นโทเค็น ‘ฉัน’ ‘ชอบ’ ‘กิน’ ‘ข้าว’” เป็นต้น หรืออย่างคำว่า The ในมุมมองของ AI มันไม่ได้แบ่ง ‘T’-‘H’-‘E’ ออกเป็น 3 Tokens มันรู้จักแค่เพียง ‘The’ ที่นับเป็น 1 Tokens เท่านั้น

ในกรณีของคำว่า Strawberry ก็เช่นกัน AI อาจเข้าใจว่าคำว่า "strawberry" มาจากการแบ่ง Tokens ออกเป็น 2 คำคือ "straw" และ "berry" 

มันจึงอาจตีความว่ามี r อยู่แค่ 2 จุดใน stRaw และ beRRy นั่นเอง และนี่คือสาเหตุที่บางครั้ง AI มักมีปัญหาในเรื่องการสะกดคำหรือการนับตัวอักษร นั่นเพราะมันไม่ได้สะกดคำตามตัวอักษรแบบมนุษย์

อ้างอิง: techcrunch, aws.amazon

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

TIME ยกย่องให้ ‘The Architects of AI’ เป็น Person of the Year ของปี 2025

TIME Person of the Year 2025: เมื่อ Jensen Huang และเหล่าสถาปนิก AI พลิกโฉมโลก เศรษฐกิจ และการเมือง ท่ามกลางสงครามเทคโนโลยีสหรัฐฯ-จีน...

Responsive image

เศรษฐกิจเหมือน 'รถติดหล่ม' ไทยไม่ใช่ดาวรุ่ง-เป็นรองเพื่อนบ้าน ส่องแนวทางการปฏิรูปอุตสาหกรรมไทย จาก ส.อ.ท

เศรษฐกิจไทยกำลังเผชิญภาวะ 'รถติดหล่ม' เมื่อการเติบโตชะลอตัวจากปัญหาเชิงโครงสร้างและแรงกดดันรอบด้าน คุณเกรียงไกร เธียรนุกุล ประธานสภาอุตสาหกรรมแห่งประเทศไทย ชี้ทางรอดผ่านเวที AI Inn...

Responsive image

เจาะลึกโครงการ “GDCC” คลาวด์กลางภาครัฐ เบื้องหลังการปฏิรูปดิจิทัลไทย สู่ยุค Open Data ที่เปลี่ยนชีวิตประชาชนได้จริง

เจาะลึก GDCC คลาวด์กลางภาครัฐ เบื้องหลังการปฏิรูปดิจิทัลไทยที่ช่วยประหยัดงบกว่า 6 พันล้านบาท พร้อมยกระดับบริการ 1669 และความปลอดภัยข้อมูลคนไทยสู่ยุค Open Data...