ทำไม AI สะกด Strawberry ไม่ได้ ไขความลับวิธีสะกดคำแบบ AI

เชื่อไหมว่า ChatGPT เป็นหนึ่งใน AI ที่ฉลาดและมีความสามารถหลายด้าน แต่สิ่งหนึ่งที่ AI เหล่านี้ไม่สามารถทำได้อย่างที่หลายคนคาดไม่ถึง คือการนับตัว "r" ในคำว่า "Strawberry" เรื่องนี้กลายเป็นประเด็นที่ถูกพูดถึงอย่างมากในโลกโซเชียล 

แล้วทำไม AI ถึงนับตัว "r" ในคำว่า "Strawberry" ไม่ได้ ? มาหาคำตอบไปพร้อมกับ Techsauce ในบทความนี้กัน !

ทำไม AI สะกด Strawberry ไม่ได้

ChatGPT เป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่สามารถเขียนเรียงความและแก้สมการได้ภายในไม่กี่วินาที ซึ่ง LLM ส่วนใหญ่ก็พัฒนาต่อจากโมเดล Transformer กันทั้งนั้น เป็นวิธีการที่ทำให้ AI เรียนรู้และเข้าใจข้อความ 

Transformers คืออะไร

ด้านเว็บไซต์ของ AWS ได้อธิบายเกี่ยวกับ Transformers เอาไว้ว่า…

Transformer เป็นสถาปัตยกรรมโครงข่ายประสาทเทียมที่มีความสามารถในการประมวลผลภาษาโดยใช้การเรียนรู้บริบทและความสัมพันธ์ระหว่างคำต่างๆ ในประโยค เพื่อทำความเข้าใจบริบทและความหมายโดยรวม  พร้อมสร้างผลลัพธ์ที่ถูกต้องและเป็นธรรมชาติ  

ซึ่งการ Transformer ภาษา AI ไม่ได้มองแต่ละคำแยกกัน แต่จะใช้วิธีแบ่งข้อความออกเป็นส่วนๆ เรียกว่า "Tokens”

“Tokens” ในที่นี้หมายถึงคำ หรือส่วนของคำ เปรียบเสมือนตัวต่อเลโก้ของภาษา แต่ละตัวแทนส่วนหนึ่งของประโยค ซึ่ง AI จะแยกประโยคของเราออกเป็นชิ้นส่วนย่อยๆ เพื่อเข้าใจความหมาย เช่น ประโยค ‘ฉันชอบกินข้าว’ อาจถูกแยกเป็นโทเค็น ‘ฉัน’ ‘ชอบ’ ‘กิน’ ‘ข้าว’” เป็นต้น หรืออย่างคำว่า The ในมุมมองของ AI มันไม่ได้แบ่ง ‘T’-‘H’-‘E’ ออกเป็น 3 Tokens มันรู้จักแค่เพียง ‘The’ ที่นับเป็น 1 Tokens เท่านั้น

ในกรณีของคำว่า Strawberry ก็เช่นกัน AI อาจเข้าใจว่าคำว่า "strawberry" มาจากการแบ่ง Tokens ออกเป็น 2 คำคือ "straw" และ "berry" 

มันจึงอาจตีความว่ามี r อยู่แค่ 2 จุดใน stRaw และ beRRy นั่นเอง และนี่คือสาเหตุที่บางครั้ง AI มักมีปัญหาในเรื่องการสะกดคำหรือการนับตัวอักษร นั่นเพราะมันไม่ได้สะกดคำตามตัวอักษรแบบมนุษย์

อ้างอิง: techcrunch, aws.amazon

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ทำไมต้องปั้นทีมขายยุคใหม่ด้วย Data และ AI ? ถอดบทเรียนการเปลี่ยนผ่านสู่ระบบดิจิทัลครั้งสำคัญของทีมขายยิบอินซอย ด้วย Agentforce Sales

หากเราพูดถึงชื่อ ยิบอินซอย (Yip In Tsoi) ภาพจำแรกของใครหลายคนคงหนีไม่พ้น องค์กรระดับตำนานที่อยู่คู่แวดวงธุรกิจไทยมาร่วมศตวรรษ ในฐานะ System Integrator (SI) ผู้อยู่เบื้องหลังความสำเ...

Responsive image

รัฐแพลตฟอร์ม คืออะไร ? ต่างจากรัฐบาลดิจิทัลหรือไม่ ส่องนโยบายดิจิทัลพรรคประชาชน เมื่อคนสายเทคร่วมกันออกแบบประเทศ

เมื่อนักเทคโนโลยีออกแบบประเทศ ส่องพิมพ์เขียวรัฐแพลตฟอร์มเพื่อรีเซ็ตโครงสร้างดิจิทัลไทยจากพรรคประชาชน...

Responsive image

xAI ปีดดีลระดมทุน Series E 20,000 ล้านดอลลาร์ ขยายโครงสร้างพื้นฐาน AI ท่ามกลางประเด็นอื้อฉาวการใช้งาน Grok

xAI ระดมทุน Series E มูลค่า 20,000 ล้านดอลลาร์ โดยมี NVIDIA และ Cisco เข้าร่วมลงทุนเชิงยุทธศาสตร์ เพื่อเร่งขยายโครงสร้างพื้นฐาน AI ระดับโลก ท่ามกลางประเด็นอื้อฉาวการใช้งาน Grok ที่...