‘Sanas’ สตาร์ทอัพแปลงสำเนียงเรียลไทม์ ความสำเร็จที่แลกมาด้วยข้อหาลบตัวตน

Shawn Zhang นั่งคุยกับ Raul เพื่อนสนิทที่เพิ่งย้ายกลับไปทำงานคอลเซ็นเตอร์ (Call Center) ที่นิการากัว คาดว่าจะได้ฟังเรื่องบ่นลูกค้าจอมเรื่องมาก แต่สิ่งที่ Raul เล่ากลับเป็นจุดเริ่มต้นของสตาร์ทอัพที่ทั้งโตเร็วและถูกถกเถียงมากที่สุดในวงการปัญญาประดิษฐ์ (AI) ตอนนี้

ลูกค้าฝั่งอเมริกาบ่นเรื่องสำเนียงของ Raul จนกลายเป็นคะแนนติดลบในรายงานประจำเดือน ค่าจ้างลดลง และทุกวันที่ต้องเข้างาน 8 ชั่วโมงคือฝันร้ายที่รู้ตัวว่ายังไม่ทันพูดจบประโยค คนปลายสายก็ตัดสินเสร็จแล้ว บทสนทนาวันนั้นกลายเป็น Sanas สตาร์ทอัพแห่งเมืองแพโลอัลโต (Palo Alto) ที่ Zhang ร่วมก่อตั้งตอนเรียนปี 2 ที่มหาวิทยาลัย Stanford เพื่อสร้างเทคโนโลยีแปลงสำเนียงแบบเรียลไทม์เจ้าแรกของโลก ตามรายงานของ Inc.

จากการระบาดของ COVID สู่ตัวเลขที่นักลงทุนตามล่า

Sanas เปิดตัวในปี 2020 พอดีกับช่วงที่ COVID ส่งนักศึกษากลับบ้าน Zhang เล่าว่าจังหวะนั้นเองที่ผลักดันให้เขาเลิกทำโปรเจกต์เสริมแบบครึ่ง ๆ กลาง ๆ และลงมือสร้างของจริง

ผลลัพธ์ที่ตามมาคือตัวเลขที่ทำให้สตาร์ทอัพรุ่นเดียวกันต้องหันมามอง รายได้พุ่งจากศูนย์เป็น 62 ล้านดอลลาร์ภายใน 2 ปี กำลังจะแตะ 130 ล้านดอลลาร์ในปีนี้ มีผู้ใช้งานทะลุ 1 ล้านคน และระดมทุนสะสมไปแล้ว 121 ล้านดอลลาร์ โดยรอบล่าสุดเป็น Series B มูลค่า 65 ล้านดอลลาร์ที่นำโดย Quadrille Capital และ Teleperformance พร้อมประเมินมูลค่าบริษัทไว้กว่า 500 ล้านดอลลาร์ ตามรายงานของ TechCrunch

"คุณไม่ควรเริ่มจากการสร้างของเจ๋ง ๆ แล้วค่อยมาหาวิธีขาย นั่นคือสูตรของความหายนะ" Zhang บอก "แต่ถ้าคุณเจอความต้องการที่แท้จริง ไม่ว่าคุณจะถือเทคโนโลยีอะไร คุณก็มีธุรกิจ ตราบใดที่มีปัญหา ตราบนั้นก็มีธุรกิจ"

ก่อนหน้าจะเจอจุดนี้ Zhang ผ่านสิ่งที่เขาเรียกว่า "Pivot Hell" หรือยุคที่ต้องเปลี่ยนทิศทางบริษัทไปมาไม่จบสิ้น ทั้งการแข่งขัน Hackathon และไอเดียวันเสาร์อาทิตย์ที่ดูเท่แต่ไม่ติดตลาด Sanas ติดได้เพราะปัญหาเป็นเรื่องจริง วัดผลได้ และมีคนยอมจ่ายเพื่อแก้ไขมันอยู่แล้ว ในวงการคอลเซ็นเตอร์มีบริษัทถึงกับใช้คะแนนความหนาของสำเนียงในการคัดผู้สมัคร

เทคโนโลยีที่อยู่บนเครื่องผู้ใช้ ไม่ใช่บนคลาวด์

เบื้องหลังของ Sanas คือ Edge AI หรือปัญญาประดิษฐ์ที่ประมวลผลบนเครื่องผู้ใช้ตรง ๆ โดยไม่ต้องส่งเสียงขึ้นคลาวด์ (Cloud) ระบบจะวิเคราะห์หน่วยเสียง (Phoneme) ของผู้พูดและแทนที่ด้วยหน่วยเสียงที่ตรงกับสำเนียงปลายทางที่ผู้ใช้เลือก ทั้งหมดนี้ทำได้ในเวลาหน่วงประมาณ 1 ใน 5 วินาที ซึ่งต่ำกว่าระดับที่หูคนทั่วไปจะจับได้

Sanas อ้างว่าเทรนโมเดลด้วยข้อมูลเสียงพูดกว่า 50 ล้านชุด รวบรวมจากพันธมิตรและนักพากย์เสียงในบริษัท จุดขายคือการเก็บอารมณ์ ตัวตน และลีลาการเน้นเสียง (Inflection) ของผู้พูดเอาไว้ พร้อมตัดเสียงสะท้อน (Reverb) และเสียงรบกวนรอบข้างไปในตัว

ลูกค้าปัจจุบันมีราว 50 รายในอุตสาหกรรมที่หลากหลาย ตั้งแต่สาธารณสุขไปจนถึงโลจิสติกส์และผู้ผลิตฮาร์ดแวร์ ที่น่าสนใจคือบริษัทรับจ้างงานภายนอก (Outsourcing) ระดับโลกอย่าง Alorica และ Teleperformance ถึงขั้นเข้ามาเป็นทั้งลูกค้าและผู้ลงทุน UPS และ DoorDash ก็เป็นชื่อที่ปรากฏในรายชื่อลูกค้าเช่นกัน ตามรายงานของ Retail Technology Innovation Hub

แรงต้านที่ตามมาทันที

ทันทีที่ Sanas เริ่มเป็นที่รู้จัก ก็มีแฮชแท็กวิจารณ์บริษัทบนทวิตเตอร์ (Twitter) ขึ้นมา คนรู้จัก Zhang ทักหลังไมค์ถามตรง ๆ ว่ารู้สึกอายกับสิ่งที่ตัวเองสร้างหรือเปล่า ข้อกล่าวหาหลักคือ Sanas กำลังลบตัวตนของคนที่มีสำเนียงต่างจากสำเนียงอเมริกัน

นักวิชาการลงสนามด้วย Daily Titan ลงบทความหัวเรื่อง "Stop Sanas-tizing People of Color's Accents" ระบุว่าเทคโนโลยีนี้เป็นผลผลิตของวัฒนธรรมที่ยกย่องคนผิวขาวเหนือกลุ่มอื่น (White Supremacy) ที่บอกเป็นนัยว่าสำเนียงอเมริกันผิวขาวดีกว่าสำเนียงอื่น ฝั่ง UCLA Initiative to Study Hate เปิดโครงการวิจัยชื่อ "Sanas's AI White Voice" เพื่อตั้งคำถามว่าการใช้ AI แก้อคติ แทนที่จะแก้ที่ต้นเหตุของอคติ มันโอเคหรือไม่ ขณะที่ The Conversation เรียกเทคโนโลยีแนวนี้ว่าเทคโนโลยีที่ตั้งอยู่บนการกดขี่ที่ฝังลึกในตัวเอง

"คอมเมนต์เหล่านั้นทำให้ผู้ก่อตั้งทุกคนต้องหยุดคิด" Zhang ยอมรับ "แต่เราก็ได้รับข้อความจากผู้อพยพที่ร้องไห้บอกว่ารู้สึกว่าสำเนียงของตัวเองเป็นกำแพงมาหลายปี ข้อความพวกนี้คือเหตุผลที่เรายังสร้างต่อ"

Sharath Keshava Narayana ซึ่งภายหลังเข้ามาเป็น CEO และผู้ร่วมก่อตั้ง ก็เคยขึ้นรายการ ABC7 News ตอบโต้ประเด็นนี้ว่า "ผมไม่รู้ว่าจะเปลี่ยนโลกได้ไหม แต่ถ้าช่วยให้พนักงานคอลเซ็นเตอร์กลับบ้านด้วยรอยยิ้ม ไม่ถูกด่า ผมเอาทุกวัน"

ปีนหน้าผาที่ความสูงต่างกัน

เมื่อถูกถามถึงความต่างของการสเกลจากศูนย์ถึง 50 ล้านดอลลาร์ กับ 50 ล้านถึง 100 ล้านดอลลาร์ Zhang เปรียบเทียบกับการปีนหน้าผา

"ตอนแรกคุณอยู่สูงจากพื้นแค่ฟุตเดียว จะตกก็ไม่เป็นไร แต่พอเงยหน้าขึ้นมาอีกที คุณก็สูงพอแล้ว ความรับผิดชอบมากขึ้น ของบนบ่าหนักขึ้น แต่ความกดดันและความตื่นเต้นแบบนี้แหละคือเหตุผลที่คุณตัดสินใจปีนตั้งแต่แรก"

คำแนะนำที่ Zhang มักให้กับผู้ก่อตั้งรุ่นใหม่หมุนรอบแนวคิดที่เขาเรียกว่า "Unknown Unknowns" หรือสิ่งที่เราไม่รู้แม้กระทั่งว่าเราไม่รู้

"ถ้าคุณรู้ว่าตัวเองไม่รู้อะไร อย่างน้อยคุณก็มีเส้นทางไปหาคำตอบได้ แต่ถ้าคุณไม่รู้ด้วยซ้ำว่าตัวเองไม่รู้อะไร ตรงนั้นแหละคือจุดมืด วิธีเดียวที่จะส่องให้เห็นคือต้องกล้าเปิดใจกับคนรอบตัว"

บทบาทของที่ปรึกษาและมุมมองต่อ AI

Zhang บอกตรง ๆ ว่าอยากให้ Sanas ไม่ใช่สตาร์ทอัพแรกของตัวเอง เพราะมั่นใจว่าจะหลีกเลี่ยงความผิดพลาดที่ทำให้บริษัทเดินช้ากว่าที่ควรได้ สิ่งที่ทดแทนได้คือการเลือกที่ปรึกษา (Mentor) ที่จับความผิดพลาดออกตั้งแต่ระยะแรก

ในประเด็น AI กับงานสายเทคนิค Zhang มีมุมมองสวนกระแสว่ารสนิยม (Taste) และฝีมือเชิงช่าง (Craftsmanship) จะยิ่งสำคัญขึ้นในยุคที่ทุกคนเขียนโค้ดด้วย AI ได้

"AI ควรทำให้คนรุ่นใหม่กับคนรุ่นใหญ่ใกล้กันมากขึ้น คุณมีอิสระในการตัดสินใจมากขึ้น แต่ก็ต้องเซ็นชื่อตัวเองลงบนทุกอย่างที่ส่งออกไป ไม่ว่าจะ Vibe Code หรือเขียนเองก็ตาม"

สำหรับใครที่กำลังมองหาว่าจะสร้างอะไรดี เรื่องของ Zhang เป็นการเตือนว่าธุรกิจที่ดีที่สุดไม่ได้เริ่มจากเทคโนโลยี แต่เริ่มจากเพื่อนคนหนึ่งที่เล่าปัญหาที่ยังไม่มีใครแก้ให้ฟัง ไอเดียระดับพันล้านดอลลาร์อาจซ่อนอยู่ในบทสนทนาธรรมดา ๆ ที่เกือบจะไม่ได้คุยกัน

ที่มา: Inc., TechCrunch, Slator, Sanas

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

หัวกะทิร่วมสร้าง AI ที่พัฒนาตัวเองได้ ‘Recursive Superintelligence’ ภายใน 6 เดือนระดมทุนไปแล้วกว่า $650 ล้าน จาก GV, Greycroft, Nvidia และ AMD

Recursive Superintelligence สตาร์ทอัพอายุ 6 เดือนของ Richard Socher และ 7 นักวิจัยจาก OpenAI, Meta, Google ระดมทุน 650 ล้านดอลลาร์ มูลค่าทะลุ 4,000 ล้าน เพื่อสร้าง AI ที่พัฒนาตัวเอ...

Responsive image

สตาร์ทอัพ ‘Orbital’ เตรียมสร้าง Data Center บนอวกาศ ตั้งเป้ายิงดาวเทียม GPU ตัวแรกปี 2027 ผ่านจรวด Falcon 9 ของ SpaceX

Orbital สตาร์ทอัพหนุนโดย A16z เปิดแผนสร้าง Data Center บนอวกาศ ใช้ดาวเทียมขนาดเล็ก 10,000 ดวงรัน AI Inference ด้วยพลังแสงอาทิตย์ เตรียมทดสอบจริงปี 2027 ผ่านจรวด Falcon 9 ของ SpaceX...

Responsive image

‘Fervo Energy’ สตาร์ทอัพพลังงานความร้อนใต้พิภพ เปิดแผน IPO ระดมทุน $1.3 พันล้าน จุดประกายคลื่นพลังงานสะอาดยุค AI

Fervo Energy สตาร์ทอัพพลังงานความร้อนใต้พิภพยุคใหม่ที่มี Google และ Bill Gates หนุน ยื่น IPO บน Nasdaq ใต้ชื่อย่อ FRVO ระดมทุนสูงสุด 1.3 พันล้านดอลลาร์ ตั้งเป้ามูลค่าบริษัทหลังเข้า...