‘Sanas’ สตาร์ทอัพแปลงสำเนียงเรียลไทม์ ความสำเร็จที่แลกมาด้วยข้อหาลบตัวตน

Shawn Zhang นั่งคุยกับ Raul เพื่อนสนิทที่เพิ่งย้ายกลับไปทำงานคอลเซ็นเตอร์ (Call Center) ที่นิการากัว คาดว่าจะได้ฟังเรื่องบ่นลูกค้าจอมเรื่องมาก แต่สิ่งที่ Raul เล่ากลับเป็นจุดเริ่มต้นของสตาร์ทอัพที่ทั้งโตเร็วและถูกถกเถียงมากที่สุดในวงการปัญญาประดิษฐ์ (AI) ตอนนี้

ลูกค้าฝั่งอเมริกาบ่นเรื่องสำเนียงของ Raul จนกลายเป็นคะแนนติดลบในรายงานประจำเดือน ค่าจ้างลดลง และทุกวันที่ต้องเข้างาน 8 ชั่วโมงคือฝันร้ายที่รู้ตัวว่ายังไม่ทันพูดจบประโยค คนปลายสายก็ตัดสินเสร็จแล้ว บทสนทนาวันนั้นกลายเป็น Sanas สตาร์ทอัพแห่งเมืองแพโลอัลโต (Palo Alto) ที่ Zhang ร่วมก่อตั้งตอนเรียนปี 2 ที่มหาวิทยาลัย Stanford เพื่อสร้างเทคโนโลยีแปลงสำเนียงแบบเรียลไทม์เจ้าแรกของโลก ตามรายงานของ Inc.

จากการระบาดของ COVID สู่ตัวเลขที่นักลงทุนตามล่า

Sanas เปิดตัวในปี 2020 พอดีกับช่วงที่ COVID ส่งนักศึกษากลับบ้าน Zhang เล่าว่าจังหวะนั้นเองที่ผลักดันให้เขาเลิกทำโปรเจกต์เสริมแบบครึ่ง ๆ กลาง ๆ และลงมือสร้างของจริง

ผลลัพธ์ที่ตามมาคือตัวเลขที่ทำให้สตาร์ทอัพรุ่นเดียวกันต้องหันมามอง รายได้พุ่งจากศูนย์เป็น 62 ล้านดอลลาร์ภายใน 2 ปี กำลังจะแตะ 130 ล้านดอลลาร์ในปีนี้ มีผู้ใช้งานทะลุ 1 ล้านคน และระดมทุนสะสมไปแล้ว 121 ล้านดอลลาร์ โดยรอบล่าสุดเป็น Series B มูลค่า 65 ล้านดอลลาร์ที่นำโดย Quadrille Capital และ Teleperformance พร้อมประเมินมูลค่าบริษัทไว้กว่า 500 ล้านดอลลาร์ ตามรายงานของ TechCrunch

"คุณไม่ควรเริ่มจากการสร้างของเจ๋ง ๆ แล้วค่อยมาหาวิธีขาย นั่นคือสูตรของความหายนะ" Zhang บอก "แต่ถ้าคุณเจอความต้องการที่แท้จริง ไม่ว่าคุณจะถือเทคโนโลยีอะไร คุณก็มีธุรกิจ ตราบใดที่มีปัญหา ตราบนั้นก็มีธุรกิจ"

ก่อนหน้าจะเจอจุดนี้ Zhang ผ่านสิ่งที่เขาเรียกว่า "Pivot Hell" หรือยุคที่ต้องเปลี่ยนทิศทางบริษัทไปมาไม่จบสิ้น ทั้งการแข่งขัน Hackathon และไอเดียวันเสาร์อาทิตย์ที่ดูเท่แต่ไม่ติดตลาด Sanas ติดได้เพราะปัญหาเป็นเรื่องจริง วัดผลได้ และมีคนยอมจ่ายเพื่อแก้ไขมันอยู่แล้ว ในวงการคอลเซ็นเตอร์มีบริษัทถึงกับใช้คะแนนความหนาของสำเนียงในการคัดผู้สมัคร

เทคโนโลยีที่อยู่บนเครื่องผู้ใช้ ไม่ใช่บนคลาวด์

เบื้องหลังของ Sanas คือ Edge AI หรือปัญญาประดิษฐ์ที่ประมวลผลบนเครื่องผู้ใช้ตรง ๆ โดยไม่ต้องส่งเสียงขึ้นคลาวด์ (Cloud) ระบบจะวิเคราะห์หน่วยเสียง (Phoneme) ของผู้พูดและแทนที่ด้วยหน่วยเสียงที่ตรงกับสำเนียงปลายทางที่ผู้ใช้เลือก ทั้งหมดนี้ทำได้ในเวลาหน่วงประมาณ 1 ใน 5 วินาที ซึ่งต่ำกว่าระดับที่หูคนทั่วไปจะจับได้

Sanas อ้างว่าเทรนโมเดลด้วยข้อมูลเสียงพูดกว่า 50 ล้านชุด รวบรวมจากพันธมิตรและนักพากย์เสียงในบริษัท จุดขายคือการเก็บอารมณ์ ตัวตน และลีลาการเน้นเสียง (Inflection) ของผู้พูดเอาไว้ พร้อมตัดเสียงสะท้อน (Reverb) และเสียงรบกวนรอบข้างไปในตัว

ลูกค้าปัจจุบันมีราว 50 รายในอุตสาหกรรมที่หลากหลาย ตั้งแต่สาธารณสุขไปจนถึงโลจิสติกส์และผู้ผลิตฮาร์ดแวร์ ที่น่าสนใจคือบริษัทรับจ้างงานภายนอก (Outsourcing) ระดับโลกอย่าง Alorica และ Teleperformance ถึงขั้นเข้ามาเป็นทั้งลูกค้าและผู้ลงทุน UPS และ DoorDash ก็เป็นชื่อที่ปรากฏในรายชื่อลูกค้าเช่นกัน ตามรายงานของ Retail Technology Innovation Hub

แรงต้านที่ตามมาทันที

ทันทีที่ Sanas เริ่มเป็นที่รู้จัก ก็มีแฮชแท็กวิจารณ์บริษัทบนทวิตเตอร์ (Twitter) ขึ้นมา คนรู้จัก Zhang ทักหลังไมค์ถามตรง ๆ ว่ารู้สึกอายกับสิ่งที่ตัวเองสร้างหรือเปล่า ข้อกล่าวหาหลักคือ Sanas กำลังลบตัวตนของคนที่มีสำเนียงต่างจากสำเนียงอเมริกัน

นักวิชาการลงสนามด้วย Daily Titan ลงบทความหัวเรื่อง "Stop Sanas-tizing People of Color's Accents" ระบุว่าเทคโนโลยีนี้เป็นผลผลิตของวัฒนธรรมที่ยกย่องคนผิวขาวเหนือกลุ่มอื่น (White Supremacy) ที่บอกเป็นนัยว่าสำเนียงอเมริกันผิวขาวดีกว่าสำเนียงอื่น ฝั่ง UCLA Initiative to Study Hate เปิดโครงการวิจัยชื่อ "Sanas's AI White Voice" เพื่อตั้งคำถามว่าการใช้ AI แก้อคติ แทนที่จะแก้ที่ต้นเหตุของอคติ มันโอเคหรือไม่ ขณะที่ The Conversation เรียกเทคโนโลยีแนวนี้ว่าเทคโนโลยีที่ตั้งอยู่บนการกดขี่ที่ฝังลึกในตัวเอง

"คอมเมนต์เหล่านั้นทำให้ผู้ก่อตั้งทุกคนต้องหยุดคิด" Zhang ยอมรับ "แต่เราก็ได้รับข้อความจากผู้อพยพที่ร้องไห้บอกว่ารู้สึกว่าสำเนียงของตัวเองเป็นกำแพงมาหลายปี ข้อความพวกนี้คือเหตุผลที่เรายังสร้างต่อ"

Sharath Keshava Narayana ซึ่งภายหลังเข้ามาเป็น CEO และผู้ร่วมก่อตั้ง ก็เคยขึ้นรายการ ABC7 News ตอบโต้ประเด็นนี้ว่า "ผมไม่รู้ว่าจะเปลี่ยนโลกได้ไหม แต่ถ้าช่วยให้พนักงานคอลเซ็นเตอร์กลับบ้านด้วยรอยยิ้ม ไม่ถูกด่า ผมเอาทุกวัน"

ปีนหน้าผาที่ความสูงต่างกัน

เมื่อถูกถามถึงความต่างของการสเกลจากศูนย์ถึง 50 ล้านดอลลาร์ กับ 50 ล้านถึง 100 ล้านดอลลาร์ Zhang เปรียบเทียบกับการปีนหน้าผา

"ตอนแรกคุณอยู่สูงจากพื้นแค่ฟุตเดียว จะตกก็ไม่เป็นไร แต่พอเงยหน้าขึ้นมาอีกที คุณก็สูงพอแล้ว ความรับผิดชอบมากขึ้น ของบนบ่าหนักขึ้น แต่ความกดดันและความตื่นเต้นแบบนี้แหละคือเหตุผลที่คุณตัดสินใจปีนตั้งแต่แรก"

คำแนะนำที่ Zhang มักให้กับผู้ก่อตั้งรุ่นใหม่หมุนรอบแนวคิดที่เขาเรียกว่า "Unknown Unknowns" หรือสิ่งที่เราไม่รู้แม้กระทั่งว่าเราไม่รู้

"ถ้าคุณรู้ว่าตัวเองไม่รู้อะไร อย่างน้อยคุณก็มีเส้นทางไปหาคำตอบได้ แต่ถ้าคุณไม่รู้ด้วยซ้ำว่าตัวเองไม่รู้อะไร ตรงนั้นแหละคือจุดมืด วิธีเดียวที่จะส่องให้เห็นคือต้องกล้าเปิดใจกับคนรอบตัว"

บทบาทของที่ปรึกษาและมุมมองต่อ AI

Zhang บอกตรง ๆ ว่าอยากให้ Sanas ไม่ใช่สตาร์ทอัพแรกของตัวเอง เพราะมั่นใจว่าจะหลีกเลี่ยงความผิดพลาดที่ทำให้บริษัทเดินช้ากว่าที่ควรได้ สิ่งที่ทดแทนได้คือการเลือกที่ปรึกษา (Mentor) ที่จับความผิดพลาดออกตั้งแต่ระยะแรก

ในประเด็น AI กับงานสายเทคนิค Zhang มีมุมมองสวนกระแสว่ารสนิยม (Taste) และฝีมือเชิงช่าง (Craftsmanship) จะยิ่งสำคัญขึ้นในยุคที่ทุกคนเขียนโค้ดด้วย AI ได้

"AI ควรทำให้คนรุ่นใหม่กับคนรุ่นใหญ่ใกล้กันมากขึ้น คุณมีอิสระในการตัดสินใจมากขึ้น แต่ก็ต้องเซ็นชื่อตัวเองลงบนทุกอย่างที่ส่งออกไป ไม่ว่าจะ Vibe Code หรือเขียนเองก็ตาม"

สำหรับใครที่กำลังมองหาว่าจะสร้างอะไรดี เรื่องของ Zhang เป็นการเตือนว่าธุรกิจที่ดีที่สุดไม่ได้เริ่มจากเทคโนโลยี แต่เริ่มจากเพื่อนคนหนึ่งที่เล่าปัญหาที่ยังไม่มีใครแก้ให้ฟัง ไอเดียระดับพันล้านดอลลาร์อาจซ่อนอยู่ในบทสนทนาธรรมดา ๆ ที่เกือบจะไม่ได้คุยกัน

ที่มา: Inc., TechCrunch, Slator, Sanas

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

รู้จัก Project Prometheus สตาร์ทอัพหมื่นล้านของ Jeff Bezos พัฒนาวิศวกร AI ที่เข้าใจพื้นผิวและกฎฟิสิกส์

Jeff Bezos เปิดใจครั้งแรกเรื่อง Project Prometheus สตาร์ทอัพมูลค่า 41,000 ล้านดอลลาร์ ยืนยันไม่ได้ทำหุ่นยนต์ แต่กำลังสร้าง 'วิศวกรทั่วไปแบบ AI' ที่เข้าใจโลกกายภาพและพลิกโฉมการออกแบ...

Responsive image

หัวกะทิร่วมสร้าง AI ที่พัฒนาตัวเองได้ ‘Recursive Superintelligence’ ภายใน 6 เดือนระดมทุนไปแล้วกว่า $650 ล้าน จาก GV, Greycroft, Nvidia และ AMD

Recursive Superintelligence สตาร์ทอัพอายุ 6 เดือนของ Richard Socher และ 7 นักวิจัยจาก OpenAI, Meta, Google ระดมทุน 650 ล้านดอลลาร์ มูลค่าทะลุ 4,000 ล้าน เพื่อสร้าง AI ที่พัฒนาตัวเอ...

Responsive image

สตาร์ทอัพ ‘Orbital’ เตรียมสร้าง Data Center บนอวกาศ ตั้งเป้ายิงดาวเทียม GPU ตัวแรกปี 2027 ผ่านจรวด Falcon 9 ของ SpaceX

Orbital สตาร์ทอัพหนุนโดย A16z เปิดแผนสร้าง Data Center บนอวกาศ ใช้ดาวเทียมขนาดเล็ก 10,000 ดวงรัน AI Inference ด้วยพลังแสงอาทิตย์ เตรียมทดสอบจริงปี 2027 ผ่านจรวด Falcon 9 ของ SpaceX...