
Shawn Zhang นั่งคุยกับ Raul เพื่อนสนิทที่เพิ่งย้ายกลับไปทำงานคอลเซ็นเตอร์ (Call Center) ที่นิการากัว คาดว่าจะได้ฟังเรื่องบ่นลูกค้าจอมเรื่องมาก แต่สิ่งที่ Raul เล่ากลับเป็นจุดเริ่มต้นของสตาร์ทอัพที่ทั้งโตเร็วและถูกถกเถียงมากที่สุดในวงการปัญญาประดิษฐ์ (AI) ตอนนี้
ลูกค้าฝั่งอเมริกาบ่นเรื่องสำเนียงของ Raul จนกลายเป็นคะแนนติดลบในรายงานประจำเดือน ค่าจ้างลดลง และทุกวันที่ต้องเข้างาน 8 ชั่วโมงคือฝันร้ายที่รู้ตัวว่ายังไม่ทันพูดจบประโยค คนปลายสายก็ตัดสินเสร็จแล้ว บทสนทนาวันนั้นกลายเป็น Sanas สตาร์ทอัพแห่งเมืองแพโลอัลโต (Palo Alto) ที่ Zhang ร่วมก่อตั้งตอนเรียนปี 2 ที่มหาวิทยาลัย Stanford เพื่อสร้างเทคโนโลยีแปลงสำเนียงแบบเรียลไทม์เจ้าแรกของโลก ตามรายงานของ Inc.
Sanas เปิดตัวในปี 2020 พอดีกับช่วงที่ COVID ส่งนักศึกษากลับบ้าน Zhang เล่าว่าจังหวะนั้นเองที่ผลักดันให้เขาเลิกทำโปรเจกต์เสริมแบบครึ่ง ๆ กลาง ๆ และลงมือสร้างของจริง
ผลลัพธ์ที่ตามมาคือตัวเลขที่ทำให้สตาร์ทอัพรุ่นเดียวกันต้องหันมามอง รายได้พุ่งจากศูนย์เป็น 62 ล้านดอลลาร์ภายใน 2 ปี กำลังจะแตะ 130 ล้านดอลลาร์ในปีนี้ มีผู้ใช้งานทะลุ 1 ล้านคน และระดมทุนสะสมไปแล้ว 121 ล้านดอลลาร์ โดยรอบล่าสุดเป็น Series B มูลค่า 65 ล้านดอลลาร์ที่นำโดย Quadrille Capital และ Teleperformance พร้อมประเมินมูลค่าบริษัทไว้กว่า 500 ล้านดอลลาร์ ตามรายงานของ TechCrunch
"คุณไม่ควรเริ่มจากการสร้างของเจ๋ง ๆ แล้วค่อยมาหาวิธีขาย นั่นคือสูตรของความหายนะ" Zhang บอก "แต่ถ้าคุณเจอความต้องการที่แท้จริง ไม่ว่าคุณจะถือเทคโนโลยีอะไร คุณก็มีธุรกิจ ตราบใดที่มีปัญหา ตราบนั้นก็มีธุรกิจ"
ก่อนหน้าจะเจอจุดนี้ Zhang ผ่านสิ่งที่เขาเรียกว่า "Pivot Hell" หรือยุคที่ต้องเปลี่ยนทิศทางบริษัทไปมาไม่จบสิ้น ทั้งการแข่งขัน Hackathon และไอเดียวันเสาร์อาทิตย์ที่ดูเท่แต่ไม่ติดตลาด Sanas ติดได้เพราะปัญหาเป็นเรื่องจริง วัดผลได้ และมีคนยอมจ่ายเพื่อแก้ไขมันอยู่แล้ว ในวงการคอลเซ็นเตอร์มีบริษัทถึงกับใช้คะแนนความหนาของสำเนียงในการคัดผู้สมัคร
เบื้องหลังของ Sanas คือ Edge AI หรือปัญญาประดิษฐ์ที่ประมวลผลบนเครื่องผู้ใช้ตรง ๆ โดยไม่ต้องส่งเสียงขึ้นคลาวด์ (Cloud) ระบบจะวิเคราะห์หน่วยเสียง (Phoneme) ของผู้พูดและแทนที่ด้วยหน่วยเสียงที่ตรงกับสำเนียงปลายทางที่ผู้ใช้เลือก ทั้งหมดนี้ทำได้ในเวลาหน่วงประมาณ 1 ใน 5 วินาที ซึ่งต่ำกว่าระดับที่หูคนทั่วไปจะจับได้
Sanas อ้างว่าเทรนโมเดลด้วยข้อมูลเสียงพูดกว่า 50 ล้านชุด รวบรวมจากพันธมิตรและนักพากย์เสียงในบริษัท จุดขายคือการเก็บอารมณ์ ตัวตน และลีลาการเน้นเสียง (Inflection) ของผู้พูดเอาไว้ พร้อมตัดเสียงสะท้อน (Reverb) และเสียงรบกวนรอบข้างไปในตัว
ลูกค้าปัจจุบันมีราว 50 รายในอุตสาหกรรมที่หลากหลาย ตั้งแต่สาธารณสุขไปจนถึงโลจิสติกส์และผู้ผลิตฮาร์ดแวร์ ที่น่าสนใจคือบริษัทรับจ้างงานภายนอก (Outsourcing) ระดับโลกอย่าง Alorica และ Teleperformance ถึงขั้นเข้ามาเป็นทั้งลูกค้าและผู้ลงทุน UPS และ DoorDash ก็เป็นชื่อที่ปรากฏในรายชื่อลูกค้าเช่นกัน ตามรายงานของ Retail Technology Innovation Hub
ทันทีที่ Sanas เริ่มเป็นที่รู้จัก ก็มีแฮชแท็กวิจารณ์บริษัทบนทวิตเตอร์ (Twitter) ขึ้นมา คนรู้จัก Zhang ทักหลังไมค์ถามตรง ๆ ว่ารู้สึกอายกับสิ่งที่ตัวเองสร้างหรือเปล่า ข้อกล่าวหาหลักคือ Sanas กำลังลบตัวตนของคนที่มีสำเนียงต่างจากสำเนียงอเมริกัน
นักวิชาการลงสนามด้วย Daily Titan ลงบทความหัวเรื่อง "Stop Sanas-tizing People of Color's Accents" ระบุว่าเทคโนโลยีนี้เป็นผลผลิตของวัฒนธรรมที่ยกย่องคนผิวขาวเหนือกลุ่มอื่น (White Supremacy) ที่บอกเป็นนัยว่าสำเนียงอเมริกันผิวขาวดีกว่าสำเนียงอื่น ฝั่ง UCLA Initiative to Study Hate เปิดโครงการวิจัยชื่อ "Sanas's AI White Voice" เพื่อตั้งคำถามว่าการใช้ AI แก้อคติ แทนที่จะแก้ที่ต้นเหตุของอคติ มันโอเคหรือไม่ ขณะที่ The Conversation เรียกเทคโนโลยีแนวนี้ว่าเทคโนโลยีที่ตั้งอยู่บนการกดขี่ที่ฝังลึกในตัวเอง
"คอมเมนต์เหล่านั้นทำให้ผู้ก่อตั้งทุกคนต้องหยุดคิด" Zhang ยอมรับ "แต่เราก็ได้รับข้อความจากผู้อพยพที่ร้องไห้บอกว่ารู้สึกว่าสำเนียงของตัวเองเป็นกำแพงมาหลายปี ข้อความพวกนี้คือเหตุผลที่เรายังสร้างต่อ"
Sharath Keshava Narayana ซึ่งภายหลังเข้ามาเป็น CEO และผู้ร่วมก่อตั้ง ก็เคยขึ้นรายการ ABC7 News ตอบโต้ประเด็นนี้ว่า "ผมไม่รู้ว่าจะเปลี่ยนโลกได้ไหม แต่ถ้าช่วยให้พนักงานคอลเซ็นเตอร์กลับบ้านด้วยรอยยิ้ม ไม่ถูกด่า ผมเอาทุกวัน"
เมื่อถูกถามถึงความต่างของการสเกลจากศูนย์ถึง 50 ล้านดอลลาร์ กับ 50 ล้านถึง 100 ล้านดอลลาร์ Zhang เปรียบเทียบกับการปีนหน้าผา
"ตอนแรกคุณอยู่สูงจากพื้นแค่ฟุตเดียว จะตกก็ไม่เป็นไร แต่พอเงยหน้าขึ้นมาอีกที คุณก็สูงพอแล้ว ความรับผิดชอบมากขึ้น ของบนบ่าหนักขึ้น แต่ความกดดันและความตื่นเต้นแบบนี้แหละคือเหตุผลที่คุณตัดสินใจปีนตั้งแต่แรก"
คำแนะนำที่ Zhang มักให้กับผู้ก่อตั้งรุ่นใหม่หมุนรอบแนวคิดที่เขาเรียกว่า "Unknown Unknowns" หรือสิ่งที่เราไม่รู้แม้กระทั่งว่าเราไม่รู้
"ถ้าคุณรู้ว่าตัวเองไม่รู้อะไร อย่างน้อยคุณก็มีเส้นทางไปหาคำตอบได้ แต่ถ้าคุณไม่รู้ด้วยซ้ำว่าตัวเองไม่รู้อะไร ตรงนั้นแหละคือจุดมืด วิธีเดียวที่จะส่องให้เห็นคือต้องกล้าเปิดใจกับคนรอบตัว"
Zhang บอกตรง ๆ ว่าอยากให้ Sanas ไม่ใช่สตาร์ทอัพแรกของตัวเอง เพราะมั่นใจว่าจะหลีกเลี่ยงความผิดพลาดที่ทำให้บริษัทเดินช้ากว่าที่ควรได้ สิ่งที่ทดแทนได้คือการเลือกที่ปรึกษา (Mentor) ที่จับความผิดพลาดออกตั้งแต่ระยะแรก
ในประเด็น AI กับงานสายเทคนิค Zhang มีมุมมองสวนกระแสว่ารสนิยม (Taste) และฝีมือเชิงช่าง (Craftsmanship) จะยิ่งสำคัญขึ้นในยุคที่ทุกคนเขียนโค้ดด้วย AI ได้
"AI ควรทำให้คนรุ่นใหม่กับคนรุ่นใหญ่ใกล้กันมากขึ้น คุณมีอิสระในการตัดสินใจมากขึ้น แต่ก็ต้องเซ็นชื่อตัวเองลงบนทุกอย่างที่ส่งออกไป ไม่ว่าจะ Vibe Code หรือเขียนเองก็ตาม"
สำหรับใครที่กำลังมองหาว่าจะสร้างอะไรดี เรื่องของ Zhang เป็นการเตือนว่าธุรกิจที่ดีที่สุดไม่ได้เริ่มจากเทคโนโลยี แต่เริ่มจากเพื่อนคนหนึ่งที่เล่าปัญหาที่ยังไม่มีใครแก้ให้ฟัง ไอเดียระดับพันล้านดอลลาร์อาจซ่อนอยู่ในบทสนทนาธรรมดา ๆ ที่เกือบจะไม่ได้คุยกัน
ที่มา: Inc., TechCrunch, Slator, Sanas
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด