อดีตนักเรียนสแตนฟอร์ดกำลังสร้างแอพเพื่อเปลี่ยนสำเนียงของคุณ
นักเรียนสแตนฟอร์ดได้ยินความเศร้าในน้ำเสียงของเพื่อนเมื่อเขาแบ่งปันข่าว
“ผมต้องลาออกจากงาน”
สำหรับพวกเขา มันไม่สมเหตุสมผลเลย เขาพูดภาษาอังกฤษและสเปนได้คล่อง เป็นมิตรมาก และเป็นผู้เชี่ยวชาญด้านวิศวกรรมระบบ ทำไมเขาไม่สามารถหยุดงานคอลเซ็นเตอร์ได้?
เพื่อนคนนี้กล่าวว่าสำเนียงของเขาทำให้ลูกค้าจำนวนมากเข้าใจเขาได้ยาก บางคนถึงกับด่าเพราะคำพูดของเขา
นักเรียนสามคนตระหนักว่าปัญหานั้นยิ่งใหญ่กว่าประสบการณ์ของเพื่อน ดังนั้นพวกเขาจึงก่อตั้งบริษัทสตาร์ทอัพขึ้นมาเพื่อแก้ปัญหา
ตอนนี้ บริษัท Sanas ของพวกเขากำลังทดสอบซอฟต์แวร์ที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ซึ่งมีจุดมุ่งหมายเพื่อขจัดการสื่อสารที่ผิดพลาดโดยการเปลี่ยนสำเนียงของผู้คนในแบบเรียลไทม์ ตัวอย่างเช่น พนักงานคอลเซ็นเตอร์ในฟิลิปปินส์สามารถพูดใส่ไมโครโฟนได้ตามปกติและลงเอยด้วยเสียงเหมือนคนจากแคนซัสไปยังลูกค้าในอีกด้านหนึ่ง
ผู้ก่อตั้งของสตาร์ทอัพกล่าวว่าคอลเซ็นเตอร์เป็นเพียงจุดเริ่มต้นเท่านั้น เว็บไซต์ของ บริษัท นำเสนอแผนการเป็น “Speech, Reimagined”
ในที่สุด พวกเขาหวังว่าแอพที่พวกเขากำลังพัฒนาจะถูกใช้โดยอุตสาหกรรมและบุคคลที่หลากหลาย พวกเขาสามารถช่วยให้แพทย์เข้าใจผู้ป่วยได้ดีขึ้นหรือช่วยให้ลูกหลานเข้าใจปู่ย่าตายายได้ดีขึ้น
“เรามีวิสัยทัศน์ที่ยิ่งใหญ่มากสำหรับ Sanas” CEO Maxim Serebryakov กล่าว
และสำหรับ Serebryakov และผู้ร่วมก่อตั้ง โครงการนี้เป็นโครงการส่วนบุคคล
ทั้งสามคนผู้ก่อตั้ง Sanas พบกันที่มหาวิทยาลัยสแตนฟอร์ด แต่เดิมพวกเขาทั้งหมดมาจากประเทศต่างๆ – Serebryakov ซึ่งปัจจุบันเป็น CEO มาจากรัสเซีย Andrés Pérez Soderi ซึ่งปัจจุบันดำรงตำแหน่ง Chief Financial Officer มาจากเวเนซุเอลา และ Shawn Zhang ซึ่งปัจจุบันดำรงตำแหน่ง Chief Technology Officer มาจากประเทศจีน
พวกเขาไม่ใช่นักเรียนสแตนฟอร์ดอีกต่อไป Serebryakov และ Pérez สำเร็จการศึกษาแล้ว Zhang ลาออกจากงานเพื่อมุ่งสร้าง Sanas ให้มีชีวิต
พวกเขาเปิดตัวบริษัทเมื่อปีที่แล้ว และตั้งชื่อให้บริษัทที่ออกเสียงได้ง่ายในภาษาต่างๆ “เพื่อเน้นย้ำภารกิจระดับโลกของเราและต้องการนำผู้คนมาใกล้ชิดกันมากขึ้น” Pérez กล่าว
ตลอดหลายปีที่ผ่านมา ทั้งสามคนกล่าวว่าพวกเขามีประสบการณ์ว่าสำเนียงสามารถเข้ามาขวางทางได้อย่างไร
“เราทุกคนมาจากพื้นเพระหว่างประเทศ เราได้เห็นโดยตรงว่าผู้คนปฏิบัติต่อคุณแตกต่างกันอย่างไรเพียงเพราะวิธีพูดของคุณ” Serebryakov กล่าว “บางครั้งก็ทำให้ใจสลาย”
จางกล่าวว่าแม่ของเขาซึ่งเดินทางมาสหรัฐอเมริกาเมื่อ 20 ปีที่แล้วจากประเทศจีนยังคงขอให้เขาคุยกับแคชเชียร์เมื่อพวกเขาไปซื้อของด้วยกันเพราะเธอเขินอาย
“นั่นเป็นเหตุผลหนึ่งที่ฉันเข้าร่วม Max และ Andrés ในการสร้างบริษัทนี้ โดยพยายามช่วยเหลือคนที่คิดว่าเสียงของพวกเขาไม่ได้ยินมากเท่ากับสำเนียงของพวกเขา” เขากล่าว
Serebryakov กล่าวว่าเขาได้เห็นวิธีที่พ่อแม่ของเขาได้รับการปฏิบัติที่โรงแรมเมื่อพวกเขามาเยี่ยมเขาที่สหรัฐอเมริกา ผู้คนตั้งสมมติฐานอย่างไรเมื่อได้ยินสำเนียงของพวกเขา
“พวกเขาพูดดังขึ้นเล็กน้อย พวกเขาเปลี่ยนพฤติกรรม” เขากล่าว
เปเรซบอกว่าหลังจากเข้าเรียนในโรงเรียนในอังกฤษ ตอนแรกเขามีปัญหาในการทำความเข้าใจสำเนียงอเมริกันเมื่อมาถึงสหรัฐอเมริกา
และอย่าให้เขาเริ่มต้นเกี่ยวกับสิ่งที่จะเกิดขึ้นเมื่อพ่อพยายามใช้ Amazon Alexa ที่ครอบครัวของเขามอบให้ในวันคริสต์มาส
“เรารู้ได้อย่างรวดเร็วว่าเมื่อ Alexa เปิดไฟตามสถานที่ต่างๆ ในบ้านและทำให้เป็นสีชมพู Alexa ไม่เข้าใจสำเนียงพ่อของฉันเลย” Pérez กล่าว
ภาษาอังกฤษเป็นภาษาที่ใช้กันอย่างแพร่หลายมากที่สุดในโลก มีคนพูดประมาณ 1.5 พันล้านคน และส่วนใหญ่ไม่ใช่เจ้าของภาษา ในสหรัฐอเมริกาประเทศเดียว ผู้คนนับล้านพูดภาษาอังกฤษเป็นภาษาที่สอง
นั่นเป็นการสร้างตลาดที่กำลังเติบโตสำหรับแอพที่ช่วยให้ผู้ใช้ฝึกการออกเสียงภาษาอังกฤษของพวกเขา แต่เสนาสใช้ AI ในแนวทางที่แตกต่างออกไป
หลักการ: แทนที่จะเรียนรู้การออกเสียงคำต่าง ๆ เทคโนโลยีสามารถทำสิ่งนั้นให้คุณได้ ไม่จำเป็นต้องฝึกอบรมการลดสำเนียงที่มีราคาแพงหรือใช้เวลานานอีกต่อไป และความเข้าใจก็แทบจะในทันที
Serebryakov กล่าวว่าเขารู้ว่าสำเนียงและตัวตนของผู้คนสามารถเชื่อมโยงอย่างใกล้ชิด และเขาเน้นว่าบริษัทไม่ได้พยายามลบสำเนียงหรือบอกเป็นนัยว่าวิธีพูดแบบหนึ่งดีกว่าอีกวิธีหนึ่ง
“เราอนุญาตให้ผู้คนไม่ต้องเปลี่ยนวิธีการพูดเพื่อดำรงตำแหน่ง ทำงาน เอกลักษณ์และสำเนียงเป็นสิ่งสำคัญ พวกเขาเกี่ยวพันกัน” เขากล่าว “คุณไม่เคยต้องการให้ใครเปลี่ยนสำเนียงเพียงเพื่อทำให้ใครบางคนพอใจ”
ในปัจจุบัน อัลกอริธึมของ Sanas สามารถแปลงสำเนียงอังกฤษเป็นและออกจากสำเนียงอเมริกัน ออสเตรเลีย อังกฤษ ฟิลิปปินส์ อินเดีย และสเปน และทีมกำลังวางแผนที่จะเพิ่มมากขึ้น พวกเขาสามารถเพิ่มสำเนียงใหม่ให้กับระบบโดยการฝึกอบรมโครงข่ายประสาทเทียมด้วยการบันทึกเสียงจากนักแสดงมืออาชีพและข้อมูลอื่น ๆ ซึ่งเป็นกระบวนการที่ใช้เวลาหลายสัปดาห์
ทีม Sanas เล่นการสาธิตสองครั้งสำหรับ CNN ในข้อหนึ่ง ได้ยินชายที่มีสำเนียงอินเดียอ่านประโยควรรณกรรมชุดหนึ่ง จากนั้นวลีเดียวกันเหล่านั้นจะถูกแปลงเป็นสำเนียงอเมริกัน:
อีกตัวอย่างหนึ่งมีวลีที่อาจพบได้ทั่วไปในการตั้งค่าคอลเซ็นเตอร์ เช่น “ถ้าคุณให้ชื่อนามสกุลและหมายเลขคำสั่งซื้อของคุณ เราสามารถดำเนินการแก้ไขให้คุณได้”
ผลลัพธ์ที่เน้นเสียงแบบอเมริกันนั้นฟังดูค่อนข้างเทียมและสูงส่ง เหมือนกับเสียงผู้ช่วยเสมือน เช่น Siri และ Alexa แต่ Pérez กล่าวว่าทีมกำลังทำงานเพื่อปรับปรุงเทคโนโลยี
“สำเนียงเปลี่ยนไป แต่น้ำเสียงยังคงอยู่” เขากล่าว “เรายังคงทำงานอย่างต่อเนื่องเพื่อสร้างผลลัพธ์ที่เป็นธรรมชาติ มีอารมณ์ และน่าตื่นเต้นที่สุดเท่าที่จะเป็นไปได้”
Pérez กล่าวว่าผลตอบรับจากคอลเซ็นเตอร์ที่เคยทดลองใช้เทคโนโลยีตั้งแต่เนิ่นๆ มาก่อนนั้นเป็นไปในเชิงบวก เพื่อให้มีความคิดเห็นที่ส่งบนเว็บไซต์ของพวกเขาเป็นคำกระจายเกี่ยวกับกิจการของพวกเขา
และพวกเขากล่าวว่าแผนของพวกเขาสำหรับ บริษัท ได้รับเงินทุน 5.5 ล้านดอลลาร์จากนักลงทุนเมื่อต้นปีนี้
นั่นทำให้ Sanas สามารถขยายพนักงานได้ พนักงานของบริษัทในพาโลอัลโตในแคลิฟอร์เนียส่วนใหญ่มาจากภูมิหลังระหว่างประเทศ และนั่นไม่ใช่เรื่องบังเอิญ Serebryakov กล่าว
“สิ่งที่เราสร้างนั้นโดนใจผู้คนมากมาย แม้แต่คนที่เราจ้าง … การได้เห็นมันน่าตื่นเต้นจริงๆ” เขากล่าว
ในขณะที่บริษัทกำลังเติบโต อาจต้องใช้เวลาสักระยะก่อนที่ Sanas จะปรากฏในแอพสโตร์หรือแสดงบนโทรศัพท์มือถือที่อยู่ใกล้คุณ
ทีมงานกล่าวว่าขณะนี้พวกเขากำลังทำงานร่วมกับบริษัทเอาท์ซอร์สคอลเซ็นเตอร์รายใหญ่กว่านั้น และเลือกเปิดตัวช้ากว่าสำหรับผู้ใช้แต่ละราย เพื่อให้พวกเขาสามารถปรับแต่งเทคโนโลยีและรับรองความปลอดภัยได้
.แต่ในที่สุด พวกเขาหวังว่าทุกคนที่ต้องการจะใช้ Sanas ในด้านอื่นๆ เช่นกัน
เปเรซมองเห็นว่ามันมีบทบาทสำคัญในการช่วยให้ผู้คนสื่อสารกับแพทย์ของตน
“วินาทีใดที่สูญเสียไปเพราะความเข้าใจผิดเนื่องจากเวลาที่เสียไปหรือการส่งข้อความที่ไม่ถูกต้องก็อาจส่งผลกระทบอย่างมาก” เขากล่าว “เราต้องการให้แน่ใจว่าไม่มีอะไรหายไปในการแปล”
สักวันหนึ่ง เขากล่าวว่ามันสามารถช่วยผู้คนในการเรียนรู้ภาษา ปรับปรุงการพากย์ในภาพยนตร์ และช่วยให้ลำโพงอัจฉริยะในบ้านและผู้ช่วยเสียงในรถยนต์เข้าใจสำเนียงต่างๆ
และไม่ใช่แค่ในภาษาอังกฤษเท่านั้น ทีม Sanas ยังหวังที่จะเพิ่มภาษาอื่นๆ ลงในอัลกอริทึมด้วย
ผู้ร่วมก่อตั้งทั้งสามยังคงทำงานเกี่ยวกับรายละเอียด แต่พวกเขากล่าวว่าเทคโนโลยีนี้จะทำให้การสื่อสารดีขึ้นได้อย่างไรในอนาคต เป็นสิ่งหนึ่งที่เข้าใจได้ง่าย