„Glas kao sučelje vrlo je moćan.” ali za Kumara Rangarajana, suosnivača i izvršnog direktora tvrtke Slang Labs, upotreba glasa i glasovnih pomoćnika na uređajima poput Alexa ili čak naših telefona je ograničen.
To je upravo ono što Slang Labs želi promijeniti sa Slang Convom, glasovnim asistentom kao uslužnom platformom. Ovaj proizvod omogućuje drugim robnim markama da kreiraju i dodaju vlastite višejezične glasovne asistente u svoje aplikacije čime poboljšavaju korisničko iskustvo.
Dominacija engleskog na indijskom internetu tijekom godina otežala je većini koja se ne osjeća dobro u navigaciji ili u potpunosti korištenju korisničkih sučelja. Također, da stvar bude gora, tipkovnice na regionalnom jeziku nisu jednostavne za upotrebu. Sve ovo čini glasovne asistente najboljim rješenjem za one koji nisu digitalni urođenici.
“Zapravo sam bio skeptican u Alexu. Bio sam poput onoga tko želi razgovarati sa govornikom. Ali vidio sam svoje roditelje i vidio da moja su djeca to voljela. Shvatio sam da se Alexa nije nešto čega su se bojali jer je to glas s kojim bi mogli razgovarati. To nije vanzemaljac ili novi koncept ”, kaže Rangarajan za indianexpress.com, objašnjavajući kako su mislili na ovu ideju.
No, prema njegovu mišljenju, Alexa i pametni zvučnici ograničeni su slučaj upotrebe glasa s obzirom da se većina transakcija za korisnike odvija na aplikacijama. „Što ako bismo se mogli povezati s tim novim iskustvom glasa i povezati ga s tim aplikacijama te ih učiniti dostupnijima i prijateljskijima za potrošače. I da napravim korak dalje, ako korisnici mogu razgovarati s njima na više jezika “, objašnjava Rangarajan.
Slang Labs sa sjedištem u Bengaluruu pokrenuli su Rangarajan još 2017. godine i dvojica njegovih suosnivača Giridhar Murthy i Satish Gupta, svi nekadašnje kolege iz IBM-a. Murthy i Rangarajan prethodno su izgradili Little Eye Labs, koji je Facebook kupio još 2013. godine.
Njihova potraga za rješenjem plug-and-play glasovnog asistenta za aplikacije rezultirala je “duboko tehnološkim proizvodom” za koji Slang Labs vjeruje da može pomoći brandovima da stvore “višejezičnu pomoć u aplikaciji”. “Naš sustav omogućuje bilo kojoj robnoj marki da upotrebi ove unaprijed izgrađene glasovne asistente u svojim aplikacijama u nekoliko minuta”, objašnjava.
Za sada se tvrtka fokusira na četiri domene – e-trgovini, putovanjima, osiguranju i zapošljavanju. Ne otkrivajući imena, tvrtka tvrdi da će neke marke uskoro početi raditi s glasovnim asistentima na temelju njihove platforme.
“S Slangom Convom prihvatili smo pristup domeni prema domeni. Na primjer, u svijetu e-trgovine uzeli smo sve podatke o stvarima koje smo sada naučili i izgradili modele AI niže razine koji su potrebni za stvaranje ovog iskustva. Izradili smo najčešće potrebne modele. U osnovi su ti pomoćnici zajedničke, ponovljive komponente “, kaže on, dodajući da su za pokretanje potrebni samo dani.
Stvaranjem modela specifičnih za domenu, klijenti tvrtke Slang Labs tada mogu prilagoditi ono što žele. Na primjer, za tvrtke za e-trgovinu primarna briga su proizvodi ili SKU koji mogu biti specifični za njih. Korištenjem usluge poput Slang Conve, njihov se glasovni asistent može usredotočiti na SKU-ove i ne moraju brinuti o nijansama same gradnje sustava.
Trenutno platforma podržava pet jezika: indijski naglašeni engleski, hindski, tamilski, kanadski i malajalamski. Tvrtka planira dodati gudžarati, bengalski, maratski i teluški jezik kao sljedeći skup jezika.
SlangConva omogućuje prijevod zahtjeva na lokalni jezik i na engleski jezik radi lakše obrade u pozadini. „Iako korisnik govori na svom jeziku, recimo Tamil, asistent implicitno sve pretvara u engleski. Tako iz perspektive aplikacije mogu dobiti sve potrebne podatke na engleskom jeziku. Ovo je zapravo velik izazov za mnoge marke, jer ne možete održavati svoje SKU-ove na svakom pojedinom jeziku ”, ističe Rangarajan.
Tvrtka tvrdi da je izgradila vlastiti stog za obradu prirodnog jezika (NLP), premda su započeli koristeći rješenja trećih strana, no ubrzo su shvatili da postoje ograničenja. Ideja nije bila samo izgraditi njihov NLP, već osigurati da se također može programirati, tako da se može skalirati između različitih vrsta aplikacija i različitih vrsta domena.
„Željeli smo osigurati da glasovna iskustva djeluju vrlo, vrlo brzo; da je iskustvo u stvarnom vremenu dobro, tako da čim završite s govorom, dobijete odgovor. “