
Témy hlasové vyhľadávanie a hlasoví asistenti sú možno na Slovensku nové. Vo svete a špeciálne v gigantických firmách ako Google či Apple sú však celé tímy, ktoré riešia vývoj len v tejto oblasti.
Naša bývalá kolegyňa Majka Šlachtičová sa uplatnila ako projektová manažérka vo firme Globalme v Kanade. Téma hlasová asistencia jej nie je vzdialená, pretože Globalme pomáha okrem iných aj veľkým hráčom práve so zberom dát (nahrávok hlasu s rôznymi prízvukmi) po celom svete a s testovaním, či hlasoví asistenti rozpoznajú hlas s prízvukom.
Globalme pripravila pre Washington Post výskum, z ktorého vyplýva, že Google Assistant aj Alexa majú stále veľa problémov s rozpoznávaním angličtiny s rôznymi prízvukmi. Aj ľudia, ktorí žijú v USA od narodenia, no majú napríklad južanský prízvuk, dostávajú od asistenta Google Home o 3 % nepresnejšie reakcie ako tí s prízvukom zo západu. Horšie sú na tom ľudia, pre ktorých angličtina nie je materinský jazyk a ich prvý jazyk je napr. čínsky alebo španielsky (indický prízvuk bol na tom celkom dobre). Alexa v takýchto prípadoch zaznamenáva až o 30 % viac nepresností.

Aby sa umelá inteligencia za hlasovými asistentami naučila rozpoznávať aj reč s prízvukom, potrebuje mať „napočúvaných“ viac ľudí s prízvukom.
Alexa dnes hovorí anglicky, nemecky, japonsky a francúzsky. Google Assistant anglicky, nemecky, japonsky, francúzsky, taliansky a do konca roka 2018 má hovoriť ďalšími 30-timi jazykmi (takisto rozumieť im).
Podľa Yaga Dosona, 33-ročného morského biológa žijúceho v Kalifornii a hovoriaceho 13 rokov po anglicky, „…ste v spoločnosti viac zdržanlivý používať hlasového asistenta, lebo sa obávate, že vám nebude rozumieť a ľudia si z vás budú robiť žarty“. Fakt, že pri rôznych prízvukoch u ľudí, pre ktorých angličtina nie je materinský jazyk, je presnosť rozpoznania okolo 80 %, teda môže byť zásadná prekážka pre používateľov.
S Majkou Šlachtičovou z Globalme sme sa porozprávali, akým výzvam čelí v jej práci.
Povedz nám niečo o spoločnosti, v ktorej aktuálne pôsobíš.
Globalme je kanadská spoločnosť, v ktorej pracujú ľudia 26 národností. Spoločnosť založili Hanna Golota (pôvodom z Poľska) a Emre Akkas (pôvodom z Turecka) v Portlande, Oregon, USA, pôvodne ako lokalizačnú firmu. Avšak krátko na to sa z malého Globalme stala spoločnosť zaoberajúca sa nielen lokalizáciou, ale aj testovaním a zberom dát. Aj vďaka Hanne a Emremu máme všetci vášeň pre jazyky a technológie. V Britskej Kolumbii patríme už tretí rok za sebou k prvej stovke najrýchlejšie rastúcich technologických firiem, a taktiež sme jednou z najväčších firiem vlastnených ženou. Našimi službami napomáhame vývoju najnovších osobných asistentov, inteligentných domácich zariadení, smart hodiniek či internet of things.
Ako tvoja práca súvisí s hlasovým vyhľadávaním?
Naša spoločnosť sa zaoberá zberom dát, ktorý je neodmysliteľnou súčasťou vývoja nových technológií. Apple by nedokázal vyvinúť novú face-recognition technológiu bez zberu obrovského množstva fotografií ľudí v rôzych štádiach rastu vlasov, rôznych etnických skupín či v rôznych prostrediach (napríklad cez deň, podvečer, večer alebo v noci). Hlasové technológie ako Alexa od Amazonu by neboli schopné odpovedať na jednotlivé hlasové pokyny bez zberu tisícok hodín reči od ľudí s rôznym akcentom, rečovými vadami, v rôznych jazykoch, s rôznymi hlasmi alebo hudbou hrajúcou v pozadí, a tak ďalej.
Zber dát je však len jednou časťou, ktorou v Globalme pomáhame pri vývoji technológie. V každom stupni vývoja technológií a produktov je nevyhnutné testovanie, keď na rad prichádzajú reálni budúci používatelia, v reálnych situáciách (napríklad testovanie hlasovej technológie na mobile v obývačke pri zapnutej hudbe a otvorenom okne). Čo ak nový softvér vôbec nereaguje na určité pokyny alebo tiché hlasy? Može to naznačovať, že na vývoj určitej črty je potrebné širšie spektrum dát, aby sa zabezpečila táto funkcionalita. Pravidelné testovanie reálnymi používateľmi v rôznych štádiách vývoja umožní odhaliť nedostatky.
Súčasťou mojej práce je zabezpečiť, aby spoločnosti, ktoré nové technológie vyvíjajú, mali dostatok kvalitných dát (či už raw alebo čistých) na vývoj, a zároveň aby boli technológie testované skutočnými budúcimi používateľmi v reálnych situáciách.
Pracuješ v Kanade, ale cestuješ po celom svete. Ako vnímaš trend hlasového vyhľadávania a zariadení ovládaných hlasom vo svete?
Moja práca si vyžaduje cestovanie po svete najmä kvôli zabezpečeniu kvalitných dát a testovacích možností pre firmy, ktoré vyvíjajú softvér. Každý z nás predsa ocení, ak môže používať svoj rodný jazyk pri vyhľadávaní alebo používaní smart zariadení a nie je limitovaný len svetovými jazykmi ako je angličtina a čínština.
Práve v krajinách, ktorých jazyky boli jednými z prvých pri vývoji nových technológií, je hlasové vyhľadávanie veľkým trendom. Na to však človek nemusí byť ani odborníkom v tejto oblasti. Stačí sa obzrieť okolo seba – všade, kde ľudia neťukajú do telefónov, ale rozprávajú sa „sami so sebou“, sú tie krajiny, kde je hlasové vyhľadávanie už normálnou súčasťou každodenného života. Samozrejme, netýka sa to len mladšej generácie, práve naopak, všetky generácie tomuto trendu podliehajú stále viac a viac.
Vieš povedať, aké firmy sa hlasovému vyhľadávaniu a zariadeniam ovládaným hlasom venujú?
Vo všeobecnosti sa dá povedať, že vývojom nového softvéru sa zaoberá hromadne veľké množstvo spoločností. Možným prekvapením však je, že i veľkí giganti ako Apple či Google nedokážu pokryť celý vývoj u seba a často spolupracujú s menšími softvérovými firmami. Tie ďalej spolupracujú so spoločnosťami ako je napríklad Globalme pri zbere dát a testovaní. Preto by som povedala, že v celom procese je zahrnutých viac firiem, ako by si človek na začiatku vôbec myslel.
Prečo by sa mali spoločnosti hlasovým vyhľadávaním a zariadeniam ovládaným hlasom zaoberať?
Čím jednoduchšie sa človek dostane k informáciám, tým rýchlejšie sa môže rozhodnúť. Všetci z nás sa stávajú stále viac „lenivými“, nechce sa nám písať či čítať, no stále prahneme po väčšom množstve informácií. V zmysle tohto trendu by si každá spoločnosť mala položiť otázku: „Ako môžem urobiť veci jednoduchšie a dostupnejšie?“
V čom vidíš výhodu spoločností, ktoré túto tému riešia už dnes oproti tým, ktoré tvrdia, že to zatiaľ nie je aktuálne?
Trend je tu, v ktorejkoľvek krajine na svete. Samozrejme sa každá spoločnosť má možnosť rozhodnúť či trendu „podľahne“ alebo nie. Tí, ktorí sa hlasovému vyhľadávaniu venujú už teraz, majú jednu z najlepších možností vyskúšať čokoľvek im napadne a zároveň tým určiť smer, ktorým sa hlasové vyhľadávanie bude uberať. Spoločnosti si musia uvedomiť, že nikto z nás už druhýkrát koleso, elektrinu či auto nevynájde.
V čom vidíš v súčasnej dobe najväčšiu prekážku pre to, aby hlasové vyhľadávanie bolo každodennou súčasťou našich životov? Bude to raz tak?
Technológia hlasového vyhľadávania v iných, ako svetových jazykoch, je ešte v plienkach. Vďaka svojej práci mám možnosť nazrieť do zákulisia plánovania vývoja produktov pre jednotlivé trhy. Vďaka množstvu jazykov, ktoré na svete máme, sa produkty a technológie spúšťajú v rôznych fázach. Môžem však prezradiť, že len nedávno som sa vrátila z Českej republiky, takže verím, že čoskoro sa na rad dostane aj slovenčina. 🙂
Okrem dostupnosti je prekážkou aj skepticizmus ľudí. Nie sme ešte úplne pripravení prenechať všetko len na techniku. Koľkí z nás stále nepodľahli a telefón ako peňaženku používať odmietajú?
Zvykneš vyhľadávať hlasom na svojom zariadení aj ty?
Ako sa u nás doma hovorí: „Obuvníkove deti chodia bosé“. Musím sa teda priznať, že ja hlasom veľmi nevyhľadávam. Moja najčastejšia interakcia s hlasovým vyhľadávaním je v našej kancelárii, kde máme Alexu.
Aj tento článok vzniká namiesto nahrávania písaním, takže ešte mám určite čo doháňať.
Sleduješ dianie u nás? Máš skúsenosti so slovenskými lokalizáciami? Ako je na tom pri téme hlasové vyhľadávanie slovenčina?
Jedným z veľkých prekvapení v mojej práci v Kanade (a to dokonca v môj prvý či druhý týždeň) bola kontrola a testovanie slovenskej lokalizácie softvéru pre jednu z veľkých korporácií pôsobiacej na Slovensku. Aj vďaka takýmto úlohám viem, že sa pomaličky dostávame na túto vlnu.
Majke ďakujeme za ochotu prezentovať svoje názory na blogu Basta digital.
Dá sa čakať, že keď sa hlasoví asistenti „naučia“ po slovensky, ich používanie v našej krajine sa rozšíri. Viete si predstaviť, čo bude hlavná zábava ľudí počas piatkových večerov a nocí? 🙂