Raksts pārpublicēts no portāla Delfi KISC direktora vietnieks Jānis Ziediņš: Kāpēc izvēlēties 'Hugo.lv'? - DELFI
Lai arī ikviens šobrīd vēlas ieņemt vadošo lomu, attīstot mākslīgo intelektu, pagaidām vēl nevienā citā Eiropas valstī nav tik unikāla projekta kā "Hugo.lv". Ar šo platformu, ko izveidojis Kultūras informācijas sistēmu centrs (KISC) sadarbībā ar valodu tehnoloģiju uzņēmumu "Tilde", Latvija ir izvirzījusies par vadošo Eiropas valsti valodu tehnoloģiju lietojumā valsts pārvaldē un ar savu pieredzi var dalīties pat Eiropas līmeņa pasākumos.
Projekta unikalitāte slēpjas tajā, ka, kamēr citas Eiropas valstis vēl arvien koncentrējas tikai uz mašīntulkošanu, "Hugo.lv" platforma ietver publiski pieejamus tulkošanas un balss apstrādes rīkus, ko var izmantot gan valsts pārvaldes darbinieki, gan ikviens Latvijas iedzīvotājs. Pēdējos divos gados uz "Hugo.lv" platformas bāzes izveidoti un valsts pārvaldē ieviesti arī virtuālie asistenti, ko nu jau izmanto gandrīz 70 valsts iestāžu tīmekļvietnēs. Līdz gadu mijai plānojam papildināt "Hugo.lv" platformu ar visām Eiropas Savienības valstu valodām ES finansēšanas instrumenta CEF ("Connecting Europe Facility") atbalstītā projekta "Nacionālā valodas tehnoloģiju platforma" (National Language Technology Platform – NLTP)" ietvaros. Tāpat Vides aizsardzības un reģionālās attīstības ministrija domā par iespējām nākotnē šos risinājumus plašāk piedāvāt izmantošanai komercsektorā.
Kāpēc priekšroku dot "Hugo.lv"?
Mēs zinām, ka nereti valsts iestādēm pietrūkst finanšu un cilvēku resursa, lai tās savās tīmekļvietnēs piedāvātu visu nepieciešamo informāciju arī citās valodās, ne tikai latviski. "Hugo.lv" mašīntulkošanas tehnoloģija palīdz to paveikt ātri un bez finansiāla ieguldījuma. Iespējams, atsevišķos gadījumos var būt nepieciešama pašu darbinieku iesaiste, lai automātiskajā tulkojumā veiktu nelielus labojumus, bet ieguvumu ir vairāk.
Lielākā priekšrocība salīdzinājumā ar "Google Translate" ir datu drošība, jo "Google" ir Amerikā bāzēts uzņēmums, un, lai arī tam ir jāievēro visas drošības regulas, tas datu ieguves un pilnveidošanas nolūkā visus tulkojumus saglabā. Turpretī "Hugo.lv" to nedara. Mēs tulkojamo un iztulkoto informāciju, tajā skaitā dažādus dokumentus, nesaglabājam, tādējādi tā nav pieejama nevienam citam. Tāpat būtiski, ka "Hugo.lv" tulkošanas sistēmas pielāgotas dažādu nozaru, piemēram, kultūras un tieslietu, specifikai un visu laiku tiek pilnveidotas.
Joprojām ir aktuāls jautājums, vai mašīntulkošana aizstās tulkotājus – cilvēkus. Mēs redzam, ka tehnoloģiju attīstība notiek visu laiku, un kopš 2014. gada mašīntulkošana ir ievērojami uzlabojusies. Protams, katra cilvēka vērtējums par tulkojumu ir subjektīvs, taču mašīntulkošanas kvalitātei ir konkrēti kritēriji, kādā veidā jātulko dažādas vārdkopas un teikumi. Jo vairāk valodu datu mēs varam iegūt, jo tulkojums kļūst precīzāks.
Sabiedrībai nozīmīgs projekts
Viena no šīs platformas pievienotajām vērtībām – "Hugo.lv" ir liela nozīme arī latviešu valodas aizsardzībā un saglabāšanā. Pašreizējā globalizācijas laikmetā, kad visā pasaulē aizvien aktīvāk dominē lielās valodas, mazo valodu turpmākai pastāvēšanai būtisks faktors ir to nostiprināšanās digitālajā vidē. Protams, lielie tirgus spēlētāji "Google", "Microsoft", "Bing" domā arī par mazo nāciju valodām, taču viņiem svarīguma ziņā tās vienmēr būs 3., 4. vai pat tālākā vietā. Piemēram, "Siri" sākumā runāja tikai angļu valodā, vēlāk sāka runāt ķīniešu valodā un droši vien pēc gadiem pieciem varētu runāt arī latviski, turpretī mums latviešu valoda ir prioritāte šobrīd. Mēs saglabājam latviešu valodu šī brīža kvalitātē, ļaujot šos valodu tehnoloģijas rīkus izmantot visiem mūsu iedzīvotājiem. Nozīmīgs solis bija latgaliešu valodas pareizrakstības rīks, ko "Hugo.lv" ieviesa pirms diviem gadiem; tas veicina latgaliešu rakstu valodas uzturēšanu un saglabāšanu. Iespējams, nākotnē šādā veidā "Hugo.lv" platformai varētu pievienot arī lībiešu vai citas mazās valodas.
Sabiedrības integrācijai būtiski, ka ar "Hugo.lv" palīdzību tiek veicināta informācijas pieejamība, jo visus tekstus valsts pārvaldes tīmekļvietnēs var ne tikai izlasīt, bet arī noklausīties. Tas ir nozīmīgs rīks gan vājredzīgajiem, gan cilvēkiem ar disleksiju. Mēs redzam, ka to izmanto ne tikai sistēmas, bet arī individuālā līmenī. Pēc statistikas datiem kopš palaišanas brīža platformā "Hugo.lv" ir jau 83 miljoni izrunātu vārdu, un šis skaitlis ar katru dienu turpina pieaugt.
Vēl viena "Hugo.lv" funkcija – balss atpazīšana un pārveidošana rakstītā tekstā. Ļoti aktīvi šo funkciju izmanto Latvijas Radio, lai sagatavotu ziņas tekstā, kā arī citi uzņēmumi, taču šajā gadījumā būtiska ir balss ieraksta tehniskā kvalitāte, jo, veicot ierakstu, piemēram, ārpus telpām, kur ir fona trokšņi, vai tālu no skaņas avota, balss atpazīšana nebūs tik precīza. Radio priekšrocība ir augstā ieraksta kvalitāte.
Virtuālie asistenti atvieglo aptuveni 30% darba
Jau divus gadus ar "Hugo.lv" atbalstu valsts iestāžu mājaslapās funkcionē virtuālie asistenti jeb sarunu boti. Tie iedzīvotājiem palīdz atrast nepieciešamo informāciju un atbildēt uz biežāk uzdotajiem jautājumiem, atbilžu sniegšanai nepieciešamo informāciju automātiski izgūstot no tīmekļvietnēm. Īpaši gribētos izcelt asistentu "Zinti", kas ir kopīgs sarunu bots tām valsts iestādēm, kuras veidotas valsts pārvaldes tīmekļvietņu vienotajā platformā. "Zinta" darba apjoms ir milzīgs, un nekur citur Eiropā šāda asistenta vēl nav. Tas ir normāli, ka iedzīvotāji ne vienmēr zina, kurā no valsts pārvaldes lapām atrast visprecīzāko informāciju par viņus interesējošo jautājumu. Virtuālais asistents "Zintis" pārzina informāciju daudzu valsts pārvaldes iestāžu tīmekļvietnēs, un gadījumā, ja, piemēram, Labklājības ministrijas mājaslapā tiek uzdots jautājums, kas vairāk attiecas uz Nodarbinātības valsts aģentūras kompetenci, "Zintis" spēj atrast atbildi uz šo jautājumu, nepārvirzot lietotāju uz citu lapu. Jāatzīmē, ka tam, kā virtuālais asistents funkcionē, seko speciāli apmācīti iestādes darbinieki jeb treneri, kas nemitīgi rūpējas par atbilžu kvalitātes uzlabošanu. Parasti vienu asistentu pārvalda 1–3 botu treneri; "Zinti" pārvalda vairāk nekā 120 cilvēku.
Lēšam, ka virtuālie asistenti spēj atvieglot iestādes ikdienas darbu par aptuveni 30% un dažkārt pat vairāk, piemēram, situācijās, kad sākusies deklarāciju iesniegšana Valsts ieņēmumu dienestā.
Šobrīd cerīgi lūkojamies uz Eiropas Savienības struktūrfondu nākamo kārtu, lai varētu realizēt jaunas ieceres, jo valsts iestādes jau šobrīd interesējas par virtuālo asistentu ar balsi, plānojam automatizētas subtitrēšanas izstrādi un padomā vēl daudz citu ideju.