Skoči do osrednje vsebine

Digitalizacija slovenščine

Za dolgoročno ohranitev jezika je ključna njegova digitalizacija. Privlačni in konkurenčni v globalno delujočem svetu bodo namreč le jeziki, ki se bodo uporabljali tudi na spletu. Digitalizacija omogoča sporazumevanje, sodelovanje, poslovanje, izmenjavo znanja ter udeleževanje v družabnih in političnih razpravah ne glede na jezikovne meje ali obvladovanje računalnika, sporazumevanje s stroji, v pomoč pa je tudi osebam s posebnimi potrebami, zato spodbujamo digitalizacijo jezika in razvoj jezikovnih tehnologij.

Jezikovni viri

Jezikovni viri so zbirno poimenovanje za jezikovne priročnike (slovarje, slovnice, pravopis in drugo) in jezikovne zbirke (korpuse in jezikovne baze podatkov), ki jih govorci vsakodnevno uporabljajo za samostojno in učinkovito sporazumevanje. V zadnjih letih veliko jezikovnih virov bodisi nastaja bodisi pridobiva digitalno obliko in s tem širšo dostopnost.

Digitalni viri so tudi osnova za izdelavo jezikovnih tehnologij, to je računalniških orodij in aplikacij. Te jezikovne podatke izrabljajo:

  • za reševanje z jezikom povezanih praktičnih potreb in
  • za postopke računalniške analize naravnega jezika za izdelavo novih digitalnih jezikovnih priročnikov in drugih virov.

Jezikovne tehnologije

Tehnologije, pogosto nevidne kot del zapletenih računalniških sistemov, nam pomagajo:

  • najti informacije s spletnimi iskalniki,
  • preverjati črkovanje ali slovnično ustreznost v urejevalnikih besedil,
  • pregledovati priporočila o izdelkih v spletnih trgovinah,
  • poslušati govorjena navodila v navigacijskih sistemih v avtomobilu ali navodila bralnikov sporočil gospodinjskih naprav,
  • prevajati spletne strani s spletnimi prevajalniki,
  • analizirati velike količine besedilnih podatkov in jih upravljati.

Za razvoj kakovostnih jezikovnotehnoloških orodij potrebujemo dovolj obsežne jezikovne vire, zato podpiramo nadgradnjo obstoječih in gradnjo novih.

Pri izdelavi novih proizvodov je treba upoštevati spremembe Direktive o ponovni uporabi informacij javnega sektorja iz 2013 (tako imenovana pravila EU Open Data), ki poudarja ponovno uporabo podatkov javnega sektorja in odprtih podatkov kot pomembno osnovno gradivo za proizvode in storitve z digitalno vsebino.

Odprtost podatkov spodbuja inovacije

Jezikovni viri in tehnologije so zanimivi tudi za komercialno uporabo. Odpiranje podatkov je gonilo za inovacije in gospodarsko rast ter nova delovna mesta, zato si prizadevamo za odpiranje virov in financiramo projekte, ki uporabnikom omogočajo brezplačen dostop do rezultatov.

S pomočjo sredstev Evropskega sklada za regionalni razvoj smo tako sofinancirali pomemben akademski projekt Razvoj slovenščine v digitalnem okolju (RSDO), katerega cilj je bil zgraditi odprtokodno jedrno programsko infrastrukturo za digitalno rabo slovenskega jezika. V okviru projekta so nastala številna praktična orodja, kot so prevajalnik, razpoznavalnik govora, terminološki portal in druga. Rezultati projekta RSDO so dober nastavek za nadaljnji razvoj velikih jezikovnih modelov in generativne umetne inteligence v povezavi z jezikovnimi tehnologijami. So podlaga, na kateri lahko državne inštitucije ali podjetja razvijejo lastne rešitve.

Spletni jezikovni viri in servisi

Spletni portali, s katerih lahko z enega mesta dostopate do jezikovnih svetovalnic, slovarjev, korpusov in drugih jezikovnih virov:

Digitalizacija besedil slovenske kulturne dediščine

Že od leta 2007 finančno podpiramo projekt Wikivir, slovensko leposlovje na spletu, ki ga izvaja Zveza društev Slavistično društvo Slovenije. Vsakdo, ki ga zanima slovenska književnost (šolarji, dijaki, učitelji, splošni uporabniki), lahko do nje dostopa na zaslonu brezplačno, kadar koli, brez prijavljanja in podobnih ovir.