RTU izstrādā mākslīgajā intelektā balstītu produktu teksta pārbaudei latviešu valodā

© Pixabay

Rīgas Tehniskās universitātes (RTU) studenti izstrādājuši prototipu uzlabotam rīkam teksta pārbaudei latviešu valodā, aģentūra LETA uzzināja universitātē.

Projekta mērķis ir izveidot mākslīgā intelektā balstītu produktu, līdzīgu kā pareizrakstības rīku "Grammarly", kuru varētu lietot, lai automātiski atrastu un izlabotu komatu, rakstības, teikuma struktūras un stila kļūdas latviešu valodas tekstā.

RTU Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultātes pārstāvis Mārcis Teodors Upenieks norādīja, ka šobrīd pieejamie risinājumi latviešu valodai aprobežojas ar vārdu gramatikas labojumiem vai vienkāršiem pieturzīmju labojumiem, kas balstīti uz likumiem. Taču nav iespējams labot teikuma kļūdas saliktiem sakārtotiem teikumiem vai divdabja teicieniem.

Spraudnis "Grāmatiņš" lietotājam piedāvās ne tikai gramatikas, pareizrakstības un interpunkcijas pārbaudi, bet arī stila ieteikumus, kontekstualizētus vārdu ieteikumus un žanra specifiskus rakstīšanas ieteikumus.

Izstrādes gaitā ir apkopoti 64,7 miljoni vārdu no latviešu grāmatām, zinātniskajiem darbiem un citiem materiāliem. No tiem ir uzbūvēts pamata modelis. Papildus apmācīti vēl trīs modeļi - gramatikas, stila un interpunkcijas modelis. Modeļi balstīti uz inovatīviem, tepat Latvijā veiktiem pētījumiem, nevis uz ārējo piegādātāju risinājumiem, norāda pētnieki.

Īstenojot šo projektu, sagatavotas arī zinātniskās publikācijas, piemēram, par pētījumu, kurā tika iegūta lielākā publiski pieejamā datu kopa - vairāk nekā 90 000 teikumu -, lai noteiktu tajos pausto noskaņojumu (pozitīvs, negatīvs, cits).

Spraudnis izstrādāts, lai darbotos interneta pārlūkā, nodrošinot reāllaika ieteikumus. To varēs lietot arī bezsaistes režīmā, kad nav pieejams interneta savienojums. Jaunizveidotie modeļi būs spējīgi darboties lietotāju darba stacijās, nevis tikai jaudīgos serveros, kuri aprīkoti ar grafisko procesoru (GPU). Tas samazina operatīvās izmaksas un uzlabo cenu patērētājam, norāda pētnieki.

Projekts tiek īstenots Latvijas Investīciju un attīstības aģentūras Tehnoloģiju biznesa centra radītajā prototipēšanas programmā "Prototech" pēc SIA "Asya" pasūtījuma.

Latvijā

Saistībā ar e-adreses problēmām ir apzinātas amatpersonas, kuras nav atbildīgi pildījušas savus darba pienākumus, un tām līdz pirmdienai, 16.decembrim, ir jāiesniedz rakstiski paskaidrojumi, žurnālistus piektdien informēja Valsts digitālās attīstības aģentūras (VDAA) direktors Jorens Liops.

Svarīgākais