Zinātne: Varbūt drīz sapratīsim, ko mums cenšas pateikt suns

© Pixabay

Vai esat kādreiz vēlējušies saprast, ko jūsu suns cenšas jums pateikt? Mičiganas universitātes pētnieki pēta mākslīgā intelekta (MI) iespējas, izstrādājot rīkus, kas var noteikt, piemēram, vai suņa riešana pauž rotaļīgumu vai agresiju, vēsta “Science Daily”.

Šie paši modeļi var iegūt arī citu informāciju no dzīvnieku vokalizācijām, piemēram, dzīvnieka vecumu, šķirni un dzimumu. Meksikas Nacionālajā astrofizikas, optikas un elektronikas institūtā veiktajā pētījumā atklāts, ka MI modeļus, kas sākotnēji apmācīti cilvēka runai, var izmantot kā sākumpunktu jaunu sistēmu apmācībai, kuru mērķis ir dzīvnieku komunikācija.

"Izmantojot runas apstrādes modeļus, kas sākotnēji apmācīti cilvēka runai, mūsu pētījums paver jaunu logu tam, kā mēs varam izmantot līdz šim izveidoto runas apstrādes jomā, lai sāktu izprast suņu riešanas nianses," sacīja Rada Mihalcea, datorzinātņu profesore un Mičiganas universitātes MI laboratorijas direktore.

"Ir tik daudz, ko mēs vēl nezinām par dzīvniekiem, kas dzīvo ar mums šajā pasaulē. MI sasniegumi var tikt izmantoti, lai revolucionizētu mūsu izpratni par dzīvnieku komunikāciju, un mūsu atklājumi liecina, ka mums, iespējams, nav jāsāk no nulles."

Viens no galvenajiem šķēršļiem MI modeļu izstrādē, kas var analizēt dzīvnieku vokalizācijas, ir publiski pieejamu datu trūkums. Lai gan ir daudz resursu un iespēju cilvēka runas ierakstīšanai, šādu datu vākšana no dzīvniekiem ir sarežģītāka.

"Dzīvnieku vokalizācijas loģistiski ir daudz grūtāk iegūt un ierakstīt," sacīja Artjoms Abzalijevs, vadošais autors un Mičiganas universitātes datorzinātņu un inženierzinātņu doktorants. "Tās ir jāieraksta pasīvi savvaļā vai, mājdzīvnieku gadījumā, ar īpašnieku atļauju."

Šī izmantojamo datu trūkuma dēļ suņu vokalizāciju analīzes metodes ir izrādījušās grūti izstrādājamas, un esošās ierobežo apmācības materiālu trūkums. Pētnieki pārvarēja šīs problēmas, pārveidojot esošo modeli, kas sākotnēji bija paredzēts cilvēka runas analīzei.

Šī pieeja ļāva pētniekiem izmantot spēcīgus modeļus, kas veido dažādu mūsdienās izmantoto balss tehnoloģiju, tostarp balss pārveidošanas tekstā un valodas tulkošanas, mugurkaulu. Šie modeļi ir apmācīti atšķirt cilvēka runas nianses, piemēram, toni, augstumu un akcentu, un pārveidot šo informāciju formātā, ko dators var izmantot, lai identificētu teiktos vārdus, atpazītu runātāju un veiktu citas darbības.

"Šie modeļi spēj apgūt un kodēt neticami sarežģītus cilvēka valodas un runas modeļus," sacīja Abzalijevs. "Mēs vēlējāmies noskaidrot, vai varam izmantot šo spēju, lai atšķirtu un interpretētu suņu riešanu."

Pētnieki izmantoja suņu vokalizāciju datu kopu, kas ierakstīta no 74 dažādu šķirņu, vecumu un dzimumu suņiem dažādos kontekstos. Pēc tam ierakstus izmantoja, lai modificētu mašīnmācīšanās modeli. Ar to viņi spēja ģenerēt no suņiem savākto akustisko datu attēlojumus un tos interpretēt.

"Šī ir pirmā reize, kad cilvēku runai optimizētas metodes ir izmantotas, lai palīdzētu atšifrēt dzīvnieku komunikāciju," sacīja Mihalcea. "Mūsu rezultāti liecina, ka no cilvēku runas iegūtās skaņas un modeļi var kalpot par pamatu citu skaņu, piemēram, dzīvnieku vokalizāciju, akustisko modeļu analīzei un izpratnei."