CERES

Kao deo projekta CERES, kreiran je NLP servis namenjen vektorima značenja reči iz domena poljoprivrede.

Vektori značenja reči (eng. “word embeddings”) u domenu poljoprivrede su kreirani korišćenjem 134 241 rečenica dobijenih iz tekstova i vesti publikovanih sa tri sajta – servisa namenjnih poloprivrednoj proizvodnji u R. Srbiji: Agromedia.rs, Agroklub.rs i PSS Vojvodina. Cilj je da se kolekcija tekstova, kao i rečenica uskoro proširi novim izvorima.

Sve rečenice su označene kao deo govora i lematizovane, uz uklanjanje svih ne-alfanumeričkih znakova. Koncepti bigrama otkriveni su metodom Normalized Pointwise Mutual Information.

Za kreiranje vektora značenja reči, primenjena je arhitektura neuronske mreže Skip-gram koristeći veličinu konteksta 10, veličinu vektora 300, minimalnu učestalost reči 3 i 10 iteracija treninga. Konačni rečnik sadrži  44 056 pojmova unigrama i bigrama (vektori u semantičkom prostoru). Ovde nudimo tri usluge: pronađite slične reči, pronađite reč koja se ne uklapa u zadatoj listi i pronađite analogiju tipa A do B poput C do?.

Na veb sajtu http://ml4web.grf.bg.ac.rs/ biće izloženi glavni rezultati istraživanja vezanih za NLP servise u domenu poljoprivrede. Pored toga, nekoliko NLP servisa će biti dostupno posetiocima serivisa u cilju eksperimentisanja i ocene rada servisa. To su vektori značenja poljoprivrednih reči, klasifikacija teksta s obzirom na različite poljoprivredne dimenzije, prepoznavanje imenovanih entiteta itd. Sve usluge podrazumevaju unos teksta na srpskom jeziku (i na ćirilici i na latinici).

Podeli:

Još novosti

Nauka Privredi – CERES

Prilog o projektu CERES – Nauka Privredi S06E21 https://www.youtube.com/watch?v=HlMZ5MBGf8E&feature=youtu.be&t=730&ab_channel=NaukaPrivredi podeli: Share on facebook Share on twitter Share on linkedin Još novosti: Pošaljite nam poruku

Pošaljite nam poruku