Kao deo projekta CERES, kreiran je NLP servis namenjen vektorima značenja reči iz domena poljoprivrede.

Vektori značenja reči (eng. “word embeddings”) u domenu poljoprivrede su kreirani korišćenjem 134 241 rečenica dobijenih iz tekstova i vesti publikovanih sa tri sajta – servisa namenjnih poloprivrednoj proizvodnji u R. Srbiji: Agromedia.rs, Agroklub.rs i PSS Vojvodina. Cilj je da se kolekcija tekstova, kao i rečenica uskoro proširi novim izvorima.

Sve rečenice su označene kao deo govora i lematizovane, uz uklanjanje svih ne-alfanumeričkih znakova. Koncepti bigrama otkriveni su metodom Normalized Pointwise Mutual Information.

Za kreiranje vektora značenja reči, primenjena je arhitektura neuronske mreže Skip-gram koristeći veličinu konteksta 10, veličinu vektora 300, minimalnu učestalost reči 3 i 10 iteracija treninga. Konačni rečnik sadrži  44 056 pojmova unigrama i bigrama (vektori u semantičkom prostoru). Ovde nudimo tri usluge: pronađite slične reči, pronađite reč koja se ne uklapa u zadatoj listi i pronađite analogiju tipa A do B poput C do?.

Na veb sajtu http://ml4web.grf.bg.ac.rs/ biće izloženi glavni rezultati istraživanja vezanih za NLP servise u domenu poljoprivrede. Pored toga, nekoliko NLP servisa će biti dostupno posetiocima serivisa u cilju eksperimentisanja i ocene rada servisa. To su vektori značenja poljoprivrednih reči, klasifikacija teksta s obzirom na različite poljoprivredne dimenzije, prepoznavanje imenovanih entiteta itd. Sve usluge podrazumevaju unos teksta na srpskom jeziku (i na ćirilici i na latinici).

Podeli:

Još novosti

Konferencija “AI in Agriculture”

U okviru konferencije za primenjenu veštačku inteligenciju održane u Kragujevcu prezentovan je rad:
M. Kovacevic, P. Burasc, B. Bajat, M. Kilibarda , AI in Agriculture, 11st Serbian International Conference on Applied Artificial Intelligence (SICAAI)

Rad u Časopisu “Peerj”

Milan Kilibarda i Ognjen Antonijević su učestvovali u istraživanju publikovanom pod naslovom “A spatiotemporal ensemble Machine Learning framework for generating land use/land cover time-series maps for Europe (2000–2019) based on LUCAS, CORINE and GLAD Landsat” koje je usko vezano za ciljeve CERES projekta.

Rad u Časopisu “Frontiers”

U okviru projekta CERES publikovan je rad na temu transfera znanja mašinskog učenja za proračun organskog ugljenika u zemljištu kada su poznati drugi fizički i hemijski parametri.

Pošaljite nam poruku