CERES

Kao deo projekta CERES, kreiran je NLP servis namenjen vektorima značenja reči iz domena poljoprivrede.

Vektori značenja reči (eng. “word embeddings”) u domenu poljoprivrede su kreirani korišćenjem 134 241 rečenica dobijenih iz tekstova i vesti publikovanih sa tri sajta – servisa namenjnih poloprivrednoj proizvodnji u R. Srbiji: Agromedia.rs, Agroklub.rs i PSS Vojvodina. Cilj je da se kolekcija tekstova, kao i rečenica uskoro proširi novim izvorima.

Sve rečenice su označene kao deo govora i lematizovane, uz uklanjanje svih ne-alfanumeričkih znakova. Koncepti bigrama otkriveni su metodom Normalized Pointwise Mutual Information.

Za kreiranje vektora značenja reči, primenjena je arhitektura neuronske mreže Skip-gram koristeći veličinu konteksta 10, veličinu vektora 300, minimalnu učestalost reči 3 i 10 iteracija treninga. Konačni rečnik sadrži  44 056 pojmova unigrama i bigrama (vektori u semantičkom prostoru). Ovde nudimo tri usluge: pronađite slične reči, pronađite reč koja se ne uklapa u zadatoj listi i pronađite analogiju tipa A do B poput C do?.

Na veb sajtu http://ml4web.grf.bg.ac.rs/ biće izloženi glavni rezultati istraživanja vezanih za NLP servise u domenu poljoprivrede. Pored toga, nekoliko NLP servisa će biti dostupno posetiocima serivisa u cilju eksperimentisanja i ocene rada servisa. To su vektori značenja poljoprivrednih reči, klasifikacija teksta s obzirom na različite poljoprivredne dimenzije, prepoznavanje imenovanih entiteta itd. Sve usluge podrazumevaju unos teksta na srpskom jeziku (i na ćirilici i na latinici).

Podeli:

Još novosti

Konferencija „AI in Agriculture“

U okviru konferencije za primenjenu veštačku inteligenciju održane u Kragujevcu prezentovan je rad:M. Kovacevic, P. Burasc, B. Bajat, M. Kilibarda , AI in Agriculture, 11st Serbian

Konferencija „Open Data Science Europe workshop 2022“

Istraživači sa projekta CERES su učestvovali na konferenciji  Open Data Science Europe workshop 2022 https://opendatascience.eu/workshop-2022/ . U okviru konrerencije Milan Kilibarda je održao predavanje na temu „Introduction to Web

Rad u Časopisu „Peerj“

Milan Kilibarda i Ognjen Antonijević su učestvovali u istraživanju publikovanom pod naslovom „A spatiotemporal ensemble Machine Learning framework for generating land use/land cover time-series maps

Rad u Časopisu „Frontiers“

U okviru projekta CERES publikovan je rad na temu transfera znanja mašinskog učenja za proračun organskog ugljenika u zemljištu kada su poznati drugi fizički i

Pošaljite nam poruku