izpis_h1_title_alt

Gručenje z omejitvami na podlagi besedil in grafov pri razporejanju akademskih člankov
ID Škvorc, Tadej (Avtor), ID Robnik Šikonja, Marko (Mentor) Več o mentorju... Povezava se odpre v novem oknu, ID Lavrač, Nada (Komentor)

.pdfPDF - Predstavitvena datoteka, prenos (1,01 MB)
MD5: 9CDCB97C1E9FE56A4370B73CE2F37F52
PID: 20.500.12556/rul/0771c4e7-7814-410d-ab35-e43638033122

Izvleček
Sestavljanje urnikov konference je časovno zahtevno opravilo. Urniki so sestavljeni iz različnih sej, na katerih so predstavljeni članki s skupnim raziskovalnim področjem ali podpodročjem. Ročno razporejanje člankov v urnik vzame veliko časa, saj je potrebno za vsak članek določiti, v katero področje spada. V magistrskem delu predstavimo metodo za avtomatizacijo tega postopka. Z uporabo metod strojnega učenja, obdelave naravnega jezika in analize omrežij poiščemo članke s skupno tematiko. Na podlagi podobnosti smo članke razvrstili v vnaprej definirane seje urnika z uporabo gručenja z omejitvami. Razvito metodo smo implementirali v sklopu spletne aplikacije. Za potrebe testiranja smo ustvarili podatkovno bazo znanstvenih člankov iz različnih konferenc strojnega učenja, ročno označenih z njihovim raziskovalnim podpodročjem. Vsak del metode smo testirali samostojno z različnimi pristopi, in dobili dobre rezultate. Celotno metodo smo testirali na člankih, izbranih za predstavitev na konferenci ECML-PKDD 2017. Dobili smo dobre rezultate, ki lahko služijo kot izhodišče za izgradnjo urnika konference.

Jezik:Slovenski jezik
Ključne besede:obdelava naravnega jezika, analiza omrežij, gručenje, organizacija konferenc
Vrsta gradiva:Magistrsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2017
PID:20.500.12556/RUL-95060 Povezava se odpre v novem oknu
Datum objave v RUL:13.09.2017
Število ogledov:1151
Število prenosov:361
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Text and Graph Based Constrained Clustering for Academic Paper Scheduling
Izvleček:
Creating a conference schedule is a difficult task. Conference schedules consist of sessions, which contain papers that belong to the same field or subfield. Manually constructing such a schedule takes a lot of time, as each paper must be assigned to an appropriate subfield. This thesis presents a method for automating the schedule creation process. We use machine learning, natural language processing and network analysis to find papers with common research topics. Based on the similarities we group papers into predefined conference sessions using constrained clustering. We implemented the method as a part of a web application. To test the proposed method we created a database of academic papers from several machine learning conferences and labeled them manually with their research subfield. We tested each part of the method independently and obtained good results. The full method was tested on papers accepted to the ECML-PKKD 2017 conference. We obtained useful results that can be used as a starting point when creating a conference schedule.

Ključne besede:natural language processing, network analysis, clustering, conference organization

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj