Pāriet uz galveno navigāciju Pāriet uz meklēšanu Pāriet uz galveno saturu

Latvian WordNet

    • Institute of Mathematics and Computer Science
    • University of Latvia
    • Department of Latvian and Baltic Studies

    Zinātniskās darbības rezultāts: Nodaļa grāmatā/enciklopēdijā/konferences krājumāKonferences zinātniskais rakstsPētniecībakoleģiāli recenzēts

    4 Atsauces (Scopus)

    Kopsavilkums

    This paper describes the recently developed Latvian WordNet and the main linguistic principles used in its development. The inventory of words and senses is based on the Tēzaurs.lv online dictionary, restructuring the senses of the most frequently used words based on corpus evidence. The semantic linking methodology adapts Princeton WordNet principles to fit the Latvian language usage and existing linguistic tradition. The semantic links include hyponymy, meronymy, antonymy, similarity, conceptual connection and gradation. We also measure inter-annotator agreement for different types of semantic links. The dataset consists of 7609 words linked in 6515 synsets. 1266 of these words are considered fully completed as they have all the outgoing semantic links annotated, corpus examples assigned for each sense, as well as links to the English Princeton WordNet formed. The data is available to the public on Tēzaurs.lv as an addition to the general dictionary data, and is also published as a downloadable dataset.

    OriģinālvalodaAngļu
    Rīkotāja publikācijas nosaukums12th Global Wordnet Conference Gwc 2023
    RedaktoriGerman Rigau, Francis Bond, Alexandre Rademaker
    Publikācijas vieta[Leioa]
    IzdevējsGlobal WordNet Association
    Lapas187-196
    Lapu skaits10
    ISBN (Elektroniski)9781713890881
    ISBN (Drukātā versija)978-84-09-53956-7, 9781713890881
    Publikācijas statussPublicēts - 2023

    Publikāciju sērijas

    Nosaukums12th Global Wordnet Conference, GWC 2023

    OECD Zinātnes nozare

    • 6.2 Valodniecība un literatūrzinātne

    Nospiedums

    Uzziniet vairāk par pētniecības tēmām “Latvian WordNet”. Kopā tie veido unikālu nospiedumu.

    Citēt šo