Pāriet uz galveno navigāciju Pāriet uz meklēšanu Pāriet uz galveno saturu

Latvian Newswire Information Extraction System and Entity Knowledge Base

  • University of Latvia

Zinātniskās darbības rezultāts: Nodaļa grāmatā/enciklopēdijā/konferences krājumāKonferences zinātniskais rakstsPētniecībakoleģiāli recenzēts

6 Atsauces (Scopus)

Kopsavilkums

This paper describes an information extraction system designed for obtaining CV-style structured information about publicly mentioned persons, organizations and their relations by analyzing newswire archives in the Latvian language. The described text analysis pipeline consists of morphosyntactic analysis, NER and coreference resolution, and a semantic role labeling system based on FrameNet principles. We also implement an entity linking process, matching the entity mentions in each document to an entity knowledge base that is initially seeded with authoritative information on relevant people and organizations. The accuracy of automated frame extraction varies depending on specifics of each frame type, but the average accuracy currently is 53% F-score for frame target identification, and 61% for frame element role classification. The currently targeted volume of text is the total archives of Latvian newspapers, magazines and news portals, consisting of about 3.5 million articles.

OriģinālvalodaAngļu
Rīkotāja publikācijas nosaukumsHuman Language Technologies - The Baltic Perspective
Rīkotāja publikācijas apakšnosaukumsProceedings of the 6th International Conference Baltic HLT 2014
RedaktoriAndrius Utka, Gintare Grigonyte, Jurgita Kapociute-Dzikiene, Jurgita Vaicenoniene
IzdevējsIOS Press BV
Lapas119-125
Lapu skaits7
ISBN (Elektroniski)9781614994411
DOIs
Publikācijas statussPublicēts - 2014
Ārēji publicēts
Pasākums6th International Conference on Human Language Technologies - The Baltic Perspective, Baltic HLT 2014 - Kaunas, Lietuva
Ilgums: 26 sept. 201427 sept. 2014

Publikāciju sērijas

NosaukumsFrontiers in Artificial Intelligence and Applications
Sējums268
ISSN (Drukātā versija)0922-6389
ISSN (Elektroniskā versija)1879-8314

Konference

Konference6th International Conference on Human Language Technologies - The Baltic Perspective, Baltic HLT 2014
Valsts/TeritorijaLietuva
PilsētaKaunas
Periods26/09/1427/09/14

Nospiedums

Uzziniet vairāk par pētniecības tēmām “Latvian Newswire Information Extraction System and Entity Knowledge Base”. Kopā tie veido unikālu nospiedumu.

Citēt šo