×

Serwis używa ciasteczek ("cookies") i podobnych technologii m.in. do utrzymania sesji i w celach statystycznych. • Ustawienia przeglądarki dotyczące obsługi ciasteczek można swobodnie zmieniać. • Całkowite zablokowanie zapisu ciasteczek na dysku komputera uniemożliwi logowanie się do serwisu. • Więcej informacji: Polityka cookies OPI PIB

×

Regulamin korzystania z serwisu PBN znajduję się pod adresem: Regulamin serwisu

Szukaj wśród:
Dane publikacji

Structured Affiliations Extraction from Scientific Literature

Artykuł
Czasopismo : D-Lib Magazine   Tom: 21, Zeszyt: 11/12
Dominika Tkaczyk [1] , Bartosz Tarnawski [1] , Łukasz Bolikowski [1]
2015 angielski
Liczba arkuszy: 1,25
Link do publicznie dostępnego pełnego tekstu
Identyfikatory
-
Cechy publikacji
-
  • Oryginalny artykuł naukowy
  • Zrecenzowana naukowo
  • Konferencyjna
Dyscypliny naukowe
-
Informatyka – dziedzina nauk technicznych
Dane konferencji
-
  1. WOSP 2015 4th International Workshop on Mining Scientific Publications 2015
  2. 2015-06-24 - 2015-06-24
  3. Knoxville, Stany Zjednoczone
Abstrakty ( angielski )
-
CERMINE is a comprehensive open source system for extracting structured metadata from scientific articles in a born-digital form. Among other information, CERMINE is able to extract authors and affiliations of a given publication, establish relations between them and present extracted metadata in a structured, machine-readable form. Affiliations extraction is based on a modular workflow and utilizes supervised machine learning as well as heuristic-based techniques. According to the evaluation we performed, the algorithm achieved good results both in affiliations extraction (84.3% F1) and affiliations parsing (92.1% accuracy) tasks. In this paper we outline the overall affiliations extraction work flow and provide details about individual steps' implementations. We also compare our approach to similar solutions, thoroughly describe the evaluation methodology and report its results. The CERMINE system, including the entire affiliations extraction and parsing functionality, is available under an open-source licence.
Zacytuj dokument
-