Grammatical Case Based IS-A Relation Extraction with Boosting for Polish
PBN-AR
Instytucja
Instytut Podstaw Informatyki Polskiej Akademii Nauk
Książka
Tytuł książki
Proceedings of the 2016 Federated Conference on Computer Science and Information Systems. September 11–14, 2016. Gdańsk, Poland
Data publikacji
2016
ISBN
978-83-60810-90-3
Wydawca
Polskie Towarzystwo Informatyczne
Publikacja
Główny język publikacji
angielski
Tytuł rozdziału
Grammatical Case Based IS-A Relation Extraction with Boosting for Polish
Rok publikacji
2016
Strony (od-do)
533-560
Numer rozdziału
Identyfikator DOI
Liczba arkuszy
0,9144
Hasło encyklopedyczne
Konferencja
Indeksowana w Scopus
tak
Indeksowana w Web of Science Core Collection
tak
Liczba cytowań z Web of Science Core Collection
Nazwa konferencji (skrócona)
FedCSIS 2016
Nazwa konferencji
Federated Conference on Computer Science and Information Systems
Początek konferencji
2016-09-11
Koniec konferencji
2016-09-14
Lokalizacja konferencji
Gdańsk
Kraj konferencji
PL
Lista innych baz czasopism i abstraktów w których była indeksowana
Open access
Tryb otwartego dostępu
Witryna wydawcy
Wersja tekstu w otwartym dostępie
Wersja opublikowana
Licencja otwartego dostępu
Inna
Czas opublikowania w otwartym dostępie
Razem z publikacją
Data udostępnienia w sposób otwarty
Streszczenia
Język
angielski
Treść
Pattern-based methods of IS-A relation extraction rely heavily on so called Hearst patterns. These are ways of expressing instance enumerations of a class in natural language. While these lexico-syntactic patterns prove quite useful, they may not capture all taxonomical relations expressed in text. Therefore in this paper we describe a novel method of IS-A relation extraction from patterns, which uses morpho-syntactical annotations along with grammatical case of noun phrases that constitute entities participating in IS-A relation. We also describe a method for increasing the number of extracted relations that we call \emph{pseudo-subclass boosting} which has potential application in any pattern-based relation extraction method. Experiments were conducted on a corpus of about 0.5 billion web documents in Polish language.
Inne
System-identifier
PX-58b59f27d5de9cc1dd9d13a1
CrossrefMetadata from Crossref logo
Cytowania
Liczba prac cytujących tę pracę
Brak danych
Referencje
Liczba prac cytowanych przez tę pracę
Brak danych