Adapting a constituency parser to user-generated content in Polish opinion mining
PBN-AR
Instytucja
Wydział Informatyki, Elektroniki i Telekomunikacji (Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie)
Źródłowe zdarzenia ewaluacyjne
Informacje podstawowe
Główny język publikacji
EN
Czasopismo
Computer Science
ISSN
1508-2806
EISSN
2300-7036
Wydawca
AGH University of Science and Technology Press
Rok publikacji
2016
Numer zeszytu
1
Strony od-do
23--44
Numer tomu
17
Link do pełnego tekstu
Identyfikator DOI
Liczba arkuszy
1.57
Autorzy
Pozostali autorzy
+ 1
Słowa kluczowe
EN
sentiment analysis
user generated content
text normalization
parsing
Open access
Tryb otwartego dostępu
Otwarte czasopismo
Wersja tekstu w otwartym dostępie
Wersja opublikowana
Licencja otwartego dostępu
Czas opublikowania w otwartym dostępie
Razem z publikacją
Data udostępnienia w sposób otwarty
Streszczenia
Język
EN
Treść
The paper focuses on the adjustment of NLP tools for Polish; e.g., morphological analyzers and parsers, to user-generated content (UGC). The authors discuss two rule-based techniques applied to improve their efficiency: pre-processing (text normalization) and parser adaptation (modified segmentation and parsing rules). A new solution to handle OOVs based on inflectional translation is also offered.
Cechy publikacji
original article
peer-reviewed
Inne
System-identifier
idp:097228
CrossrefMetadata from Crossref logo
Cytowania
Liczba prac cytujących tę pracę
Brak danych
Referencje
Liczba prac cytowanych przez tę pracę
Brak danych