Big Data = Clear + Dirty + Dark Data
PBN-AR
Instytucja
Wydział Zarządzania (Uniwersytet Gdański)
Informacje podstawowe
Główny język publikacji
pl
Czasopismo
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu (10pkt w roku publikacji)
ISSN
1899-3192
EISSN
2392-0041
Wydawca
Wydawnictwo Uniwersytetu Ekonomicznego we Wrocawiu
DOI
URL
Rok publikacji
2017
Numer zeszytu
469
Strony od-do
131-139
Numer tomu
Identyfikator DOI
Liczba arkuszy
0.5
Autorzy
Słowa kluczowe
pl
Big Data
Clear Data
Dirty Data
Dark Data
en
Big Data
Clear Data
Dirty Data
Dark Data
Open access
Tryb otwartego dostępu
Inne
Wersja tekstu w otwartym dostępie
Wersja opublikowana
Licencja otwartego dostępu
Creative Commons — Uznanie autorstwa-Niekomercyjne-Bez utworów zależnych
Czas opublikowania w otwartym dostępie
Razem z publikacją
Data udostępnienia w sposób otwarty
Streszczenia
Język
pl
Treść
Rozwój techniki teleinformacyjnej, Internetu i informatyki przy jednoczesnym spadku jednostkowych kosztów gromadzenia i przechowywania danych powoduje istotne ilościowe i jakościowe zmiany w podejściu zarówno do samych danych, jak i możliwości ich analizy. Ten coraz bardziej gęsty, ciągły i niestrukturyzowany strumień danych, nazywany Big Data, wywołuje współcześnie wiele emocji. Z jednej strony brak odpowiedniej ilości danych był zawsze wyzwaniem dla metod wnioskowania statystycznego i jednym z bodźców ich rozwoju. Jednak z drugiej strony, w dużych liczebnościach prób zawarte są liczne zagrożenia dla wiarygodności wnioskowania. W zbiorach takich, poza danymi o odpowiedniej jakości (Clear Data), znaczny udział mają dane nieprawdziwe, nieaktualne, zaszumione, często wielokrotnie zduplikowane, niekompletne lub błędne (Dirty Data), a także dane, o których jakości czy użyteczności nic nie wiadomo (Dark Data). Celem prezentowanych badań jest krytyczne przedstawienie struktury jakościowej zbioru Big Data.
Język
en
Treść
The development of technology data communications, the Internet and computer with the simultaneous decrease the unit costs of data collection and storage results in significant quantitative and qualitative changes in the approach to the same data, and the possibility of their analysis. The increasingly dense, continuous and unstructured data stream, called Big Data, evokes a lot of emotion today. On the one hand, the lack of adequate quantities of data has always been a challenge for the methods of statistical inference and one of the stimuli of their development. On the other hand, the large sets included threats to the reliability of the inference. In such collections, in addition to data of sufficient quality (Clear Data), the data which are inaccurate, outdated, noisy, often repeatedly duplicate, incomplete or erroneous (Dirty Data), as well as data about which quality or usability nothing is known (Dark Date) have a significante share. The aim of this study is to present the structure of the critical qualitative set of Big Data.
Inne
System-identifier
UOG7748af85d0d44fe6b5895f8952ae1f8f
CrossrefMetadata from Crossref logo
Cytowania
Liczba prac cytujących tę pracę
Brak danych
Referencje
Liczba prac cytowanych przez tę pracę
Brak danych