Hĺbková analýza dát

Hĺbková analýza dát[1] (iné názvy: hĺbková analýza údajov[2], vyťažovanie údajov/dát[3][4], dolovanie údajov/dát[5][6], dolovanie v údajoch/dátach[7], data mining; angl. data mining) je proces analýzy dát z rôznych perspektív a ich sumarizácia na užitočné informácie. Spravidla ide o extrahovanie užitočných informácií z veľkých databáz, hľadanie korelácií alebo vzorov spomedzi tisícok polí v relačných databázach.

Využíva metódy štatistiky, matematiky (matematické modelovanie = klasifikačné pravidlá alebo stromy, regresia, zhluková analýza), umelej inteligencie (neuronové siete, rozpoznávanie, samoučiace sa algoritmy), nástroje OLAP (on-line analytické spracovanie)[8] a strojového učenia.

Typy modelov upraviť

  • Predikčné modely – cieľom je na základe historických dát predpovedať budúcnosť
  • Segmentačné modely – cieľom je roztriediť množstvo dát na zvládnuteľný počet homogénnych skupín

Aplikácia v praxi upraviť

  • Propensity to buy - cross-sell (predaj ďalších produktov existujúcim zákazníkom) a up-sell (zvýšenie spotreby daného produktu, doplnky)
  • Credit risk - modelovanie pravdepodobnosti nesplácania úveru
  • Fraud - identifikácia podvodov
  • Churn - identifikácia zákazníkov náchylných na prechod ku konkurencii
  • Segmentácia - zoskupovanie do homogénnych skupín
  • Market basket analysis - analýza nákupného koša
  • Diagnostické modely
  • Modely analýzy časových radov
  • Text mining

Delenie upraviť

Metodológie upraviť

  • CRISP DM (SPSS)
  • SEMMA (SAS)
  • Virtuos cycle of data mining (Berry & Linoff)

Typické oblasti využitia upraviť

Algoritmy upraviť

Softvér upraviť

Referencie upraviť

  1. EU v Bratislave - Projekt predmetu SK [1]
  2. Terek, M., Horníková, A., Labudová, V.: Hĺbková analýza údajov (Data Mining). Bratislava: Iura Edition 2010
  3. http://eur-lex.europa.eu/legal-content/SK/ALL/?uri=CELEX:52008IP0561
  4. Archivovaná kópia [online]. [Cit. 2016-09-29]. Dostupné online. Archivované 2016-10-01 z originálu.
  5. Archivovaná kópia [online]. [Cit. 2016-09-29]. Dostupné online. Archivované 2016-05-15 z originálu.
  6. Archivovaná kópia [online]. [Cit. 2016-09-29]. Dostupné online. Archivované 2016-10-02 z originálu.
  7. Krammer, P.: Dolovanie v údajoch so zameraním na interpretovateľnosť modelov. Dizertačná práca, FIIT STU,. Bratislava, 2015
  8. Kučerová, Helena. data mining. In KTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2011-05-15]. Dostupné z WWW: [2].

Iné projekty upraviť

Externé odkazy upraviť