Mi az adatbányászat? Az alapok és technikái.

Tartalomjegyzék:

Mi az adatbányászat? Az alapok és technikái.
Mi az adatbányászat? Az alapok és technikái.

Videó: Mi az adatbányászat? Az alapok és technikái.

Videó: Mi az adatbányászat? Az alapok és technikái.
Videó: A Windows Update hibák javítása a Windows 10 rendszerben - YouTube 2024, November
Anonim

A negyedik ipari forradalom alapja nagymértékben függ Adat és Kapcsolódás. Elemzési szolgáltatások amely képes adatbányászati megoldások kifejlesztésére vagy létrehozására, kulcsszerepet fog játszani e tekintetben. Segíthet az ügyfelek beszerzési magatartásának elemzésében és előrejelzésében a potenciális vevők célzásához. Az adatok egy új természeti erőforrássá válnak, és a nem válogatott adatokból származó releváns információk kivonása nagy jelentőséggel bír. Mint ilyen, a kifejezés megfelelő megértése - Adatbányászat, a folyamatok és az alkalmazás segíthet nekünk holisztikus megközelítés kialakításában ezzel a szószedettel.

Az adatbányászat alapjai és technikái

Image
Image

Adatbányászat, más néven Tudáskeresés az adatokban (KDD) nagy adatok tárolására törekszik olyan minták és trendek feltárására, amelyek túlmutatnak az egyszerű elemzésen. Ez azonban nem egy lépcsős megoldás, hanem egy többlépéses folyamat, és különböző szakaszokban fejeződik be. Ezek tartalmazzák:

1] Adatgyűjtés és előkészítés

Az adatgyűjtéssel és annak megfelelő szervezésével kezdődik. Ez jelentősen javítja az adatbányászat révén felfedezhető információk megtalálásának esélyeit

2] Modellépítés és értékelés

Az adatbányászati folyamat második lépése a különböző modellezési technikák alkalmazása. Ezeket a paramétereket az optimális értékek kalibrálásához használják. Az alkalmazott technikák nagymértékben az analitikus képességek függvénye, amelyek a szervezeti igények skálájának kezeléséhez és döntések meghozatalához szükségesek.

Nézzünk néhány adatbányászati technikát röviden. Úgy találták, hogy a szervezetek többsége kettő vagy több adatbányászati technikát kombinál, hogy megfelelő eljárást hozzon létre, amely megfelel az üzleti igényeinek.

Olvas: Mi a Big Data?

Adatbányászati technikák

  1. Egyesület - Az Egyesület az egyik legismertebb adatbányászati technika. Ebben az esetben egy mintát megfejtünk az azonos tranzakcióban lévő elemek közötti kapcsolat alapján. Ezért is ismert relációs technika. A nagy márkakereskedők erre a technikára támaszkodnak, hogy megvizsgálják az ügyfél vásárlási szokásait / preferenciáit. Például az emberek vásárlási szokásainak nyomon követése során a kiskereskedők azonosítják, hogy az ügyfél mindig vásárol krémeket, amikor csokoládét vásárol, és ezért javasolja, hogy a következő alkalommal, amikor csokoládét vásárolnak, esetleg krémeket is vásárolni kívánnak.
  2. Osztályozás - Ez az adatbányászati technika olyan módon különbözik a fentiektől, hogy gépi tanuláson alapul, és olyan matematikai technikákat alkalmaz, mint a lineáris programozás, a döntési fák, a neurális hálózat. Az osztályozás során a vállalatok olyan szoftvereket próbálnak kiépíteni, amelyek megtanulják, hogyan osztályozzák az adatelemeket csoportokba. Például egy vállalat meghatározhat egy besorolást az alkalmazásban, amely "a munkavállaló minden olyan nyilvántartását figyelembe véve, aki felajánlotta, hogy lemond a vállalatról, megjósolja azon személyek számát, akik valószínűleg lemondanak a vállalatról a jövőben". a vállalat az alkalmazottak nyilvántartását két csoportba sorolhatja, amelyek "szabadság" és "tartózkodás". Ezután felhasználhatja az adatbányászati szoftvert, hogy az alkalmazottakat a korábban létrehozott külön csoportokba sorolja.
  3. Klaszterek - Hasonló jellemzőkkel rendelkező különböző objektumokat egyetlen csoportban csoportosítanak automatizáláson keresztül. Sok ilyen klaszter hozható létre osztályok és tárgyak (hasonló jellemzőkkel) kerülnek benne ennek megfelelően. Ennek jobb megértéséhez nézzük meg a könyvtár kezelésének egyik példáját a könyvtárban. A könyvtárban a könyvek hatalmas gyűjteménye teljes körűen katalogizált. Az azonos típusú elemek együtt szerepelnek. Ez megkönnyíti számunkra egy érdekes könyv felfedezését. Hasonlóképpen, a klaszterezési technika segítségével olyan könyvet tarthatunk, amely egyfajta hasonlósággal rendelkezik egy klaszterben, és megfelelő nevet ad. Tehát, ha egy olvasó megragadja az érdeklődésére vonatkozó könyvet, csak az egész könyvtárat keresve kell mennie a polcra. Így a klaszterezési technika meghatározza az osztályokat, és objektumokat helyez el minden osztályhoz, míg az osztályozási technikákban az objektumok előre meghatározott osztályokba kerülnek.
  4. jóslás - A predikció olyan adatbányászati technika, amelyet gyakran a többi adatbányászati technikával kombinálva használnak. Ez magában foglalja a trendek, a besorolást, a minta illesztését és a kapcsolatot. A múltbeli események vagy példák megfelelő sorrendben történő elemzésével biztonságosan megjósolhat egy jövőbeli eseményt. Például a becslési elemzési technikát felhasználhatjuk az értékesítésre a jövõbeni nyereség megjóslásához, ha az értékesítés független változónak és az értékesítéstõl függõ változó nyereségként kerül kiválasztásra. Ezután a történelmi eladási és nyereségadatok alapján egy alkalmas regressziós görbét rajzolhatunk fel, amelyet a profit-előrejelzéshez használunk.
  5. Döntési fák - A döntési fa belsejében egy olyan egyszerű kérdéssel indulunk el, amely többszörös választ ad. Minden egyes válasz további kérdéshez vezet, amely segít az adatok osztályozásában vagy azonosításában, hogy kategorizálható legyen, vagy hogy minden egyes válasz alapján előrejelzést lehessen készíteni. Például a következő döntési fát használjuk annak eldöntésére, hogy játsszunk-e krikettet ODI: Adatbányászati döntésfa: A gyökércsomóponttól kezdve, ha az időjárási előrejelzés az esőt előre jelzi, elkerüljük a mérkőzést a naphoz. Alternatív megoldásként, ha az időjárás-előrejelzés egyértelmű, akkor meg kell játszanunk a mérkőzést.

Az adatbányászat a különböző iparágak és tudományágak - például a kommunikáció, a biztosítás, az oktatás, a gyártás, a banki és a kiskereskedelem - és az egyéb iparágak elemzésének középpontjában áll. Ezért a helyes információ megléte nélkülözhetetlen a különböző technikák alkalmazása előtt.

Ajánlott: