Az "adatok" kifejezés nem új számunkra. Ez az egyik legfontosabb dolog, amit az információtechnológia és számítógépek kiválasztása során tanítanak. Ha vissza tudsz emlékezni, az adatokat az információ nyers formájának tekintjük. Bár már egy évtizede létezik, a kifejezés Nagy adat ez egy zümmögés ezekben a napokban. Amint a kifejezésből kitűnik, a terhelések és az adatok terhelése Big Data, és különböző módokon dolgozhatók fel különböző módszerek és eszközök segítségével, hogy megkapják a szükséges információkat. Ez a cikk a Big Data fogalmáról szól, a 3 V által említett Doug Laney-t, az adatraktározás területén úttörő szerepet betöltő, a Infonomics (Információgazdaság).
Big Data 3 Vs
Az adatok hatalmas formában, különböző eszközökkel felhalmozódtak, korábban különböző adatbázisokban kerültek be, és egy idő után dömpingelték. Amikor a koncepció kiderült, hogy minél több adat, annál könnyebb megismerni - a különböző és releváns információkat - a megfelelő eszközökkel, a vállalatok hosszabb időre megkezdték az adatok tárolását. Ez olyan, mint az új tárolóeszközök összevonása vagy a felhő használata az adatok tárolására, bármilyen formában az adatok beszerzéséhez: dokumentumok, táblázatok, adatbázisok és HTML stb. Ezután megfelelő formátumba rendezhetők olyan eszközök segítségével, amelyek képesek hatalmas darabok feldolgozására Adat.
JEGYZET: A nagy adatok köre nem korlátozódik az Ön által gyűjtött és tárolt adatokra és a felhőbe. Ez magában foglalhatja a különböző forrásokból származó adatokat, beleértve, de nem kizárólagosan a nyilvánossághoz tartozó elemeket.
A nagy adatok 3D modellje a következő V-alapú:
- Térfogat: az adattárolás kezelésére utal
- Sebesség: az adatfeldolgozás sebessége
- Variety: különböző, látszólag nem kapcsolódó adatkészletek csoportosítására vonatkozik
A következő bekezdések részletesen megmagyarázzák a nagy adatmodellezést az egyes dimenziókról (minden V).
A] nagy adatmennyiség
A Big Data-ról beszélve a hangerőt a nyers információk hatalmas gyűjteményeként értelmezhetjük. Bár ez igaz, az adatok tárolási költségeiről van szó. Fontos adatok tárolhatók a helyiségekben és a felhőben is, az utóbbi pedig rugalmas lehetőség. De meg kell mindent tárolnod?
A Meta Group által kiadott fehér könyv szerint, amikor az adatok mennyisége nő, az adatok egy része szükségtelenné válik. Ezenkívül megállapítja, hogy csak azokat az adatokat kell megőrizni, amelyeket a vállalkozások szándékoznak használni. Más adatok eldobhatók, vagy ha a vállalkozások nem hajlandók elengedni az "állítólag nem fontos adatokat", azokat fel nem használt számítógépes eszközökön és akár szalagon is el lehet dobni, hogy a vállalkozásoknak ne kelljen fizetniük ilyen adatok tárolására.
"Állítólag lényegtelen adatokat" használtam, mert én is úgy vélem, hogy a jövőben bármely vállalkozás bármilyen formában igényelhetõ adatokat - elõbb-utóbb - és ezért jó ideig kell megõrizni, mielõtt tudni fogja, hogy az adatok valóban nem fontos. Személy szerint régebbi adatokat másoltam a merevlemezekről az elmúlt évekről és néha a DVD-ről. A fő számítógépek és a felhő tároló tartalmazza az általam fontosnak tartott adatokat, és tudom, hogy használni fogom őket. Ezen adatok közül is van olyan egyszer használatos adat, amely néhány év múlva egy régi merevlemezre kijuthat. A fenti példa csak az Ön megértéséhez. Nem illeszkedik a nagy adatok leírásához, mivel az összeg jóval kisebb, mint amit a vállalatok Big Data-ként érzékelnek.
B ] Velocity a Big Data-ban
Az adatok feldolgozásának sebessége fontos tényező, amikor a Big Data koncepciójáról beszélünk. Számos weboldal van, különösen az e-kereskedelem. A Google már elismerte, hogy az oldal betöltésének sebessége elengedhetetlen a jobb rangsoroláshoz. A ranglétrán kívül a sebesség a felhasználóknak is kényelmet biztosít, miközben üzletet vásárolnak. Ugyanez vonatkozik más adatok feldolgozására is.
Amíg a sebességről beszélünk, elengedhetetlen tudni, hogy ez túlmutat a magasabb sávszélességen. A könnyen használható adatokat különböző analízis eszközökkel egyesíti. A könnyen használható adatok bizonyos házi feladatokat jelentenek az egyszerű feldolgozású adatszerkezetek létrehozásához. A következő dimenzió - Variety, tovább terjeszti a fényt.
C] Változatos nagy adatok
Ha vannak terhelések és sok adat, akkor fontos, hogy megszervezzék őket oly módon, hogy az elemző eszközök könnyen feldolgozzák az adatokat. Vannak eszközök az adatok rendezéséhez is. A tárolás során az adatok lehetnek strukturálatlanok és bármilyen formában. Önön áll, hogy kitalálja, milyen viszonyban van más adataival. Miután kitalálta a kapcsolatot, felveheti a megfelelő eszközöket, és átalakíthatja az adatokat a kívánt űrlapra a strukturált és rendezett tároláshoz.
összefoglalás
Más szóval, a Big Data 3D modell három dimenzióra épül: az Ön által használt USABLE adatok; az adatok megfelelő címkézése; és gyorsabb feldolgozás. Ha ezeket a három dolgot törődnek, akkor az adatait könnyen feldolgozhatja vagy elemezheti, hogy kitalálhassa, amit akar.
A fentiek mindkét koncepciót és a Big Data 3D modelljét magyarázzák meg. A második bekezdésben szereplő cikkek további támogatást bizonyítanak, ha újak vagyunk a koncepcióhoz.
Ha hozzá szeretne tenni valamit, kérjük, írjon megjegyzést.