Adatkutatás Pythonnal II.
Megismerkedünk a kategória aggregációval a folyamatos változók csoportosításával (Binning) és a Kalszterezéssel mint új, magasabb szintű kategóriák létrehozásával.
Megismerkedünk a kategória aggregációval a folyamatos változók csoportosításával (Binning) és a Kalszterezéssel mint új, magasabb szintű kategóriák létrehozásával.
Megnézzük, hogy hogyan alkalmazzuk a feltáró adatelemzés módszertanát függetlenül attól, hogy mit szeretnénk kihozni adatainkból.
Péntek este, fáradtan hazaérsz a munkából. Hűtő üres, főzni nincs kedv. Mi a kézenfekvő megoldás? Rendelsz egy pizzát. De vajon miért pont péntek este a csúcsidő? És hogyan készülnek a futárcégek erre adatok segítségével?
Az Excel nemcsak számokkal tud csodát tenni, hanem szövegekkel is. Gyakran előfordul, hogy egy adatmezőben túl sok információ van összegyúrva, vagy éppen nem a megfelelő formátumban jelenik meg, és ilyenkor jönnek jól a szövegkezelő függvények.
A következő függvényekkel gyorsan ki tudod számolni egy adott feltételnek megfelelő részösszegeket, megkereshetsz egy táblázatból bármilyen adatot és pontosan meghatározhatod, hol található egy érték a listában.
Időnk 80%-át azzal töltjük, hogy azon vitatkozunk, melyik diagramot válasszuk miközben 0%-ban tesszük fel a kérdést: “Ki a fenének készül ez az egész?”
Szóval ott vagy, adatokkal dolgozol. Nézegeted az Excel-tábládat, vagy a pandas DataFrame-edet, és jön az érzés: „Na most ezt valahogy látni kéne.”
Néha olyan megoldásra van szükségünk, amely képes csak bizonyos feltételeknek megfelelő értékeket összesíteni, például: „Mennyit adtunk el Budapesten?
Az összesítő függvények az Excel alapeszközei közé tartoznak, amelyekkel gyorsan végezhetsz számításokat nagy adattáblákon.
Az adatok elemzése során gyakran előfordul, hogy gyorsan meg kell határoznunk a legalapvetőbb statisztikai jellemzőket.
Adataid mesélnek. Megmutatják a holnapod. De csak akkor, ha meghallgatod őket.
Az Excel erőteljes, sokoldalú és elérhető eszköz marad az adatelemzésben, különösen az üzleti elemzők és a kezdők számára.
A Folium egy nyílt forráskódú Python-könyvtár, amely lehetővé teszi interaktív térképek egyszerű készítését.
Sokan kérdezik tőlem, hogyan lettem adat-elemző. Rövid válasz: nem egyenes úton.