Hogyan készíthetünk statisztikai elemzést webes tartalmakból az IBM SPSS segítségével? | Precognox

Hogyan készíthetünk statisztikai elemzést webes tartalmakból az IBM SPSS segítségével?

 

Az SPSS az IBM saját fejlesztésű szöveganalitikai és statisztikai-elemző eszköze. A testreszabható munkakörnyezet segítségével mélyreható elemzéseket és adatvizualizációkat készíthetünk.

De hogyan lehet webről származó további tartalmakat megjeleníteni az IBM SPSS-ben?

 

A Precognox által fejlesztett TAS Data Collector szolgáltatás segítségével ma már lehetséges az interneten elérhető további tartalmak felhasználása is az IBM SPSS alkalmazáson belül.

 

Hogyan? Ezt mutatjuk be most lépésről-lépésre.

1. Az adott weboldal (mint adatforrás) kiválasztása, tartalmának letöltése

 

A kiválasztott webes adatokat (példánkban a Keresővilág Blog weboldal tartalmát mutatjuk) első lépésben a Data Collector szolgáltatás segítségével letöltjük. A weben található strukturálatlan adatok (szöveges tartalmak) esetében a letöltés mellé azonban számos feladat (adattisztítás, validálás) társul, melyeket szakembereink végeznek el. Ezen munkafolyamatok megvalósulásának eredményeképpen a letöltött adatokból strukturált adatbázis jön létre, melyet a későbbiekben is folyamatosan frissítünk, így mindig az aktuális adatok válnak elérhetővé és felhasználhatóvá.
A letöltött adatokhoz egy biztonságos, jelszóval védett csatornán keresztül kap hozzáférést (server adatot, felhasználónevet és jelszót) a felhasználó.

Az IBM SPSS kezelőfelületén a következő lépéseket kell elvégezni:

2. Menürendszer segítségével a File – Import Data – Database – New Query kiválasztása

 

3. Kattintás az Add ODBC Data Source-ra

 

4. Utána kattintás az Add gombra

 

5. A MySQL típusú kapcsolat kiválasztása, utána kattintás a Finish gombra

 

6. Miután megadta a tőlünk korábban kapott kapcsolati paramétereket, kattintson az OK gombra

 

7. Az Adatforrás (Data Source) kiválasztása után kattintson a Next gombra

 

8. Válassza ki a Táblázatot (Table), állítsa be a Mezők (Fields) sorrendjét, majd kattintson a Befejezés gombra

 

9. Válassza a Grafikonok (Graphs) menüpontot és kezdődhet a vizualizáció a megszokott módon

 

Példa az elkészült vizualizációra

 

Az elkészült vizualizáció amellett, hogy betekintést nyújt a webes forrás tartalmába, komoly üzleti előnyt is jelent hiszen prezentációk, üzleti jelentések, értékelések vagy akár konkurenciaelemzések alapjául is szolgálhat. Ily módon aknázható ki az Interneten található hatalmas adatmennyiségben rejlő potenciál.

Ön is IBM SPSS felhasználó? Szeretne többet megtudni szöveganalitikai megoldásainkról?
Keresse munkatársunkat!

Hódi Péter
phodi@precognox.com
+36 20/416-74-79

 

A TAS Data Collector által biztosított strukturált adatbázisok – az integrációnak köszönhetően – a legtöbb ismert business intelligence eszközzel (Tableau, RapidMiner, Power BI, Google Data Studio) vizualizálhatók.

A TAS Data Collector működéséről és előnyeiről a TAS Text Analytics System oldalán olvashat bővebben.

 

Képek: IBM SPSS kezelőfelület és vizualizáció