Mi a TAS Data Collector?
A TAS Data Collector szolgáltatás – a TAS szöveganalitikai platform részeként – képes az interneten található strukturálatlan adatokat (szöveges tartalmakat) letölteni oly módon, hogy a tartalmakat strukturált formába rendezni, ezáltal elérhetővé teszi más információs rendszerek számára, illetve alkalmassá a további feldolgozásra, elemzésre vagy vizualizálásra.
A TAS Data Collector által legyűjtött tartalmak azonnal hasznosíthatóak, vagy alapjául szolgálhatnak a TAS Platform további, egymásra épülő moduljaival megvalósítható szöveganalitikai munkafolyamatoknak.
Az adatgyűjtési folyamat részletei
- a megrendelő által megjelölt weboldalak (vagy azon belül található részegységek) adatai (szöveges tartalmai) a szolgáltatás által legyűjtésre kerülnek
- a további lépéseket (adattisztítás, adatgazdagítás, validálás) szakembereink felügyelete mellett valósítja meg a rendszer
- a folyamat végeredményeként olyan strukturált adatbázis jön létre, mely már alkalmas a további adatfeldolgozásra (elemzés, vizualizálás) vagy alapjául szolgálhat további szöveganalitikai megoldásoknak
- a legyűjtött, megfelelő formátumú tartalmak biztosítása, átadása a megrendelő felé (akár egy authentikált, jelszóval védett csatornán keresztül)
Lépjen velünk kapcsolatba!
Szeretne többet megtudni a TAS Data Collectorról vagy a TAS szövegelemző rendszer további megoldásairól? Írjon nekünk, vagy küldje el üzenetét az oldal alján található kapcsolatfelvételi űrlap segítségével!

Varga Zoltán
Key Account Manager
zoltan.varga@precognox.com
+36 70 257 10 64
A TAS Data Collector jellemzői
- a szolgáltatás képes egy webhelyről legyűjteni a látható adatokat, metaadatokat (címkéket, képleírást) vagy akár a lapszámozást.
- az aloldalak, a dinamikus, trükkös lapozású, hierarchikus, diavetítéssel rendelkező vagy többnyelvű tartalmú, esetleg bejelentkezést igénylő oldalak sem okoznak problémát az adatlegyűjtés folyamán
- rejtett adatok esetén egy screenshot-megoldást kínálunk (képernyőkép az adatok eredeti pontos megjelenítésével)
- a robots.txt által – megjelölt tartalmakat tiszteletben tartjuk, így azok nem kerülnek letöltésre
- számos különböző dokumentumból és képformátumból (PDF, táblázatkezelő, diagram vagy képfájlformátumok) lehetséges a szövegkinyerés
- a kimeneti formátum: JSON kiterjesztés, de egyéb formátum is lehetséges (például MySQL adattábla, melynek elemzése, vizualizásása azonnal lehetséges a legismertebb business intelligence eszközökkel (részletek a technikai leírás menüpontban)
- speciális (további szoftverfejlesztést igénylő) egyedi megoldás szállítása is lehetséges
Mire használhatók a legyűjtött tartalmak?
- kutatásokhoz, fejlesztési projektekhez
- újabb tartalmak, publikációk megírásához
- szolgáltató-, információnyújtó-, tematikus gyűjtőoldalak, blogok, közérdekű- és open data portálok adatokkal történő feltöltéséhez
- elemzések, statisztikák, vizualizációk létrehozásához
- vállalati folyamatok / működés biztosításához, adatmentésre (webhely, internetes adatbázis állapotának lementéséhez)
- konkurenciafigyeléshez
- sajtófigyeléshez
- kereshető adatbázisok létrehozásához
- mesterséges intelligencia megalkotásához, gépi tanuláshoz
- adatváltozások nyomon követéséhez
A TAS Data Collector megjelenése
A TAS Data Collector GUI lehetőséget nyújt a letöltési adatfolyam figyelemmel kísérésére. A kezelőfelület megjelenése a TAS Platform arculatához illeszkedik.

A kezelőfelület az alábbiakról ad tájékoztatást:
- források áttekintése: melyek vannak bekötve, honnan mennyi rekord érkezik, mennyi a valid és mennyi a hibás rekord
- össz-rekordszám áttekintése, időbeni alakulásuk
- gyűjtés állapota
- mikor futott a gyűjtés
Szöveganalitikai megoldásainkról bővebben olvashat a TAS Platform angol nyelvű termékoldalán!
Lépjen velünk kapcsolatba!
Szeretne többet megtudni a TAS Data Collectorról vagy a TAS szövegelemző rendszer további megoldásairól? Írjon nekünk, vagy küldje el üzenetét az alábbi kapcsolatfelvételi űrlap segítségével!