TAS Data Collector

A TAS Data Collector adatgyűjtő használatával lehetséges az interneten elérhető domain összes strukturálatlan és strukturált adatának összegyűjtése. Az összegyűjtött adatok felhasználhatóak akár nyers formában is, vagy hasznosíthatóak a TAS szöveganalitikai rendszer további szolgáltatásainak segítségével.

Mi a TAS Data Collector?

A TAS Data Collector szolgáltatás – a TAS szöveganalitikai platform részeként – képes az interneten található strukturálatlan adatokat (szöveges tartalmakat) letölteni oly módon, hogy a tartalmakat strukturált formába rendezni, ezáltal elérhetővé teszi más információs rendszerek számára, illetve alkalmassá a további feldolgozásra, elemzésre vagy vizualizálásra.

A TAS Data Collector által legyűjtött tartalmak azonnal hasznosíthatóak, vagy alapjául szolgálhatnak a TAS Platform további, egymásra épülő moduljaival megvalósítható szöveganalitikai munkafolyamatoknak.

Az adatgyűjtési folyamat részletei

  • a megrendelő által megjelölt weboldalak (vagy azon belül található részegységek) adatai (szöveges tartalmai) a szolgáltatás által legyűjtésre kerülnek
  • a további lépéseket (adattisztítás, adatgazdagítás, validálás) szakembereink felügyelete mellett valósítja meg a rendszer
  • a folyamat végeredményeként olyan strukturált adatbázis jön létre, mely már alkalmas a további adatfeldolgozásra (elemzés, vizualizálás) vagy alapjául szolgálhat további szöveganalitikai megoldásoknak
  • a legyűjtött, megfelelő formátumú tartalmak biztosítása, átadása a megrendelő felé (akár egy authentikált, jelszóval védett csatornán keresztül)

Lépjen velünk kapcsolatba!

Szeretne többet megtudni a TAS Data Collectorról vagy a TAS szövegelemző rendszer további megoldásairól? Írjon nekünk, vagy küldje el üzenetét az oldal alján található kapcsolatfelvételi űrlap segítségével!

Zoltan I Varga

Varga Zoltán
Key Account Manager
zoltan.varga@precognox.com
+36 70 257 10 64

A TAS Data Collector jellemzői

  • a szolgáltatás képes egy webhelyről legyűjteni a látható adatokat, metaadatokat (címkéket, képleírást) vagy akár a lapszámozást.
  • az aloldalak, a dinamikus, trükkös lapozású, hierarchikus, diavetítéssel rendelkező vagy többnyelvű tartalmú, esetleg bejelentkezést igénylő oldalak sem okoznak problémát az adatlegyűjtés folyamán
  • rejtett adatok esetén egy screenshot-megoldást kínálunk (képernyőkép az adatok eredeti pontos megjelenítésével)
  • a robots.txt által – megjelölt tartalmakat tiszteletben tartjuk, így azok nem kerülnek letöltésre
  • számos különböző dokumentumból és képformátumból (PDF, táblázatkezelő, diagram vagy képfájlformátumok) lehetséges a szövegkinyerés
  • a kimeneti formátum: JSON kiterjesztés, de egyéb formátum is lehetséges (például MySQL adattábla, melynek elemzése, vizualizásása azonnal lehetséges a legismertebb business intelligence eszközökkel (részletek a technikai leírás menüpontban)
  • speciális (további szoftverfejlesztést igénylő) egyedi megoldás szállítása is lehetséges

Mire használhatók a legyűjtött tartalmak?

  • kutatásokhoz, fejlesztési projektekhez
  • újabb tartalmak, publikációk megírásához
  • szolgáltató-, információnyújtó-, tematikus gyűjtőoldalak, blogok, közérdekű- és open data portálok adatokkal történő feltöltéséhez
  • elemzések, statisztikák, vizualizációk létrehozásához
  • vállalati folyamatok / működés biztosításához, adatmentésre (webhely, internetes adatbázis állapotának lementéséhez)
  • konkurenciafigyeléshez
  • sajtófigyeléshez
  • kereshető adatbázisok létrehozásához
  • mesterséges intelligencia megalkotásához, gépi tanuláshoz
  • adatváltozások nyomon követéséhez

A TAS Data Collector megjelenése

A TAS Data Collector GUI lehetőséget nyújt a letöltési adatfolyam figyelemmel kísérésére. A kezelőfelület megjelenése a TAS Platform arculatához illeszkedik.

A kezelőfelület az alábbiakról ad tájékoztatást:

  • források áttekintése: melyek vannak bekötve, honnan mennyi rekord érkezik, mennyi a valid és mennyi a hibás rekord
  • össz-rekordszám áttekintése, időbeni alakulásuk
  • gyűjtés állapota
  • mikor futott a gyűjtés

Szöveganalitikai megoldásainkról bővebben olvashat a TAS Platform angol nyelvű termékoldalán!

Lépjen velünk kapcsolatba!

Szeretne többet megtudni a TAS Data Collectorról vagy a TAS szövegelemző rendszer további megoldásairól? Írjon nekünk, vagy küldje el üzenetét az alábbi kapcsolatfelvételi űrlap segítségével!

Zoltan I Varga

Varga Zoltán
Key Account Manager
zoltan.varga@precognox.com
+36 70 257 10 64