TAS Tagger

A TAS Tagger szolgáltatás lehetővé teszi a szöveges tartalmak automatikus címkézését és kategorizálását. Az ilyen típusú tematizálás javítja ezen tartalmak (dokumentumok, e-mailek, cikkek) kereshetőségét.

A vállalati adatvagyon kiaknázása a sikeres üzleti döntés alapja

A megfelelő üzleti döntések meghozatalához alapvető fontosságú a nagy mennyiségű vállalati adatban rejlő potenciál kiaknázása. Ehhez azonban elengedhetetlen, hogy a rendelkezésre álló céges tartalmakban felismerjük és megcímkézzük a számunkra fontos részleteket.
Ezek, a vállalati adatvagyonba tartozó tartalmak a legkülönfélébbek lehetnek: üzleti dokumentumok (szerződések, jegyzetek), interneten elérhető szövegek (cikkek és egyéb dokumentumok), tudományos tartalmak (esszék, disszertációk, közzétett kutatások), vagy akár e-mailek.

Mi a TAS Tagger?

A TAS Tagger kifejlesztésének alapötlete egy olyan szoftver létrehozása volt, amely képes kinyerni és meghatározni a kulcsfontosságú kifejezéseket és témákat (címkék) a szöveges tartalmakból. Ezen kifejezések és a megnevezett entitások (személynevek, helyek, szervezetek, dátumok, stb.) azonosítása számítógépes nyelvészeti és gépi tanulási módszerekkel és eszközökkel történik. Az alkalmazott módszerek és eszközök kombinációja az ügyfél igényeitől függ.

Miért hasznos a TAS Tagger?

A nagyobb szöveges tartalmak (szövegtestek) címkézésével a megoldás javítja a dokumentumok (szöveges tartalmak) használatának hatékonyságát, mivel a címkézés által adatgazdagítás történik (a címkék metaadatok), ezáltal növekszik az adatminőség. A címkék segítségével pedig könnyebben kereshetővé válnak a dokumentumok vagy akár az e-mailek.
A TAS Tagger egyik legnagyobb előnye, hogy nem szükséges lemondani a cégen belül eddig alkalmazott keresőmotor használatáról, megoldásunk mindazonáltal elősegíti annak hatékonyabb működését.
Amennyiben az összetett felhasználói igények miatt a vállalati informatikai közegben szükségessé vált új keresőmotor bevezetése is, akkor a TAS Vállalati kereső kiváló megoldást jelent, amely a TAS Tagger tudásával együtt egy igazi Insight Engine-t ad az Ön kezébe.

A TAS Tagger integrált technológiái

A TAS Tagger egyszerre integrálja a technológiai óriások (Microsoft, IBM, Google) szöveganalitikai csomagjait, illetve az egyes részterületek vezetőinek (Basistech, Neticle) fejlett megoldásait.
A TAS Tagger az integrált modulok tudásának egyesítésével a legismertebb és legszélesebb körben alkalmazott szövegfeldolgozási módszereket állítja csatasorba:

  • téma-, kulcsszó- és entitáskinyerés
  • névelem azonosítás
  • nyelvfelismerés
  • hangulat- és emócióelemzés

Mindezek a módszerek az adott szektortól és szakmai területtől függetlenül működnek. A kinyert információk pedig azonnal feldolgozhatók a különböző részlegek szakértői által alkalmazott további rendszerekkel, így a felhasználók (elemzők, adattudósok, menedzserek, HR, értékesítési vagy marketing szakértők) és az alkalmazások (kereső motorok, BI eszközök, további az ügyfél által már használt megoldások) köre meglehetősen széles.
A fentieken túl a TAS Tagger új perspektívákat nyit a belső vagy külső Data Science csapat számára is, hiszen az automatikus címkék használata mellett felügyelt gépi tanulásos modelleket is készíthetnek, amelyek szintén hasznosíthatóak a vállalati infrastruktúrán belül.
A kézi címkézési funkció (annotáció) segítségével a dokumentumok előkészíthetőek a modellek építéséhez. Ezen modellek implementációja támogatja a szöveges tartalmak automatikus kategorizálását.

A címkézési folyamat

  • a címkézendő vállalati dokumentumok körének meghatározása
  • opcionálisan a vállalati adatokon túl a világhálón elérhető szöveges tartalmak legyűjtése a TAS Data Collector segítségével
  • címkék meghatározása automatikusan, vagy kézi címkézéssel
  • a kapott címkék felülvizsgálata
  • címkék lekérése tetszőleges számú további dokumentumokhoz

A TAS Tagger elemzi a szövegtestet és automatikusan meghatározza a címkéket. A lehetséges (felhasználható) címkék listáját az ügyfél akár előre is meghatározhatja. Ilyen esetben egy szakmai-szakterületi címke-adatbázist építünk a felhasználóval együttműködve. Ez az adatbázis fogja tartalmazni az előre meghatározott címkéket és a gépi tanulási modell ezt az adatbázist használja a címkézési folyamat során.
A TAS Tagger kezelőfelületén lehetőség van arra is, hogy a címkék közötti relációt (tágabb és szűkebb kifejezések, alá- és mellérendelés) meg lehessen határozni. Például: a talált kifejezések, mint például az autó, a busz, a motorkerékpár, az autóbusz, a teherautó mind a „jármű” szóhoz kapcsolódnak. A Tagger egyúttal (a megadott kapcsolatok által) felismeri a szinonimákat, mint például a bicikli-kerékpár szópár. A TAS Tagger kezelőfelületén lehetséges a címkék közötti kapcsolatok felülvizsgálata – historizált vagy vizuális formában.
A címke elfogadása után a szoftver tárolja azt. A rendszer egyúttal a szöveges tartalmat is tárolja.
Minél több kapcsolat és reláció van meghatározva, annál pontosabb címkézési eredmények érhetők el. Ezért mindig fontos, hogy a címke-adatbázis precízen kerüljön kialakításra.

A TAS Tagger kezelőfelület megjelenése

A TAS Tagger kezelőfelület a TAS Platform (TAS Cloud szolgáltatás) vagy On Premise (lokálisan telepített) keretein belül hozható létre. Megjelenése megfelel a TAS Platform arculatának. A kezelőfelület (GUI) felhasználóbarát és használata könnyen elsajátítható. A felület testreszabható, lehetséges az elemek egyenkénti módosítása az ügyféligényeknek megfelelően.

 

Tudjon meg többet a TAS Tagger megoldásról!

Amennyiben a szöveges tartalmak automatikus címkézését megvalósító megoldásra van szüksége, kérjük, vegye fel velünk a kapcsolatot!