Klasszifikáció

A klasszifikáció vagy osztályozás, egy olyan felügyelt gépi tanulásos feladat, amelynek célja, hogy bizonyos elemeket kategorizálni tudjunk. Ennek érdekében egy olyan algoritmust trénelünk, amely képes bármilyen típusú adathoz (pl. kép, szöveg) címkéket rendelni. Honnan tudhatjuk, hogy klasszifikációs problémával van dolgunk? Amikor előre meghatározott kategóriáink vannak, amelyekbe bizonyos elemeket be szeretnénk sorolni. Például bejövő e-maileket szeretnénk a cégünk csapatai között szétosztani, azaz minden egyes e-mailről el akarjuk dönteni, hogy melyik az a csapat, amelyiknek a felelősségi körébe tartozik, majd az e-mailt adott csapathoz rendeljük.

Milyen ismerettel kell rendelkeznünk az osztályainkról? Nem kell feltétlenül tudnunk, hogy milyen tulajdonságok határozzák meg a kategóriáinkat, ezt a feladatot bátran rábízhatjuk az algoritmusunkra. Nekünk elegendő pusztán azzal tisztában lennünk, hány darab kategóriával van dolgunk. Például elég, ha tudjuk, hogy adott teljesítményt egy 1 és 5 közötti skálán szeretnénk értékelni, azaz 5 kategóriába kell besorolnunk az elemeket. Az algoritmus a tanító adat alapján kitalálja, hogy milyen tulajdonságok különböztetik meg az egyes osztályokat.

Data Science csapatunk a klasszifikáció összetettebb problémáira is képes megoldást kínálni.