A gépi tanulás fogalma: bevezetés a MI világába

A gépi tanulás (angolul: machine learning) kifejezést kevesen ismerik, pedig legalább olyan elterjedt kellene legyen, mint maga a mesterséges intelligencia, hiszen a gépi tanulás maga az MI a valóságban. Ez az alkalmazási terület arra összpontosít, hogy a számítógépek képesek legyenek tanulni az adatokból és tapasztalatokból anélkül, hogy kifejezetten programozva lennének egy adott feladat megoldására. Az alapötlet az, hogy a gépi tanulás algoritmusok képesek „tanulni” az adatokból, megtanulni a mintákat és szabályokat, és ezeket a mintákat felhasználva előrejelzéseket, osztályozásokat vagy döntéseket hozni új adatok alapján.
Három fő típusát különböztetjük meg, tulajdonképpen az emberi beavatkozás mértékének alapján.
Az úgynevezett felügyelt tanulás (Supervised Learning) módszernél a gép tanulni próbál egy bemeneti-adat és kimeneti-cél párosításokból. Az algoritmusok azt próbálják megtanulni, hogy milyen összefüggések vannak a bemenet és a kimenet között, így amikor új bemenetek érkeznek, a gép képes megjósolni vagy osztályozni a kimenetüket. Például a felügyelt tanulás algoritmus megtanulhatja a képekről, hogy melyik kép mutatja egy macskát és melyik egy kutyát. Vagy képzeljük el, hogy egy spam-szűrőt hozunk létre az e-mailjeink számára. A felügyelt tanulás során a rendszer megkapja a korábbi e-mailek címkézett adatait, hogy megkülönböztesse a spamet a nem spamtől. Amint ezeket a mintákat tanulja, a rendszer képes lesz új e-maileket értékelni és kategorizálni.
Ezzel szemben a megerősítéses tanulás (Reinforcement Learning) során az algoritmus megtanulja a környezetében tett lépéseinek hatásait egy adott cél elérésére. A gép azáltal tanul, hogy következtetéseket von le a cselekedeteiből, és ezáltal próbálja mind tökéletesebben elérni a meghatározott célt. A megerősítéses tanulás tehát a rendszer tanulásának másik megközelítése, ahol a cél az, hogy olyan döntéseket hozzon, amelyek maximalizálnak egy előre meghatározott jutalomfunkciót. Ezt a módszert például autonóm járművek fejlesztésekor használják. A járműnek folyamatosan elemzik a környezetét és adatait, majd döntéseket hoznak (pl. kanyarodás vagy lassítás). Ezek a döntések a meghatározott jutalom (pl. baleset elkerülése) alapján értékelődnek ki. Másik példa lehet egy olyan robot, amely játszik egy videojátékot. A robot meg fogja tanulni, hogy melyik lépés vezet nagyobb pontszámhoz, és melyik lépés okozhat veszteséget. A megerősítéses tanulás során a robot folyamatosan próbálkozik és tanul a jutalmak és büntetések alapján, hogy egyre jobb teljesítményt érjen el a játékban.
A harmadik típus a felügyelet nélküli tanulás (Unsupervised Learning). Ebben a módszerben a gép olyan mintákat keres az adatokban, amelyek segítségével csoportokra vagy struktúrákra lehet osztani azokat anélkül, hogy lenne előre definiált kimenet. Például, csoportosítási vagy klaszterezési algoritmusok segítségével a gép megtalálhatja a hasonlóságokat az adatok között. A felügyelet nélküli tanulásban nincsenek címkézett kimeneti adatok, a rendszer azt kutatja, hogy minták fedezhetőek fel az adatokon belül. Képzeljük el, hogy egy vállalatnak adatbázisa van ügyfeleik vásárlásairól, de nem tudják, hogy milyen csoportokra oszthatók az ügyfelek. A felügyelet nélküli tanulás segíthet az üzleti csoportok azonosításában, így hatékonyabb marketingstratégiákat tudnak kialakítani.
A gépi tanulás tehát az a fogalom, melyet valójában ismernünk kellene alaposan, hiszen ez jelenti a mesterséges intelligenciát a gyakorlatban. A következő halmaz, mely tovább szűkíti a területet, a mélytanulás (Deep Learning), mellyel egy következő cikkünkben foglalkozunk.