Aprendizaje por refuerzo

El entrenamiento por refuerzo es uno de los campos más interesantes para la aplicación del Machine Learning. En el Reinforcement Learning o aprendizaje por refuerzo, el software realiza observaciones y toma acciones dentro de un entorno. A cambio, recibe recompensas. Su objetivo es aprender a actuar de una manera que maximice las recompensas esperadas a largo plazo. En resumen, el agente actúa en el entorno y aprende por prueba y error para maximizar sus recompensas y minimizar sus sanciones.
La característica principal es que, debido al sistema de recompensas y sanciones, el software aprende de sus errores con cada acción que realiza, mejorando así la calidad del método. De esta manera, una máquina puede tomar decisiones aunque no almacene un conocimiento a priori del entorno o de las variables que se están dando, y realizar de manera satisfactoria cuestiones abstractas más avanzadas.
Grupo AIA es puntero en el uso de los algoritmos y modelos más recientes como el Reinforcement Learning o aprendizaje por refuerzo en áreas como:
Clasificación de secuencias de ADN
Coche autónomo
Diagnósticos médicos
Optimización en la distribución de gas