El Machine Learning parte de unos datos de entrada y una serie de características facilitadas por el data scientist a aplicar al modelo.
Por ejemplo, se puede entrenar a la máquina para que establezca una conexión a partir de los datos de una persona (sexo, edad, nivel económico, etc) para determinar si esa persona tiene un riesgo alto para concederle o no el crédito bancario solicitado.
Con esta información y a través del Machine Learning es posible generar un patrón para identificar estos perfiles y predecir futuros comportamientos.
El campo que abarca el Aprendizaje Automático es como extenso y conviene diferenciar sus tipologías, divididas en tres subcampos bien diferenciados según sus características.
– El Supervised Learning es una técnica para deducir una función a partir de los datos de entrenamiento. Los datos de entrenamiento consisten en pares de objetos (normalmente vectores): un componentes del par son los datos de entrenada y el otro, los resultados deseados. En otra palabras, podemos enseñar a la máquina que con una serie de características un cliente es del tipo A y que el que tiene otras características no es el del tipo A. En el aprendizaje supervisado por tanto, el data scientist introduce los datos de entrada y salida y el Machine Learning se encarga de encontrar el patrón, la estructura interna de la información.
– Unsupervised Learning. Es una técnica en que los datos no han sido etiquetados previamente y solo se dispone de datos de entrada. Por tanto, la maquina debe de ser capaz de encontrar la estructura existente en los datos. Es muy útil para reducir la dimensionalidad de los datos reduciendo la pérdida de información o para el “clustering”. Un ejemplo es la segmentación de clientes, en la que a partir de toda una serie de características el Machine Learning es capaz de encontrar un número de grupos con características similares definido por el Data Scientist. Mediante la reducción de la dimensionalidad a dos o tres componentes, podemos representar gráficamente estos grupos para poder visualizarlos y tener así una mejor compresión.
– El Reinforcement Learning: Funciona en base a premios, a través del ensayo y error. Los datos de entrada se obtienen a través del feedback o retroalimentación del entorno. Si la máquina no lo hace bien se le da un “Premio” igual a = o negativo. En cambio, si toma una acción acertada se le dan premios con valor positivo para al final acabar encontrando una “buena” solución.
De esta forma conseguimos que el sistema aprenda de forma inteligente cuando toma decisiones acertadas, mejorando los procesos de decisión. El sistema será más capaz de tomar buenas decisiones si se realiza un entrenamiento adecuando para trasladar la perspectiva subjetiva humana a un proceso que mejorará continuamente su aprendizaje y su efectividad predictiva.