Práctica 4 | Cómo Medir y Evaluar la Toma de Decisiones

Contenido:

  • 1 Cómo saber si el modelo realmente está aprendiendo - Video Series
  • 2 Cómo usar Python y Sklearn para medir el desempeño de un modelo - Código Python

Tiempo aproximado: 40 min



Introducción

1 Cómo saber si el modelo realmente está aprendiendo

¿Por qué es importante evaluar apropiadamente?

Para evitar el sobre ajuste primero debemos entenderlo. El sobre ajuste evita que el modelo generalice, es decir que asigne la etiqueta correcta a ejemplos nuevos. El sobre ajuste existe para aprendizaje supervisado: clasificación y regresión.

Hay tres tipos de ajuste:

  • Bajo ajuste. El modelo no aprendió a asociar características con etiquetas.
  • Sobre ajuste. El modelo aprendió la relación exacta y precisa pero solo para los datos con el que fue entrenado.
  • Ajuste apropiado. El modelo aprendió, pero no memorizó los datos de entrenamiento.

Para clasificación

Para regresión

¿Por qué no se habla de sobre ajuste para el agrupamiento? El sobre ajuste se da cuando se asocian características con etiquetas. No existen etiquetas en aprendizaje no supervisado (agrupamiento). Sin embargo, existen otros problemas que debemos evitar en aprendizaje no supervisado, y los veremos con detalle en el curso Cómo resolver problemas con aprendizaje no supervisado.

Una forma de identificar el sobre ajuste es usando datos distintos para entrenar y para evaluar. Veamos.

Para evitar el sobre ajuste hay que identificarlo. En el ejemplo de los curriculums, usamos los mismos datos para entrenar y para evaluar, y la evaluación fue buena. Como el sistema no se enfrentó a nuevos ejemplos sino hasta producción, fue en ese momento que descubrimos un potencial sobre ajuste.

Usar dos conjuntos de datos, uno de entrenamiento y uno de evaluación, te permitirá identificar el sobre ajuste. En consecuencia, podrás corregir el modelo o el procesamiento de los datos. Para obtener estos dos conjuntos, tendrás que dividir la cantidad de datos que tengas.

2 Cómo usar Python y Sklearn para medir el desempeño de un modelo


Después del siguiente video, encuentras el código en Python correspondiente.

Ir a Google Colab


Terminar y continuar