Práctica 3 | Cómo Elegir un Modelo de Aprendizaje Supervisado II
Contenido:
- 1 Teoremas y la elección de un modelo - Texto
- 2 Teorema No-Free-Lunch y sus implicaciones en la selección de un modelo - Video
- 3 Teorema Ugly Duckling y sus implicaciones en la selección de un modelo - Texto
- 4 Cómo elegir un modelo de aprendizaje supervisado - Video
Tiempo aproximado: 5 min
1 Teoremas y la elección de un modelo
Aunque debes pensar en el problema, el dataset, y el negocio. Existen algunos teoremas con curiosos nombres que sugieren elegir varios modelos, y varias características. Después evaluarlos y elegir el que muestre el mejor desempeño. Estos teoremas son:
- Teorema de “No hay almuerzo gratis” No Free Lunch Theorem
- Teorema del “patito feo” Ugly Duckling Theorem
2 Teorema No-Free-Lunch y sus implicaciones en la selección de un modelo
Este es un enfoque práctico. Sobretodo teniendo en cuenta la rapidez con la que podemos probar modelos usando Python y módulos como Sklearn.
La razón de lo anterior es que, como veremos, cada modelo de aprendizaje hace diferentes suposiciones de la relación características-etiqueta. Por ejemplo, Naive Bayes supone que la relación entre características es independiente, y que tiene una distribución Gaussiana, de Bernoulli entre otras. Por lo general, cuando obtenemos los datos, no estamos seguros de qué suposiciones son verdaderas o no. Es más fácil y eficiente, probar varios modelos y elegir el mejor. Es probable que el mejor haga las suposiciones más acertadas.
3 Teorema Ugly Duckling y sus implicaciones en la selección de un modelo
Simplificando, este teorema sugiere que de todas las posibles características de una instancia, no existe un conjunto de características mejor que otro. Esto abre la posibilidad de probar usando todas las características o solo un conjunto de ellas. A la pregunta
¿Hay alguna característica o representación de patrón que produzca un mejor rendimiento de clasificación en ausencia de suposiciones?
El teorema del “ugly duckling” establece que no hay un conjunto de características que, en ausencia de suposiciones funcione mejor que otro.
4 Cómo elegir un modelo de aprendizaje supervisado
Recuerda: No busques modelos complicados a menos que los más simples no hayan funcionado. No hagas tanto pre procesamiento a menos que el básico no haya funcionado.
El uso de aprendizaje de máquina es exploratorio. Aunque sí debemos tener en mente el tipo de problema, los datos y la aplicación del sistema, en múltiples ocasiones tendremos que probar más de un modelo con combinaciones distintas de características para poder seleccionar uno.