M0S9 - Procesos ETL/ELT con Python
Contenido:
- 1 Procesos ETL/ELT con Python - ¿Qué herramientas existen?
- 2 Recurso: Ejercicio entregable Código - Colab
- 3 Solución de dudas - Q&A
Tiempo aproximado: 5 horas
1 Procesos ETL/ELT con Python - ¿Qué herramientas existen?
2: Recursos: Ejercicio entregable Código
Ir a Google Colab
NOTA: El dataset lo puedes descargar de Kaggle en la siguiente liga:
Instrucciones
- Descarga el dataset merged_data_cleaned.csv ábrelo en tu máquina o en algún editor de hojas de cálculo.
- Crea 2 hojas adicionales en Excel.
- En la primera hoja escribe 5 preguntas que creas que pueden ser respondidas con análisis de datos/machine learning.
- En la segunda hoja deben estar los datos. Clasifica los atributos (columnas) según 3 colores. Verde, el atributo es relevante para responder la primera pregunta. Ámbar, el atributo puede o no ser relevante para responder la primera pregunta. Rojo, el atributo no es relevante para responder la primera pregunta.
- En la tercera hoja escribe el significado de cada uno de los atributos (columna).
- Ahora carga el dataset en Colab. Visualiza los primeros 5-10 registros (filas) del dataframe.
- Planea la limpieza de tu dataset. Escribe los detalles que veas de cada columna. ¿Hay valores nulos? ¿La estructura de todos los datos de la misma columna es consistente?... etcétera.
- Realiza los mismos pasos con el dataset que elegiste en prácticas anteriores.
Puedes ver un ejemplo de la hoja de cálculo aquí: Ejemplo
El ejemplo del ejercicio en colab lo puedes ver haciendo clic en el ícono de Google Colab de arriba.
Cualquier duda, puedes escribir en la sección de comentarios de abajo o por el grupo de WhatsApp.
3: Solución de dudas - Q&A
¿Tienes alguna pregunta? Escríbela abajo y te respondo ASAP. Recuerda que también tienes acceso a asesorías uno a uno por videollamada para dudas más complicadas.
0 comments