Análisis exploratorio de datos (EDA) de vuelos y programas de fidelidad.
Se realiza limpieza de datos (nulos en Salary y College), análisis estadístico, visualizaciones de distribuciones y correlaciones para la obtención de insights de negocio, en el contexto de la evaluación del Módulo 3 del bootcamp Adalab.
- Descripción general
- Objetivos
- Dataset
- Tecnologías
- Estructura del proyecto
- Metodología
- Instrucciones de uso
- Autora
Este proyecto forma parte de la evaluación final del Módulo 3 de Análisis de Datos e Inteligencia Artificial del bootcamp Adalab.
Se centra en el análisis exploratorio de dos datasets relacionados con:
- Reservas de vuelos (
Customer Flight Activity.csv) - Programas de fidelidad de clientes (
Customer Loyalty History.csv)
Realizar un análisis exploratorio de datos completo sobre reservas de vuelos y programas de fidelidad, identificando patrones en variables como salario, provincia, nivel educativo y comportamiento del cliente, para generar insights de negocio.
Customer Flight Activity.csv
| Característica | Descripción |
|---|---|
| Filas | ~400.500 registros |
| Columnas | 15–20 |
Customer Loyalty History.csv
| Característica | Descripción |
|---|---|
| Filas | ~16.700 clientes |
| Columnas | 10–15 |
pd.merge(df_flights, df_loyalty, on='loyalty_number', how='inner')- Python 3.9+
- pandas
- numpy
- matplotlib
- seaborn
- Jupyter Notebook
bda-modulo-3-evaluacion-final-cristinaragon/
├── data/
│ ├── Customer Flight Activity.csv
│ ├── Customer Loyalty History.csv
│ ├── customer_flight_activity_clean.csv
│ ├── customer_loyalty_history_clean.csv
│ ├── df_merged_clean.csv
│ ├── frecuencias_categoricas.csv
│ └── outliers_todas_columnas.csv
├── notebooks/
│ └── Análisis_Loyalty.ipynb
├── graficos/
│ ├── pregunta1_vuelos_mes.png
│ ├── pregunta2_simple.png
│ ├── pregunta3_provincia.png
│ ├── pregunta4_salario_visual.png
│ ├── pregunta5_tarjetas.png
│ └── pregunta6_civil_genero.png
└── README.md
- Exploración y limpieza de datos
- Imputación de valores nulos en
Salarymediantegroupbypor nivel educativo
- Imputación de valores nulos en
- EDA
- Análisis de distribuciones
- Detección de outliers mediante el método IQR
- Visualización
- Gráficos comparativos para analizar el comportamiento de los clientes
- Análisis estadístico
- Pruebas de hipótesis para evaluar diferencias en reservas de vuelos por nivel educativo
- Evaluación de Diferencias por Nivel Educativo Se analizó el impacto del nivel de estudios en el comportamiento de reserva
- Clonar el repositorio:
Bash
git clone https://github.com/tu-usuario/bda-modulo-3-evaluacion-final-cristinaragon.git
-
Instalar dependencias: Asegúrate de tener instaladas las librerías mencionadas en la sección de Tecnologías.
-
Ejecutar el análisis: Abre el archivo Análisis_Loyalty.ipynb y ejecuta todas las celdas.
Cristina Aragón
Estudiante del Bootcamp de Data Analysis – Adalab
📧 cristinaragon77@gmail.com
📅 Enero 2026