Este proyecto desarrolla un modelo de Regresión Lineal para predecir el rendimiento académico en matemáticas (calificación final G3) de estudiantes, basándose en el conjunto de datos 'Student Performance' de UCI.
Puntos Clave: Extracción y Limpieza: Los datos se obtuvieron mediante la librería ucimlrepo. Se realizó un análisis de valores nulos y se descartaron variables poco significativas como Pstatus, nursery, romantic, famsize y guardian basándose en pruebas estadísticas ( 𝑝 -values). Tratamiento de Datos: Se aplicó Target Encoding para transformar variables categóricas (como el trabajo de los padres o la escuela) en valores numéricos útiles para el modelo. Resultados: El modelo final alcanzó un Coeficiente de Determinación ( 𝑅2 ) de 0.85, lo que indica que explica el 85% de la varianza del rendimiento académico. Las calificaciones previas (G1, G2) y factores sociales resultaron ser los predictores más fuertes. Visualización: Los gráficos de dispersión y de residuos confirman que las predicciones son altamente precisas, con una tendencia clara y errores distribuidos de forma aceptable.
Estoy abierta a nuevas oportunidades. Hablemos sobre cómo puedo aportar este nivel de ingeniería a tu equipo.
Hablemos