Predicción del rendimiento académico en la UNADECA por medio de sistemas de clasificación

Contenido principal del artículo

Dodanim Castillo Aráuz
https://orcid.org/0009-0002-0578-5938
Jairo Jonathán Martínez
https://orcid.org/0000-0003-0004-6132

Resumen

Predecir el rendimiento académico de los estudiantes no es solo una tarea que atrae a los investigadores sino también al personal administrativo de la facultad universitaria. Es posible crear modelos efectivos mediante algoritmos específicos para minería de datos educativos supervisados y no supervisados. Al conjunto de datos se le aplicaron técnicas de limpieza y codificación. La ejecución de los algoritmos y la comparación de sus métricas permitieron determinar los cursos a los que se debe dar asistencia con mayor atención en la búsqueda de mejorar el rendimiento académico de los estudiantes. Los datos fueron fraccionados en dos grupos, uno para aprendizaje y otro para predicción. Se usaron algoritmos en el lenguaje Python y una herramienta gráfica, RapidMiner Studio. No se trabajaron agrupamientos por falta de información consistente en los datos originales. El algoritmo de clasificación que tuvo las mejores métricas fue el Random Forest superando en los distintos casos el 90% de accurracy. En cambio, RapidMiner el algoritmo con mejores resultados fue Gradient Boosted Trees con un accuracy del 93.6%, con la predicción específica del resultado final de aprobado o reprobado. Se hizo una comparativa por escuelas, con resultados muy similares para Enfermería, Psicología y Teología, con una precisión aproximada de 93%.

Detalles del artículo

Cómo citar
Castillo Aráuz, D., & Martínez, J. J. (2023). Predicción del rendimiento académico en la UNADECA por medio de sistemas de clasificación . Unaciencia Revista De Estudios E Investigaciones, 16(31), 17–35. https://doi.org/10.35997/unaciencia.v16i31.738
Sección
Artículo de investigación

Citas

A Alférez, G. H., Esteban, O. A., Clausen, B. L., & Ardila, A. M. M. (2022). Automated machine learning pipeline for geochemical analysis. Earth Science Informatics, 15(3), 1683-1698. https://doi.org/10.1007/s12145-022-00821-8

Almasri, A., Alkhawaldeh, R. S., & Çelebi, E. (2020). Clustering-Based EMT Model for Predicting Student Performance. Arabian Journal for Science and Engineering, 45(12), 10067–10078. https://doi.org/10.1007/s13369-020-04578-4

Alsariera, Y. A., Baashar, Y., Alkawsi, G., Mustafa, A., Alkahtani, A. A., & Ali, N. (2022). Assessment and Evaluation of Different Machine Learning Algorithms for Predicting Student Performance. Computational Intelligence and Neuroscience, 2022, 1–11. https://doi.org/10.1155/2022/4151487

Altabrawee, H., Ali, O. A. J., & Ajmi, S. Q. (2019). Predicting Students’ Performance Using Machine Learning Techniques. JOURNAL OF UNIVERSITY OF BABYLON for Pure and Applied Sciences, 27(1), 194–205. https://doi.org/10.29196/jubpas.v27i1.2108

Babu, C., & Varghese, R. (2020). Predicting Student’ s Performance Using Educational Data Mining. 9(1).

Burman, I., & Som, S. (2019). Predicting Students Academic Performance Using Support Vector Machine. Proceedings - 2019 Amity International Conference on Artificial Intelligence, AICAI 2019, 756–759. https://doi.org/10.1109/AICAI.2019.8701260

Dhilipan, J., Vijayalakshmi, N., Suriya, S., & Christopher, A. (2021). Prediction of Students Performance using Machine learning. IOP Conference Series: Materials Science and Engineering, 1055(1), 012122. https://doi.org/10.1088/1757-899x/1055/1/012122

Domingos, P. (2012). A few useful things to know about machine learning. Communications of ACM, 55(10), 78–87. https://doi.org/10.1145/2347736.2347755

Gull, H., Saqib, M., Iqbal, S. Z., & Saeed, S. (2020). Improving Learning Experience of Students by Early Prediction of Student Performance using Machine Learning. 2020 IEEE International Conference for Innovation in Technology, INOCON 2020, 1–4. https://doi.org/10.1109/INOCON50539.2020.9298266

Hasan, H. M. R., Shahariar, A., & Rabby, A. (n.d.). Hasan, H. M. R., Rabby, A. S. A., Islam, M. T., & Hossain, S. A. (2019). Machine Learning Algorithm for Student’s Performance Prediction. In 2019 10th International Conference on Computing, Communication and Networking Technologies (ICCCNT) (pp. 1-7). Kanpur, India. https://doi.org/10.1109/ICCCNT45670.2019.8944629

Hasterok, D., Gard, M., Bishop, C. M. B., & Kelsey, D. (2019). Chemical identification of metamorphic protoliths using machine learning methods. Computers and Geosciences, 132(March), 56–68. https://doi.org/10.1016/j.cageo.2019.07.004

Jawad, S. M. D. (2021). Student Performance Analysis System Using Machine Learning. Journal of Resource Management and Technology, 12(84), 84–90.

Kamel, H., Abdulah, D., & Al-Tuwaijari, J. M. (2019). Cancer Classification Using Gaussian Naive Bayes Algorithm. Proceedings of the 5th International Engineering Conference, IEC 2019, 165–170. https://doi.org/10.1109/IEC47844.2019.8950650

Marius-Constantin, P., Balas, V. E., Perescu-Popescu, L., & Mastorakis, N. (2009). Multilayer perceptron and neural networks. WSEAS Transactions on Circuits and Systems, 8(7), 579–588.

Mierswa, Igno, and K. (2022). RapidMiner. RapidMiner Studio. https://rapidminer.com/

Osman, A. S. (2019). Data mining techniques: Review. International Journal of Data Science Research, 2(1), 1–4.

Priya, S., Ankit, T., & Divyansh, D. (2021). Student performance prediction using machine learning. Advances in Parallel Computing, 39(03), 167–174. https://doi.org/10.3233/APC210137

Rimadana, M. R., Kusumawardani, S. S., Santosa, P. I., & Erwianda, M. S. F. (2019). Predicting Student Academic Performance using Machine Learning and Time Management Skill Data. 2019 2nd International Seminar on Research of Information Technology and Intelligent Systems, ISRITI 2019, 511–515. https://doi.org/10.1109/ISRITI48646.2019.9034585

Vasani, V. P., & Gawali, R. D. (2013). Classification Performance Evaluation. Encyclopedia of Systems Biology, 3(3), 411–411. https://doi.org/10.1007/978-1-4419-9863-7_100213