Tareas ETL más Simples con Pandas: Funciones Útiles Aplicadas sobre Datos Públicos
DOI:
https://doi.org/10.59471/raia2024204Palabras clave:
inteligencia artificial, Phyton, libreria Pandas, datos públicosResumen
La Inteligencia Artificial (IA según sus iniciales) es sin duda, una de las tecnologías más disruptiva en la actualidad. Así como también Python, es el lenguaje de programación más usado para desarrollos de modelos de IA, basado en el análisis de conjuntos de datos. La analítica de datos en Python inicio un crecimiento vertiginoso a partir del desarrollo de la librería Pandas, que otorga funcionalidades de simple implementación y gran utilidad para el procesamiento de datos crudos, siendo esta, quizás, la tarea más laboriosa en el proceso de elaboración de modelos. En este trabajo, se presentan las principales funcionalidades de Pandas aplicadas sobre datos públicos con ejemplos de código aplicados.
Referencias
McKinney, W. “Data Structures for Statistical Computing in Python”. En Proceedings of the 9th Python in Science Conference (SciPy 2010).
McKinney, W. “Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython”. O'Reilly Media. ISBN: 978-1449319793 (2012).
Muhammad Arham, “Pandas. How to One-Hot-Encode Data”, KD-Nuggets (2023). En linea: https://www.kdnuggets.com/2023/07/pandas-onehot-encode-data.html
McKinney, Wes. "Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython." O'Reilly Media, 2017. ISBN: 978-1491957660.
Chen, D., Ma, C., & Zheng, L. (2021). "Pandas for Everyone: Python Data Analysis". Addison-Wesley Professional.
Wes McKinney. "Data Structures for Statistical Computing in Python." Proceedings of the 9th Python in Science Conference, 2010. Enlace al documento: https://conference.scipy.org/proceedings/scipy2010/pdfs/mckinney.pdf
Pandas Documentation. The official documentation for Pandas. Enlace a la documentación: https://pandas.pydata.org/pandas-docs/stable/
Kahn,Michael. Diabetes. UCI Machine Learning Repository. https://doi.org/10.24432/C5T59G.
Kaggle, Titanic - Machine Learning from Disaster. Enlace: https://www.kaggle.com/c/titanic/data
Descargas
Publicado
Número
Sección
Licencia
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.