Tareas ETL más Simples con Pandas: Funciones Útiles Aplicadas sobre Datos Públicos

Autores/as

DOI:

https://doi.org/10.59471/raia2024204

Palabras clave:

inteligencia artificial, Phyton, libreria Pandas, datos públicos

Resumen

La Inteligencia Artificial (IA según sus iniciales) es sin duda, una de las tecnologías más disruptiva en la actualidad. Así como también Python, es el lenguaje de programación más usado para desarrollos de modelos de IA, basado en el análisis de conjuntos de datos. La analítica de datos en Python inicio un crecimiento vertiginoso a partir del desarrollo de la librería Pandas, que otorga funcionalidades de simple implementación y gran utilidad para el procesamiento de datos crudos, siendo esta, quizás, la tarea más laboriosa en el proceso de elaboración de modelos. En este trabajo, se presentan las principales funcionalidades de Pandas aplicadas sobre datos públicos con ejemplos de código aplicados. 

Referencias

McKinney, W. “Data Structures for Statistical Computing in Python”. En Proceedings of the 9th Python in Science Conference (SciPy 2010).

McKinney, W. “Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython”. O'Reilly Media. ISBN: 978-1449319793 (2012).

Muhammad Arham, “Pandas. How to One-Hot-Encode Data”, KD-Nuggets (2023). En linea: https://www.kdnuggets.com/2023/07/pandas-onehot-encode-data.html

McKinney, Wes. "Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython." O'Reilly Media, 2017. ISBN: 978-1491957660.

Chen, D., Ma, C., & Zheng, L. (2021). "Pandas for Everyone: Python Data Analysis". Addison-Wesley Professional.

Wes McKinney. "Data Structures for Statistical Computing in Python." Proceedings of the 9th Python in Science Conference, 2010. Enlace al documento: https://conference.scipy.org/proceedings/scipy2010/pdfs/mckinney.pdf

Pandas Documentation. The official documentation for Pandas. Enlace a la documentación: https://pandas.pydata.org/pandas-docs/stable/

Kahn,Michael. Diabetes. UCI Machine Learning Repository. https://doi.org/10.24432/C5T59G.

Kaggle, Titanic - Machine Learning from Disaster. Enlace: https://www.kaggle.com/c/titanic/data

Descargas

Publicado

2024-12-30

Cómo citar

1.
Kamlofsky J, Manzano F, Lopez Yse D. Tareas ETL más Simples con Pandas: Funciones Útiles Aplicadas sobre Datos Públicos. Revista Abierta de Informática Aplicada [Internet]. 2024 Dec. 30 [cited 2025 Feb. 5];8(1):47-70. Available from: https://raia.revistasuai.ar/index.php/raia/article/view/204