“Bad Data Handbook” por Q Ethan McCallum, O’Reilly Media

Caratula Bad Data HandbookA pesar de que recolectar la información correcta es probablemente la parte más esencial de cualquier proyecto de periodismo de datos, uno de los aspectos más difíciles es la limpieza y verificación de datos, para hacer que sean útiles o comprensibles. Es mas, ni siquiera se puede saber si un conjunto de datos en particular es el más adecuado para la historia hasta que se haya limpiado. Los problemas de datos pueden tomar diferentes aspectos, desde faltas ortográficas hasta tipos de datos mixtos y todo lo demás. Es más, hay una amplia variedad de herramientas que se pueden utilizar para gestionar estas tareas de limpieza, y a veces de completar de manera eficiente requiere la aplicación de varios.

Bad Data Handbook es una compilación de 19 personas conversando sobre problemas que se han topado manipulando datos y como han salido a camino, todos los casos con ejemplos de código.

About these ads

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s