Aniversario Perú Lunes, 24 agosto 2015

Periodismo de Datos II. Capítulo 2

Aniversario Perú

soy Biólogo, PhD. Hobbies: investigador en usos de las TIC, periodismo de datos, nerd, etc.

Si no leíste, aquí está el capítulo anterior:

Descarga masiva de los Registros de Visitas. Parte 1.

Según la Ley de Transparencia, las instituciones estatales están obligadas de colgar en sus páginas web información de interés público como contratos, licitaciones, convocatorias, gastos, registros de visitas a sus instalaciones, etc.

El problema que tenemos es que la información es difícil de acceder de manera eficiente. Solo se puede descargar de a poquitos. Muchas veces tienen medidas de seguridad innecesarias como CAPTCHA, passwords, etc. Eso sería justificable en páginas webs que sirven para subir información y crear cuentas de usuario, así nos evitamos llenarnos de spam y bots. Pero creo que esto es innecesario cuando el objetivo es la descarga de información.

Ya que la labor periodística se facilita al tener a la mano datos masivos (big data, como gustan de llamar algunos), es necesario usar una serie de trucos para poder descargar esta información.

Agárrate de tu silla que aquí comienza la primera parte de la descarga masiva de datos de webs estatales.

Los comandos en detalle

Aquí copio todo el procedimiento realizado en la consola de comandos (en caso no se haya visto bien). Puedes copiar y pegar el código para que hagas pruebas en tu computadora.

Tarea para la casa

En el video, viste que se encontró algo de 437 visitantes para el 1ero de agosto del 2015.

2015-08-24_cosola1

Por razones que serán evidentes en el próximo capítulo, es de esperarse que el número de visitantes cambie con frecuencia.

Dos preguntas:

  1. Diga usted ¿cuántas visitas registras le salen a usted al hacer el ejercicio?
  2. Diga usted ¿cuántas visitas registras salen para la fecha 13 de Abril del 2015?

Pueden enviar las repuestas por email yoni@aniversarioperu.me o Twitter @aniversarioperu.

Aniversario Perú

soy Biólogo, PhD. Hobbies: investigador en usos de las TIC, periodismo de datos, nerd, etc.
Secured By miniOrange