Escribe al autor
You can use this page to email Paul Bradshaw y Bárbara Maseda about Extracción de datos para periodistas.
Sobre este libro
La extracción de datos o "scraping" –hacer que una computadora capture información de fuentes en internet– es una de las técnicas más poderosas que los periodistas pueden usar para llegar de primeros a la noticia, o para descubrir informacion exclusiva que nadie mas posee.
Más rápido que una solicitud información y más potente que las técnicas de búsqueda avanzada, el scraping permite conseguir los datos estructurados de formas que facilitan su analisis, y a veces puede servir incluso para conseguir informacion que algunas organizaciones preferirian no compartir
*Extracción de datos para periodistas* contiene una amplia gama de técnicas de scraping, desde algunas no más complicadas que una fórmula en una hojas de cálculo, hasta desafíos complejos, como trabajar con bases de datos o extraer informacion de cientos de documentos.
El libro esta diseñado para que se aprecien los resultados de lo aprendido a cada paso, avanzando hacia la construcción de herramientas más ambiciosas y poderosas.
En apenas cinco minutos aprendera a escribir su primer extractor al inicio del libro, pero mas importante aun es que estará aprendiendo principios y técnicas clave para resolver problemas de extracción de datos.
A diferencia de textos generales de programación, todo el contenido de este libro tiene aplicación directa en periodismo y cada principio de programación aparece conectado a su uso en la produccion de noticias. En lugar de ocuparse de herramientas o tecnicas particulares, como hacen algunas guías y blogs, este texto tiene por objeto desarrollar habilidades que pueda aplicar en nuevas situaciones y con nuevas herramientas.
Sobre de los autores
Paul Bradshaw dirige el programa de maestría en Periodismo Online en Birmingham City University, y es profesor visitante en la facultad de Periodismo de City University en Londres. Paul es el editor del blog Online Journalism Blog, y es el fundador del sitio web de periodismo de investigación HelpMeInvestigate. Ha escrito para journalism.co.uk, Press Gazette, los blogs de datos de los periódicos británicos The Guardian y The Telegraph, InPublishing, Nieman Reports y el Instituto Poynter en los Estados Unidos. Él es el co-autor del Manual para Periodismo Online (Online Journalism Handbook), junto a la ex-editora del Financial Times, Liisa Rohumaa, y de Edición para Revistas (Magazine Editing), tercera edición, junto a John Morrish. Otros libros a los que Bradshaw ha contribuido incluyen: Periodismo de Investigación (Investigative Journalism), segunda edición; Periodismo Web: Una Nueva Forma de Ciudadanía (Web Journalism: A New Form of Citizenship); y Periodismo Ciudadano: Perspectivas Globales (Citizen Journalism: Global Perspectives).
Bradshaw ha sido destacado en la lista de innovadores a la vanguardia en periodismo y medios de comunicación de Journalism.co.uk, y en la lista de personas más influyentes en los medios de comunicación social de Poynter. En 2010, fue nominado como Editor Multimedia del Año.
Además de enseñar y escribir, Paul trabaja como consultor y formador en el ámbito de medios de comunicación social y periodismo de datos ("data journalism") para varias organizaciones. Puedes encontrar a Paul en Twitter @paulbradshaw
Bárbara Maseda es una periodista cubana. Graduada de la Facultad de Comunicación de la Universidad de La Habana, ha trabajado en varios proyectos bilingües de prensa digital. Como reportera, cubre temas de nuevas tecnologías de la información y las comunicaciones, en especial el desarrollo y aplicaciones de software libre y de código abierto.