Extracción de datos para periodistas

Extracción de datos para periodistas

Cómo capturar datos de cientos de fuentes, estructurarlos para analizarlos... y aun así cumplir con los plazos de entrega

Sobre este libro

La extracción de datos o "scraping" –hacer que una computadora capture información de fuentes en internet– es una de las técnicas más poderosas que los periodistas pueden usar para llegar de primeros a la noticia, o para descubrir informacion exclusiva que nadie mas posee.

Más rápido que una solicitud información y más potente que las técnicas de búsqueda avanzada, el scraping permite conseguir los datos estructurados de formas que facilitan su analisis, y a veces puede servir incluso para conseguir informacion que algunas organizaciones preferirian no compartir

*Extracción de datos para periodistas* contiene una amplia gama de técnicas de scraping, desde algunas no más complicadas que una fórmula en una hojas de cálculo, hasta desafíos complejos, como trabajar con bases de datos o extraer informacion de cientos de documentos.

El libro esta diseñado para que se aprecien los resultados de lo aprendido a cada paso, avanzando hacia la construcción de herramientas más ambiciosas y poderosas.

En apenas cinco minutos aprendera a escribir su primer extractor al inicio del libro, pero mas importante aun es que estará aprendiendo principios y técnicas clave para resolver problemas de extracción de datos.

A diferencia de textos generales de programación, todo el contenido de este libro tiene aplicación directa en periodismo y cada principio de programación aparece conectado a su uso en la produccion de noticias. En lugar de ocuparse de herramientas o tecnicas particulares, como hacen algunas guías y blogs, este texto tiene por objeto desarrollar habilidades que pueda aplicar en nuevas situaciones y con nuevas herramientas.

Este libro es una traducción al Español de Scraping for Journalists (2nd edition), que fue originalmente escrito en Inglés.

Sobre de los autores

Paul Bradshaw
Paul Bradshaw

Paul Bradshaw dirige el programa de maestría en Periodismo Online en Birmingham City University, y es profesor visitante en la facultad de Periodismo de City University en Londres. Paul es el editor del blog Online Journalism Blog, y es el fundador del sitio web de periodismo de investigación HelpMeInvestigate. Ha escrito para journalism.co.uk, Press Gazette, los blogs de datos de los periódicos británicos The Guardian y The Telegraph, InPublishing, Nieman Reports y el Instituto Poynter en los Estados Unidos. Él es el co-autor del Manual para Periodismo Online (Online Journalism Handbook), junto a la ex-editora del Financial Times, Liisa Rohumaa, y de Edición para Revistas (Magazine Editing), tercera edición, junto a John Morrish. Otros libros a los que Bradshaw ha contribuido incluyen: Periodismo de Investigación (Investigative Journalism), segunda edición; Periodismo Web: Una Nueva Forma de Ciudadanía (Web Journalism: A New Form of Citizenship); y Periodismo Ciudadano: Perspectivas Globales (Citizen Journalism: Global Perspectives).

Bradshaw ha sido destacado en la lista de innovadores a la vanguardia en periodismo y medios de comunicación de Journalism.co.uk, y en la lista de personas más influyentes en los medios de comunicación social de Poynter. En 2010, fue nominado como Editor Multimedia del Año.

Además de enseñar y escribir, Paul trabaja como consultor y formador en el ámbito de medios de comunicación social y periodismo de datos ("data journalism") para varias organizaciones. Puedes encontrar a Paul en Twitter @paulbradshaw

Bárbara Maseda
Bárbara Maseda

Bárbara Maseda es una periodista cubana. Graduada de la Facultad de Comunicación de la Universidad de La Habana, ha trabajado en varios proyectos bilingües de prensa digital. Como reportera, cubre temas de nuevas tecnologías de la información y las comunicaciones, en especial el desarrollo y aplicaciones de software libre y de código abierto.

Leanpub incondicional, sin riesgo, 100% de felicidad garantizada

Durante los primeros 60 días de compra, puedes obtener un reembolso del 100% de cualquier compra Leanpub, en dos clics. Procesamos las restituciones manualmente, así que puede tomarse unos días en aparecer. Véase términos completos.

80% de regalías. Gana $16 en un libro de $20.

Pagamos 80% de regalías. No es un error tipográfico: ganas $16 en una venta de $20. Si vendemos 5000 copias no reembolsadas de tu libro o curso por $20, ganarás $80,000.

(Sí, algunos autores ya han ganado mucho más que eso en Leanpub.)

De hecho, los autores han ganadomás de $12 millonesescribiendo, publicando y vendiendo en Leanpub.

Aprende más sobre cómo escribir en Leanpub

Actualizaciones gratis. Libre de DRM.

¡Si compras un libro Leanpub obtienes actualizaciones gratis siempre y cuando el autor actualice el libro! Varios autores usan Leanpub para publicar sus libros en progreso mientras los escriben. Todos los lectores obtienen actualizaciones gratis, independientemente de cuándo compraron el libro o cuánto pagaron (incluyendo si fue gratis).

La mayoría de los libros Leanpub se encuentran disponibles en PDF (para computadores) y EPUB (para teléfonos, tabletas, y Kindle). Los formatos que un libro incluye se muestran en la esquina superior derecha de esta página.

Finalmente, los libros Leanpub no tienen ninguna de las cosas sin sentido sobre protección de copia DRM, así que puedes leerlos fácilmente en cualquier dispositivo que se soporta.

Aprende más sobre los formatos de Leanpub y dónde puedes leerlos

Escribir y publicar en Leanpub

Los autores y editores usan Leanpub para publicar libros electrónicos sorprendentes en curso y completados, como éste. ¡También puedes utilizar Leanpub para escribir, publicar y vender tu libro! Leanpub es una potente plataforma para autores serios, que combina un flujo de trabajo de escritura y publicación simple y elegante con una tienda centrada en la venta de libros electrónicos en progreso. Leanpub es una máquina de escribir mágica para los autores: basta con escribir en texto plano, y para publicar tu libro electrónico, simplemente haz clic en un botón. Realmente es así de fácil.

Más información sobre cómo escribir en Leanpub