The Leanpub 60 Day 100% Happiness Guarantee
Within 60 days of purchase you can get a 100% refund on any Leanpub purchase, in two clicks.
See full terms...
Kick off your book project in 2 hours! Live workshop on Zoom. You’ll leave with a real book project, progress on your first chapter, and a clear plan to keep going. Tuesday, June 16, 2026. Learn more…
Cómo capturar datos de cientos de fuentes, estructurarlos para analizarlos... y aun así cumplir con los plazos de entrega
Interested in this book? Show your support by saying what you'd like to pay for it!
About the Book
La extracción de datos o "scraping" –hacer que una computadora capture información de fuentes en internet– es una de las técnicas más poderosas que los periodistas pueden usar para llegar de primeros a la noticia, o para descubrir informacion exclusiva que nadie mas posee.
Más rápido que una solicitud información y más potente que las técnicas de búsqueda avanzada, el scraping permite conseguir los datos estructurados de formas que facilitan su analisis, y a veces puede servir incluso para conseguir informacion que algunas organizaciones preferirian no compartir
*Extracción de datos para periodistas* contiene una amplia gama de técnicas de scraping, desde algunas no más complicadas que una fórmula en una hojas de cálculo, hasta desafíos complejos, como trabajar con bases de datos o extraer informacion de cientos de documentos.
El libro esta diseñado para que se aprecien los resultados de lo aprendido a cada paso, avanzando hacia la construcción de herramientas más ambiciosas y poderosas.
En apenas cinco minutos aprendera a escribir su primer extractor al inicio del libro, pero mas importante aun es que estará aprendiendo principios y técnicas clave para resolver problemas de extracción de datos.
A diferencia de textos generales de programación, todo el contenido de este libro tiene aplicación directa en periodismo y cada principio de programación aparece conectado a su uso en la produccion de noticias. En lugar de ocuparse de herramientas o tecnicas particulares, como hacen algunas guías y blogs, este texto tiene por objeto desarrollar habilidades que pueda aplicar en nuevas situaciones y con nuevas herramientas.
About the Authors
Paul Bradshaw dirige el programa de maestría en Periodismo Online en Birmingham City University, y es profesor visitante en la facultad de Periodismo de City University en Londres. Paul es el editor del blog Online Journalism Blog, y es el fundador del sitio web de periodismo de investigación HelpMeInvestigate. Ha escrito para journalism.co.uk, Press Gazette, los blogs de datos de los periódicos británicos The Guardian y The Telegraph, InPublishing, Nieman Reports y el Instituto Poynter en los Estados Unidos. Él es el co-autor del Manual para Periodismo Online (Online Journalism Handbook), junto a la ex-editora del Financial Times, Liisa Rohumaa, y de Edición para Revistas (Magazine Editing), tercera edición, junto a John Morrish. Otros libros a los que Bradshaw ha contribuido incluyen: Periodismo de Investigación (Investigative Journalism), segunda edición; Periodismo Web: Una Nueva Forma de Ciudadanía (Web Journalism: A New Form of Citizenship); y Periodismo Ciudadano: Perspectivas Globales (Citizen Journalism: Global Perspectives).
Bradshaw ha sido destacado en la lista de innovadores a la vanguardia en periodismo y medios de comunicación de Journalism.co.uk, y en la lista de personas más influyentes en los medios de comunicación social de Poynter. En 2010, fue nominado como Editor Multimedia del Año.
Además de enseñar y escribir, Paul trabaja como consultor y formador en el ámbito de medios de comunicación social y periodismo de datos ("data journalism") para varias organizaciones. Puedes encontrar a Paul en Twitter @paulbradshaw

Episode 11
An Interview with Paul Bradshaw
Bárbara Maseda es una periodista cubana. Graduada de la Facultad de Comunicación de la Universidad de La Habana, ha trabajado en varios proyectos bilingües de prensa digital. Como reportera, cubre temas de nuevas tecnologías de la información y las comunicaciones, en especial el desarrollo y aplicaciones de software libre y de código abierto.
Also by the Authors
Scraping for Journalists (2nd edition)
8000 Holes: How the 2012 Olympic Torch Relay Lost its Way
Model for the 21st Century Newsroom - Redux
Stories and Streams
Help Me Investigate: the blog
Organising an Online Investigation Team

Making Data Play Nice
Private Services in the NHS
Excel Notes
Python Notes
Data Journalism Heist

Writing longer

Help Me Investigate Education
Scraping Pour Journalistes

Scraping für Journalisten
Finding Stories in Spreadsheets
Excel para periodistas
Periodismo de datos: Un golpe rápido

Twitter for Journalists
Learning HTML and CSS by making tweetable quotes

The 5 day liveblogging guide
Snapchat for Journalists
Snapchat para periodistas
JavaScript for Storytellers

Gazeteciler için Kazıma
99 Things To Do In R
The BCU journalism recipe book
O Roubo do Jornalismo de Dados
Python for Journalists
addingchapterstoexcelforjournalists
Within 60 days of purchase you can get a 100% refund on any Leanpub purchase, in two clicks.
See full terms...
We pay 80% royalties on purchases of $7.99 or more, and 80% royalties minus a 50 cent flat fee on purchases between $0.99 and $7.98. You earn $8 on a $10 sale, and $16 on a $20 sale. So, if we sell 5000 non-refunded copies of your book for $20, you'll earn $80,000.
(Yes, some authors have already earned much more than that on Leanpub.)
In fact, authors have earned over $15 million writing, publishing and selling on Leanpub.
Learn more about writing on Leanpub
If you buy a Leanpub book, you get free updates for as long as the author updates the book! Many authors use Leanpub to publish their books in-progress, while they are writing them. All readers get free updates, regardless of when they bought the book or how much they paid (including free).
Most Leanpub books are available in PDF (for computers) and EPUB (for phones, tablets and Kindle). The formats that a book includes are shown at the top right corner of this page.
Finally, Leanpub books don't have any DRM copy-protection nonsense, so you can easily read them on any supported device.
Learn more about Leanpub's ebook formats and where to read them
You can use Leanpub to easily write, publish and sell in-progress and completed ebooks and online courses!
Leanpub is a powerful platform for serious authors, combining a simple, elegant writing and publishing workflow with a store focused on selling in-progress ebooks.
Leanpub is a magical typewriter for authors: just write in plain text, and to publish your ebook, just click a button. (Or, if you are producing your ebook your own way, you can even upload your own PDF and/or EPUB files and then publish with one click!) It really is that easy.