Enviar correo al autor

You can use this page to email José Manuel Ortega about Web Scraping & Crawling con Python.

Please include an email address so the author can respond to your query

This message will be sent to José Manuel Ortega

This site is protected by reCAPTCHA and the Google  Privacy Policy and  Terms of Service apply.

Sobre el Libro

Con este libro aprenderá a implementar técnicas de scraping para obtener información de fuentes públicas. Se utilizarán principalmente técnicas y librerías que podemos encontrar dentro del ecosistema de Python para extraer información de diversas fuentes. El objetivo es poder aplicar este tipo de técnicas de manera más eficiente para recopilar datos relevantes según su necesidades, así como implementar crawlers que se puedan ejecutar tanto en local como en la nube de forma automatizada.

Python se caracteriza por tener un ecosistema grande de herramientas orientadas a aplicar técnicas de scraping y el crawling. Por ejemplo, herramientas de Python como Scrapy son muy usadas en este contexto. Entre los principales objetivos podemos destacar:

  • Aprender las principales técnicas para el scraping en sitios web y las herramientas disponibles en Python que nos permiten implementar este tipo de técnicas.
  • Aprender los principales módulos disponibles en Python, así como su interacción con otros lenguajes orientados a la programación web como JavaScript.
  • Automatizar la extracción de datos de forma síncrona y asíncrona utilizando diferentes módulos de Python.
  • Aprender a automatizar tareas de análisis y extracción de información de sitios web y redes sociales.
  • Aprender a implementar y administrar nuestros propios spiders y crawlers en la nube con soluciones como Zyte y Portia.

El libro trata de seguir un enfoque teórico-práctico con el objetivo de afianzar los conocimientos mediante la creación y ejecución de scripts desde la consola de Python. Además, se provee un repositorio donde se pueden encontrar los ejemplos que se analizan a lo largo del libro para facilitar al lector las pruebas y asimilación de los contenidos teóricos.

  1. Técnicas de Web Scraping y herramientas Python
  2. WebScraping con Requests y BeautifulSoup
  3. Scraping de páginas dinámicas y Ajax
  4. Construyendo spiders y crawlers con Scrapy
  5. Web Crawlers asíncronos
  6. Mejores prácticas para web scraping
  7. Web Scraping en la nube
  8. Web Scraping en GitHub
  9. Web Scraping de Linkedin
  10. Otras herramientas de Scraping & crawling
  11. Glosario de términos

Sobre el Autor

José Manuel Ortega’s avatar José Manuel Ortega

@jmortegac

José Manuel Ortega is a software engineer and cybersecurity researcher with interest in new technologies, open source, security and testing. In recent years he has shown interest in innovation projects using Big Data technologies using programming languages such as Python. He is currently working as a software engineer in research projects related to Big Data, Cybersecurity and Blockchain. He has taught at university level and collaborated with the official college of computer engineers. He has also been a speaker at several conferences oriented to developers at national and international level. More information about his lectures and other published works can be found on his personal website https://josemanuelortegablog.com. Articles about cibersecurity can be found in https://www.codemotion.com/magazine/es/author/josemanuel/

Logo white 96 67 2x

Publish Early, Publish Often

  • Path
  • There are many paths, but the one you're on right now on Leanpub is:
  • Python Webscraping › Email Author › New
    • READERS
    • Newsletters
    • Weekly Sale
    • Monthly Sale
    • Store
    • Home
    • Redeem a Token
    • Search
    • Support
    • Leanpub FAQ
    • Leanpub Author FAQ
    • Search our Help Center
    • How to Contact Us
    • FRONTMATTER PODCAST
    • Featured Episode
    • Episode List
    • MEMBERSHIPS
    • Reader Memberships
    • Department Reader Memberships
    • Author Memberships
    • Your Membership
    • COMPANY
    • About
    • About Leanpub
    • Blog
    • Contact
    • Press
    • Essays
    • AI Services
    • Imagine a world...
    • Manifesto
    • More
    • Partner Program
    • Causes
    • Accessibility
    • AUTHORS
    • Write and Publish on Leanpub
    • Create a Book
    • Create a Bundle
    • Create a Course
    • Create a Track
    • Testimonials
    • Why Leanpub
    • Services
    • TranslateAI
    • TranslateWord
    • TranslateEPUB
    • PublishWord
    • Publish on Amazon
    • CourseAI
    • GlobalAuthor
    • Marketing Packages
    • IndexAI
    • Author Newsletter
    • The Leanpub Author Update
    • Author Support
    • Author Help Center
    • Leanpub Authors Forum
    • The Leanpub Manual
    • Supported Languages
    • The LFM Manual
    • Markua Manual
    • API Docs
    • Organizations
    • Learn More
    • Sign Up
    • LEGAL
    • Terms of Service
    • Copyright Policy
    • Privacy Policy
    • Refund Policy

*   *   *

Leanpub is copyright © 2010-2025 Ruboss Technology Corp.
All rights reserved.

This site is protected by reCAPTCHA
and the Google  Privacy Policy and  Terms of Service apply.

Leanpub requires cookies in order to provide you the best experience. Dismiss