Python para Bioinformática
Python para Bioinformática
Sobre este libro
Primera edición en español de Python for Bioinformatics. Esta traducción es de la segunda edición en inglés (la mas actual). Hubo muchos cambios desde la primera edición que fue escrita en 2009, como el uso de Python 3. En este momento el estándar es 3.8 y es la versión usada en el libro. Con respecto a la versión original se agregó un capítulo sobre gráficos, se incluyeron las bases de datos NoSQL y se explica un framework web en su totalidad.
El libro cuenta con cuatro secciones principales:
- Python desde cero: Conceptos básicos de programación, instalando Python, modo interactivo, editores, tipos de datos (cadenas, Unicode, listas, tuplas, diccionarios, conjuntos), control de flujo (If-Else, For, While), funciones, generadores, módulos, uso de archivos, como leer y escribir CVS, XLSX, JSON, manejo de errores y una introducción a la programación orientada a objetos.
- Biopython: Los modulos más importante explicados con ejemplos de uso.
- Una sección con tópicos avanzados tales como: desarrollo web (CGI y Bottle), XML, base de datos (MySQL, SQLite y MongoDB), REGEX y gráficos (Bokeh).
- Recetas de Python con código comentado.
Tabla de contenidos
-
1. Licencia
- 1.1 Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
- 1.2 Avisos:
-
Prefacio a la primera edición en Español
- Biopython License Agreement
- BSD 3-Clause License
- Dedicatoria
-
2. Introducción
-
2.1 QUIÉN DEBERÍA LEER ESTE LIBRO
- 2.1.1 Qué debería saber el lector antes de leer este libro
-
2.2 CÓMO USAR EL LIBRO
- 2.2.1 Convenciones tipográficas
- 2.2.2 Iconos utilizados en este libro
- 2.2.3 Versiones de Python
- 2.2.4 Estilo de código
- 2.2.5 Como aprovechar el libro sin leerlo entero
- 2.2.6 Recursos online relacionados con el libro
- 2.3 ¿POR QUÉ APRENDER A PROGRAMAR?
-
2.4 CONCEPTOS BÁSICOS DE PROGRAMACIÓN
- 2.4.1 ¿Qué es un programa?
-
2.5 ¿POR QUÉ PYTHON?
- 2.5.1 Características principales de Python
- 2.5.2 Comparando Python con otros lenguajes.
- 2.5.3 ¿Para que se lo usa?
- 2.5.4 ¿Quién usa Python?
- 2.5.5 Variaciones de Python
- 2.5.6 Distribuciones de Python especializadas
- 2.6 RECURSOS ADICIONALES
-
2.1 QUIÉN DEBERÍA LEER ESTE LIBRO
-
3. Primeros pasos con Python
-
3.1 INSTALANDO PYTHON
- 3.1.1 Aprender Python usándolo
- 3.1.2 Instalar Python localmente
- 3.1.3 Instalando Anaconda
- 3.1.4 Usando Python online
- 3.1.5 Testeando Python
- 3.1.6 Primer uso
-
3.2 MODO INTERACTIVO
- 3.2.1 Primeros pasos
- 3.2.2 Entradas y salidas básicas
- 3.2.3 Más sobre el modo interactivo
- 3.2.4 Operaciones matemáticas
- 3.2.5 Salir de la terminal de Python
-
3.3 MODO BATCH
- 3.3.1 Comentarios
- 3.3.2 Indentación
-
3.4 ELIGIENDO UN EDITOR
- 3.4.1 Sublime Text
- 3.4.2 Atom
- 3.4.3 PyCharm
- 3.4.4 Spyder IDE
- 3.4.5 Palabras finales acerca de los editores
- 3.5 OTRAS HERRAMIENTAS
- 3.6 RECURSOS ADICIONALES
-
3.1 INSTALANDO PYTHON
-
4. Programación básica: Tipos de datos
-
4.1 CADENAS (Strings)
- 4.1.1 Las cadenas son secuencias de caracteres Unicode
- 4.1.2 Manipulación de cadenas
- 4.1.3 Métodos asociados con cadenas
-
4.2 LISTAS
- 4.2.1 Acceder a una lista de elementos
- 4.2.2 Una lista con múltiples items repetidos.
- 4.2.3 Listas por comprensión
- 4.2.4 Modificando listas
- 4.2.5 Copiar una lista
-
4.3 TUPLAS
- 4.3.1 Las tuplas son listas inmutables
- 4.4 PROPIEDADES COMUNES DE LAS SECUENCIAS
-
4.5 DICCIONARIOS
- 4.5.1 Mapear: Llamar a cada valor por un nombre
- 4.5.2 Operaciones con diccionarios
-
4.6 CONJUNTOS
- 4.6.1 Colección desordenada de objetos
- 4.6.2 Operaciones de conjuntos
- 4.6.3 Operaciones compartidas con otros tipos de datos
- 4.6.4 Conjunto inmutable: frozenset
- 4.7 NOMBRANDO OBJETOS
- 4.8 ASIGNANDO UN VALOR A UNA VARIABLE VERSUS UNIR UN NOMBRE A UN OBJETO
- 4.9 RECURSOS ADICIONALES
-
4.1 CADENAS (Strings)
-
5. Programación: Control de flujo
-
5.1 IF-ELSE (o condicional)
- 5.1.1 Sentencia Pass
- 5.2 BUCLE FOR
- 5.3 BUCLE WHILE
- 5.4 BREAK: ROMPIENDO EL BUCLE
-
5.5 Integrando las instrucciones de control de flujo
- 5.5.1 Estimar la carga neta de una proteína
- 5.5.2 Buscar zonas de baja degeneración
- 5.6 RECURSOS ADICIONALES
-
5.1 IF-ELSE (o condicional)
-
6. Manejo de archivos
-
6.1 LEYENDO ARCHIVOS
- 6.1.1 Ejemplo de manejador de archivo
-
6.2 ESCRIBIENDO ARCHIVOS
- 6.2.1 Ejemplos de lectura y escritura de archivos.
-
6.3 ARCHIVOS CSV
- 6.3.1 Leer archivos CSV con Pandas
- 6.3.2 Leer y escribir archivos Excel
- 6.4 PICKLE: ALMACENAR Y RECUPERAR EL CONTENIDO DE LAS VARIABLES
- 6.5 ARCHIVOS JSON
-
6.6 MANEJO DE ARCHIVOS: OS, OS.PATH, SHUTIL Y MÓDULO PATH
- 6.6.1 Módulo path (antes llamado path.py)
- 6.6.2 Consolidar secuencias múltiples de ADN en un archivo FASTA
- 6.7 RECURSOS ADICIONALES
-
6.1 LEYENDO ARCHIVOS
-
7. Modularización del código
- 7.1 INTRODUCCIÓN A LA MODULARIZACIÓN DEL CÓDIGO
-
7.2 FUNCIONES
- 7.2.1 Modo estándar de hacer un código modular en Python
- 7.2.2 Las opciones de parámetros en las funciones
- 7.2.3 Generadores
-
7.3 MÓDULOS Y PAQUETES
- 7.3.1 Usando módulos
- 7.3.2 Paquetes
- 7.3.3 Instalación de módulos de terceros
- 7.3.4 Virtualenv: Entornos Python aislados
- 7.3.5 Conda: Entorno Virtual Anaconda
- 7.3.6 Creando módulos
- 7.3.7 Módulos de prueba
- 7.4 RECURSOS ADICIONALES
-
8. Manejo de errores
-
8.1 INTRODUCCIÓN AL MANEJO DE ERRORES
- 8.1.1 Try y Except
- 8.1.2 Tipos de excepciones
- 8.1.3 Desencadenando excepciones
- 8.2 CREANDO EXCEPCIONES CUSTOMIZADAS
- 8.3 RECURSOS ADICIONALES
-
8.1 INTRODUCCIÓN AL MANEJO DE ERRORES
-
9. Introducción a la programación orientada a objetos (POO)
- 9.1 PARADIGMA DE OBJETOS Y PYTHON
- 9.2 EXPLORANDO LA JERGA
- 9.3 CREANDO CLASES
- 9.4 HERENCIA
-
9.5 MÉTODOS ESPECIALES
- 9.5.1 Crear un nuevo tipo de datos usando un tipo de datos incorporado
- 9.6 HACIENDO NUESTRO CÓDIGO PRIVADO
- 9.7 RECURSOS ADICIONALES
-
10. Introducción a Biopython
-
10.1 ¿QUÉ ES BIOPYTHON?
- 10.1.1 Organización del proyecto
- 10.2 INSTALANDO BIOPYTHON
-
10.3 COMPONENTES DE BIOPYTHON
- 10.3.1 Alfabeto
- 10.3.2 Seq
- 10.3.3 MutableSeq
- 10.3.4 SeqRecord
- 10.3.5 Align
- 10.3.6 AlignIO
- 10.3.7 ClustalW
- 10.3.8 SeqIO
- 10.3.9 AlignIO
- 10.3.10 BLAST
- 10.3.11 Información biológica relacionada
- 10.3.12 Entrez
- 10.3.13 PDB
- 10.3.14 PROSITE
- 10.3.15 Restricción
- 10.3.16 SeqUtils
- 10.3.17 Secuenciación
- 10.3.18 SwissProt
- 10.4 CONCLUSION
- 10.5 RECURSOS ADICIONALES
-
10.1 ¿QUÉ ES BIOPYTHON?
-
11. Aplicaciones Web
- 11.1 INTRODUCCIÓN A PYTHON EN LA WEB
-
11.2 CGI EN PYTHON
- 11.2.1 Configuración de un servidor web para CGI
- 11.2.2 Probando el servidor con nuestro script
- 11.2.3 Programa web para calcular la carga neta de una proteína (versión CGI)
-
11.3 WSGI
- 11.3.1 Bottle: un framework web de Python para WSGI
- 11.3.2 Instalación de Bottle
- 11.3.3 Aplicación mínima de Bottle
- 11.3.4 Componentes de Bottle
- 11.3.5 Programa web para calcular la carga neta de una proteína (versión Bottle)
- 11.3.6 Instalación de un programa WSGI en Apache
- 11.4 OPCIONES ALTERNATIVAS PARA HACER SITIOS WEB DINÁMICOS BASADOS EN PYTHON
- 11.5 ALGUNAS PALABRAS SOBRE LA SEGURIDAD DE NUESTROS PROGRAMAS
- 11.6 DONDE ALOJAR LOS PROGRAMAS DE PYTHON
- 11.7 RECURSOS ADICIONALES
-
12. XML
- 12.1 INTRODUCCIÓN A XML
- 12.2 ESTRUCTURA DE UN DOCUMENTO XML
-
12.3 MÉTODOS PARA ACCEDER A LOS DATOS DENTRO DE UN DOCUMENTO XML
- 12.3.1 SAX: cElementTree Iterparse
- 12.4 RESUMEN
- 12.5 RECURSOS ADICIONALES
-
13. Python y bases de datos
-
13.1 INTRODUCCIÓN A LAS BASES DE DATOS
- 13.1.1 Gestión de la base de datos: RDBMS
- 13.1.2 Componentes de una base de datos relacional
- 13.1.3 Tipos de datos de la base de datos
- 13.2 CONEXIÓN A UNA BASE DE DATOS
-
13.3 CREANDO UNA BASE DE DATOS MYSQL
- 13.3.1 Creación de tablas
- 13.3.2 Cargar una tabla
-
13.4 PLANIFICACIÓN ADELANTADA
- 13.4.1 PythonU: Base de datos de ejemplo
-
13.5 SELECT: CONSULTANDO UNA BASE DE DATOS
- 13.5.1 Construyendo una consulta
- 13.5.2 Actualización de una base de datos
- 13.5.3 Eliminación de un registro en una base de datos
-
13.6 ACCESO A UNA BASE DE DATOS DE PYTHON
- 13.6.1 Módulo PyMySQL
- 13.6.2 Estableciendo la conexión
- 13.6.3 Ejecutando la consulta desde Python
- 13.7 SQLITE
-
13.8 BASES DE DATOS NOSQL: MONGODB
- 13.8.1 Usando MongoDB con PyMongo
- 13.9 RECURSOS ADICIONALES
-
13.1 INTRODUCCIÓN A LAS BASES DE DATOS
-
14. Expresiones regulares
-
14.1 INTRODUCCIÓN A LAS EXPRESIONES REGULARES (REGEX)
- 14.1.1 Sintaxis REGEX
-
14.2 EL MÓDULO RE
- 14.2.1 Compilando un patrón
- 14.2.2 Ejemplos de REGEX
- 14.2.3 Patrones de reemplazo
-
14.3 REGEX EN BIOINFORMATICA
- 14.3.1 Limpiando una secuencia
- 14.4 RECURSOS ADICIONALES
-
14.1 INTRODUCCIÓN A LAS EXPRESIONES REGULARES (REGEX)
-
15. Gráficos en Python
- 15.1 INTRODUCCIÓN A BOKEH
- 15.2 INSTALANDO BOKEH
-
15.3 USANDO BOKEH
- 15.3.1 Un gráfico X-Y simple
- 15.3.2 Gráfico de 2 series de datos
- 15.3.3 Un diagrama de dispersión
- 15.3.4 Mapa de calor (Heatmap)
- 15.3.5 Diagrama de cuerdas.
-
16. Manipulación de secuencias en Batch
- 16.1 DESCRIPCIÓN DEL PROBLEMA
-
16.2 PROBLEMA UNO: CREAR UN ARCHIVO FASTA CON SECUENCIAS AL AZAR
- 16.2.1 Código fuente comentado
-
16.3 PROBLEMA DOS: FILTRAR SECUENCIAS VACÍAS DE UNA ARCHIVO FASTA
- 16.3.1 Código fuente comentado
-
16.4 PROBLEMA TRES: MODIFICAR CADA RÉCORD DE UN ARCHIVO FASTA
- 16.4.1 Código fuente comentado
-
17. Aplicación web para filtrar contaminación de vectores
-
17.1 DESCRIPCIÓN DEL PROBLEMA
- 17.1.1 Código fuente comentado
- 17.2 RECURSOS ADICIONALES
-
17.1 DESCRIPCIÓN DEL PROBLEMA
-
18. Buscando primers de PCR usando Primer3
- 18.1 DESCRIPCIÓN DEL PROBLEMA
-
18.2 DISEÑO DE PRIMER RODEANDO A UNA SECUENCIA DE LONGITUD VARIABLE
- 18.2.1 Código fuente comentado
- 18.3 DISEÑO DE PRIMER FLANQUEANDO UNA REGIÓN VARIABLE USANDO BIOPYTHON
-
19. Calculando la temperatura de melting de un conjunto de primers
- 19.1 DESCRIPCIÓN DEL PROBLEMA:
- 19.2 RECURSOS ADICIONALES
-
20. Filtrando campos específicos de un archivo de GenBank
-
20.1 EXTRAYENDO SECUENCIAS DE PROTEÍNAS SELECCIONADAS
- 20.1.1 Código fuente comentado
-
20.2 EXTRAYENDO REGIONES UPSTREAM DE PROTEÍNAS SELECCIONADAS
- 20.2.1 Código fuente comentado
- 20.3 RECURSOS ADICIONALES
-
20.1 EXTRAYENDO SECUENCIAS DE PROTEÍNAS SELECCIONADAS
-
21. Infiriendo sitios de splicing
-
21.1 DESCRIPCIÓN DEL PROBLEMA
- 21.1.1 Inferiendo sitios de corte y empalme con código fuente comentado
- 21.1.2 Muestra de ejecución del programa para estimar intrones:
-
21.1 DESCRIPCIÓN DEL PROBLEMA
-
22. Web Server para alineamientos múltiples
-
22.1 DESCRIPCIÓN DEL PROBLEMA
- 22.1.1 Interfaz Web: Front-End. Código HTML
- 22.1.2 Interfaz web: Server-Side Script. Código fuente comentado
- 22.2 RECURSOS ADICIONALES
-
22.1 DESCRIPCIÓN DEL PROBLEMA
-
23. Dibujando posiciones de marcadores usando información almacenada en una base de datos
-
23.1 DESCRIPCIÓN DEL PROBLEMA
- 23.1.1 Trabajo preliminar sobre los datos
- 23.1.2 Versión de MongoDB con el código fuente comentado
-
23.1 DESCRIPCIÓN DEL PROBLEMA
-
24. Mutaciones de ADN con restricción
-
24.1 DESCRIPCIÓN DEL PROBLEMA
- 24.1.1 Introducir mutaciones puntuales y dar un perfil de restricción
- 24.1.2 Correr el programa para introducir las mutaciones puntuales
- 24.2 RECURSOS ADICIONALES
-
24.1 DESCRIPCIÓN DEL PROBLEMA
- Notas
Leanpub incondicional, sin riesgo, 100% de felicidad garantizada
Durante los primeros 60 días de compra, puedes obtener un reembolso del 100% de cualquier compra Leanpub, en dos clics. Procesamos las restituciones manualmente, así que puede tomarse unos días en aparecer. Véase términos completos.
Gana $8 en una compra de $10 y $16 en una compra de $20
Pagamos 80% de regalías en compras de $7.99 o más y 80% de regalías menos una tarifa fija de 50 centavos en compras entre $0.99 y $7.98. Ganas $8 en una venta de $10 y $16 en una venta de $20. Entonces, si vendemos 5000 copias no reembolsadas de tu libro por $20, ganarás $80,000.
(Sí, algunos autores ya han ganado mucho más que eso en Leanpub.)
De hecho, los autores han ganadomás de 13 millones de dólares escribiendo, publicando y vendiendo en Leanpub.
Obtén más información sobre escribir en Leanpub
Actualizaciones gratis. Libre de DRM.
¡Si compras un libro Leanpub obtienes actualizaciones gratis siempre y cuando el autor actualice el libro! Varios autores usan Leanpub para publicar sus libros en progreso mientras los escriben. Todos los lectores obtienen actualizaciones gratis, independientemente de cuándo compraron el libro o cuánto pagaron (incluyendo si fue gratis).
La mayoría de los libros Leanpub se encuentran disponibles en PDF (para computadores) y EPUB (para teléfonos, tabletas, y Kindle). Los formatos que un libro incluye se muestran en la esquina superior derecha de esta página.
Finalmente, los libros Leanpub no tienen ninguna de las cosas sin sentido sobre protección de copia DRM, así que puedes leerlos fácilmente en cualquier dispositivo que se soporta.
Aprende más sobre los formatos de Leanpub y dónde puedes leerlos