BIOINFORMATICA

Historia

Nace al descubrir la estructura de doble hélice del ADN

Fue fruto de un biólogo y un físico, Watson y Crick, en 1953, y de las investigaciones previas realizadas por Rosalind Franklin en la Unidad de Biofísica del Consejo de Investigación Médica del King’s College.

Surgieron instrumentos informáticos para estudiar la gruesa información que nacería a partir de entonces, y se crearon algoritmos para investigar las propiedades de las proteínas, su regulación y los entresijos del desarrollo embrionario y de las vías metabólicas bioquímicas.

Secuenciación de la insulina

En 1955 el bioquímico británico Frederick Sanger llevó a cabo un descubrimiento que llevaría a la comunidad científica a discernir todo lo que el ADN y ARN tenían que contarnos.

En los años 60'

L. Pauling elabora su teoría sobre evolución molecular (1962)

Margaret Dayhoff, una de las pioneras de la bioinformática, publica el primero de los Atlas of Protein Sequences (1965)

Fue en el año 1970

Se logra publicar el algoritmo de Needleman-Wunsch para el alineamiento de las secuencias y se desarrolla una técnica de blog de localización sobre las secuencias de ADN específicas

En los años 90´

En el año 1995, se logra obtener una secuencia completa sobre los primeros genomas relacionados con las bacterias

1996 con el primer genoma eucariota.

Siglo XXI

En el año 2003, se fundó el Instituto Nacional de Bioinformática en España

En el año 2004, la FDA autorizó finalmente el uso de un chip de ADN por primera vez en la historia

En el año 2005, el proyecto HapMap logró ser completado catalogando diferentes variaciones genéticas presentes en el ser humano.

Aplicaciones

Medicina

Ha permitido avances en la medicina personalizada, adaptando los tratamientos a la genética de cada persona.

Farmacología

Ha tenido un papel fundamental en la investigación farmacéutica, especialmente contra enfermedades infecciosas, y el desarrollo de vacunas

Residuos

Permite identificar y evaluar la secuenciación del ADN de bacterias y microbios para utilizarlos en la limpieza de aguas residuales, la eliminación de residuos radiactivos o el reciclaje de plásticos.

Ganadería

Se emplea para secuenciar el genoma de los animales de granja, prevenir sus enfermedades y proporcionarles una mayor resistencia y calidad de vida

Agricultura

Mediante el uso de la proteómica, la metabolómica y la genética, permite desarrollar cultivos fuertes, más resistentes a la sequía y a las plagas de insectos.

Genética

Se aplica a la terapia génica, especialmente en enfermedades provocadas por genes individuales que han sido afectados o heredados

Alcances

Alineamiento de secuencias

Es una forma de representar y comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones funcionales o evolutivas entre los genes o proteínas consultados.

La predicción de genes

Son aquellos que, dentro del área de la biología computacional, se utilizan para la identificación algorítmica de trozos de secuencia, usualmente ADN genómico, y que son biológicamente funcionales.

Armado de genomas

El cual consiste en solucionar un enorme rompecabezas cuyas piezas son los pequeños fragmentos de ADN

Predicción de estructura de proteínas

Es la predicción o cálculo de la estructura tridimensional de una proteína desde su secuencia de aminoácidos, es decir, la predicción de sus estructuras secundaria y terciaria desde su estructura primaria.

Interacciones y modelado de la evolución

Seguir la evolución de un alto número de organismos midiendo cambios en su ADN, en lugar de hacerlo exclusivamente mediante su taxonomía física u observaciones fisiológicas

Herramientas

Manejo de datos

Es de vital importancia en la generación y evaluación de una hipótesis. Para el manejo de grandes volúmenes, se han creado numerosos Gestión de datos

Red de inferencia de datos

Emplea algoritmos para inferir relaciones dentro de entidades moleculares como genes, proteínas,

Depuración de datos

Crea un modelo manual o semimanual haciéndolo de fácil manejo para investigadores, en el cual se pueden adicionar hipótesis propias

La interpretación de los resultados con sentido biológico

¿Qué es?

Es una disciplina que conjuga los conocimientos y técnicas de la Biología con las herramientas que proporciona la Informática

Código Genético

se refiere a las instrucciones que contiene un gen y que le indican a una célula cómo producir una proteína específica. El código de cada gen usa las cuatro bases nitrogenadas del ADN — adenina (A), citosina (C), guanina (G) y timina (T)

Regiones codificantes del ADN

es esa porción del ADN de un gen o bien ARN que codifica la proteína. La región generalmente comienza en el extremo 5' por un codón de inicio y termina en el extremo 3' con un codón de terminación.

Palíndromos en una secuencia de ADN

una secuencia de ADN o ARN que se lee igual en ambas direcciones. Los sitios de muchas enzimas de restricción que cortan (restringen) el ADN son palíndromos.

Complementariedad

Permite que la información que se encuentra en el ADN o el ARN se almacene en una sola hebra.

Hebra complementaria Complementariedad

Se puede determinar a partir del molde y viceversa como en las bibliotecas de ADNc Complementariedad

Análisis de secuencia del ADN

Análisis de secuencias de proteínas

Incluye búsqueda en las bases de datos, alineamiento de secuencias, descubrimiento de motivos y patrones en proteínas