Base de Datos Biologicas

GenBak: Base de Datos de la Secuencia de Nucleotidos y proteinas mas conocidas.

GenBack divide tecnologias de la informacion entres categorias principales, humanos, ratos y otras. son 10 organismos a partir de los cuales se ha secuenciado el mayor numero de EST.

Los EST son tipicamente clones de ADNc seleccionados al azar que se secuencian en una cadena.

cantidad de datos de secuencia:

GenBack contiene 100 mil millones de nucleotidos de 100 millones de secuencias.

La division de WGS consiste en secuencias generadas por esfuerzos de secuenciacion de alto rendimiento.

la secuenciacion de la proxima generacion implica la generacion de cantidades masivas de datos de secuencia, como 1 billoin de bases.

Organismos en GenBank

Mas de 260000 especies diferentes estas representadas en GenBak, con mas de 1000 nuevas especies agregadas por mes.

Taxonomia

Archaea

Bacterias

Eukaryota

Hongos

Metazoa

Viridiplantae

Virus

diferentes especies son utiles para una variedad de diferentes estudios.

humano

vaca

raton

pollo

rata

maiz

cerdo

rana

pan de trigo

tabaco

uva de vino

arroz

pez cebra

rana de garra occidental

esta compuesta por la mayoria de secuencias publicas conocidas de ADN proteinas.

dentro de cada base de datos, los datos de secuencia se representan en una variedad de formas.

Colaboracion Internacional de Bases de Datos de Secuencias de Nucleotidos.

La colaboracion internacional de bases de datos de secuencias de nucleotidos, es una iniciativa fundamental de laraga data que opera en distintos centros.

Tipos:

la proxima generacion lee

DDBJ: Secuencia de leer archivo

EMBL-EBI: Nucleotido Europeo

NCBI: Secuencia leer archivo

lecturas capilares

DDBJ: Trace archive

EMBL-EBI: Nucleotido Europeo

NCBI: Tarce archive

secuencias anotadas

DDBJ: Muestra bio

EMBL-EBI: Archivo (ENA)

NCBI: Muestra bio

El comiote esta formado por miembros de cada uno de los organos asesores de la base de datos.

como enviar datos:

para obtenes detalles muy comp,etos sobre como enviar datos a la bases de datos, tiene que seleccionar un socio colaborador.

DDBJ, ENA, GenBack

Instituto Europeo de Bioinformatica

Programa de insdustria.

El Programa de Industria de EMBL-EBI es un foro único para la interacción y el intercambio de conocimientos para aquellos que trabajan en la vanguardia de la bioinformática aplicada.

El programa se centra en la colaboración precompetitiva, el software de código abierto y los estándares informáticos, que se han vuelto esenciales para mejorar la eficiencia y reducir los costos para la industria.

Innovacion y Traduccion.

Estimula la innovacion en la investigacion biomedica y de ciencias de la vida.

Este tambien trabaja con pequeñas y grandes empresas para ayudar y aprovechar al maximo los recursos de datos biologicos publicos.

Big Data

los cientificos utilizan mas de 3.3 millones de sitios unicos de EMBL-EBI cada mes.

todos los dias se realizan mas de 38 millones de solicitudes a los sitios web.

los centros EMBL-EBI tuvo 190 subvenciones financiadas conjuntamente con investigadores en 64 paises del mundo.

en 2017, la EMBL-EBI participo en 340 eventos de capacitacion, divulgacion e intercambio de conocimientos.

el EBI presenta 6 bases de datos moleculares:

EMBL-Banck es el repositorio de secuencias de ADN Y ARN.

SWISS-PROT

TrEMBL son bases de datos de proteinas.

MSD es una base de datos de estructura de proteinas.

Ensembl es uno de los 3 exploradores rpincipales del genoma.

ArrayExpress este es uno de los dos principales repositorios mundiales para expresion de genes.

Base de datos de ADN de Japon.

Este centro recopila y proporciona datos de secuencias de nucleotidos y apoya las actividades de investigacion en ciencias de la vida.

Mision

Historia

Actividades Principales

Construccion y Operacion de INSDC

En Japon, contribuye internacionalmente el centro de DDBJ como miembro de INSDC para recopilar datos de secuencia de nucleotidos.

El centro DDBJ esta oficialmente certificado para recopilar secuencias de nucleotidos.

Datos de secuencia incluidos en las solicitudes de patente

Ptente, Propiedad intelectual y Prioridad.

Columna de patente de DDBJ

Gestion y funcionanmiento del Instituto Nacional de Sistema de Supercomputacion Genetica.

Es un sitio de utilizacion de computadoras a gran escala con analisis del genoma.

Este sistema proporciona servicios de sistema de supercomputacion que incliyen computadoras de vanguardia de tipo clúster a gran escala.

Gestionde bases de Datos Biologicas: Herramientas para depositar y recuperar.

proporciona base de datos mantenidas por DDBJ.

puede descargar colectivamente bases de datos desde el sitio FTP.

Curso de formacion y publicacion.

El DDBJ organiza un grupo de capacitacion en bioinformatica.

Enseña como enviar datos de secuencias de nucleotidos y como utilizar servicios para analizar.

Centro Ncional de Informacion de Biotecnologia

¿Que hace?

crea bases de datos publicas, realiza investigaciones en biologia computacional y desarrolla herramientas para analizar datos genomicos.

hay 7 categorias en la barra superior del sitio web:

Entrez: integra base de datos cientificos y la secuencia de proteinas.

PubMed: es el servicio de busqueda de la biblioteca nacional de medicina que proporciona acceso a mas de 18 millones de citas en MEDLINE.

OMIM: es un catalogo de genes humanos y trastornos geneticos.

Taxonomia: incluye un navegador para las divisiones principales de los organismos vivos.

Estrucutra: mantiene base de datos molecular, una base de datos de estructuras tridimensionales macromoleculares.

Blast: es una herramienta de busqueda de similitud NCBI diseñado para apoyar el analisis de las bases de datos de nucleotidos y proteinas.