Base de Datos Biologicas
GenBak: Base de Datos de la Secuencia de Nucleotidos y proteinas mas conocidas.
GenBack divide tecnologias de la informacion entres categorias principales, humanos, ratos y otras. son 10 organismos a partir de los cuales se ha secuenciado el mayor numero de EST.
Los EST son tipicamente clones de ADNc seleccionados al azar que se secuencian en una cadena.
cantidad de datos de secuencia:
GenBack contiene 100 mil millones de nucleotidos de 100 millones de secuencias.
La division de WGS consiste en secuencias generadas por esfuerzos de secuenciacion de alto rendimiento.
la secuenciacion de la proxima generacion implica la generacion de cantidades masivas de datos de secuencia, como 1 billoin de bases.
Organismos en GenBank
Mas de 260000 especies diferentes estas representadas en GenBak, con mas de 1000 nuevas especies agregadas por mes.
Taxonomia
Archaea
Bacterias
Eukaryota
Hongos
Metazoa
Viridiplantae
Virus
diferentes especies son utiles para una variedad de diferentes estudios.
humano
vaca
raton
pollo
rata
maiz
cerdo
rana
pan de trigo
tabaco
uva de vino
arroz
pez cebra
rana de garra occidental
esta compuesta por la mayoria de secuencias publicas conocidas de ADN proteinas.
dentro de cada base de datos, los datos de secuencia se representan en una variedad de formas.
Colaboracion Internacional de Bases de Datos de Secuencias de Nucleotidos.
La colaboracion internacional de bases de datos de secuencias de nucleotidos, es una iniciativa fundamental de laraga data que opera en distintos centros.
Tipos:
la proxima generacion lee
DDBJ: Secuencia de leer archivo
EMBL-EBI: Nucleotido Europeo
NCBI: Secuencia leer archivo
lecturas capilares
DDBJ: Trace archive
EMBL-EBI: Nucleotido Europeo
NCBI: Tarce archive
secuencias anotadas
DDBJ: Muestra bio
EMBL-EBI: Archivo (ENA)
NCBI: Muestra bio
El comiote esta formado por miembros de cada uno de los organos asesores de la base de datos.
como enviar datos:
para obtenes detalles muy comp,etos sobre como enviar datos a la bases de datos, tiene que seleccionar un socio colaborador.
DDBJ, ENA, GenBack
Instituto Europeo de Bioinformatica
Programa de insdustria.
El Programa de Industria de EMBL-EBI es un foro único para la interacción y el intercambio de conocimientos para aquellos que trabajan en la vanguardia de la bioinformática aplicada.
El programa se centra en la colaboración precompetitiva, el software de código abierto y los estándares informáticos, que se han vuelto esenciales para mejorar la eficiencia y reducir los costos para la industria.
Innovacion y Traduccion.
Estimula la innovacion en la investigacion biomedica y de ciencias de la vida.
Este tambien trabaja con pequeñas y grandes empresas para ayudar y aprovechar al maximo los recursos de datos biologicos publicos.
Big Data
los cientificos utilizan mas de 3.3 millones de sitios unicos de EMBL-EBI cada mes.
todos los dias se realizan mas de 38 millones de solicitudes a los sitios web.
los centros EMBL-EBI tuvo 190 subvenciones financiadas conjuntamente con investigadores en 64 paises del mundo.
en 2017, la EMBL-EBI participo en 340 eventos de capacitacion, divulgacion e intercambio de conocimientos.
el EBI presenta 6 bases de datos moleculares:
EMBL-Banck es el repositorio de secuencias de ADN Y ARN.
SWISS-PROT
TrEMBL son bases de datos de proteinas.
MSD es una base de datos de estructura de proteinas.
Ensembl es uno de los 3 exploradores rpincipales del genoma.
ArrayExpress este es uno de los dos principales repositorios mundiales para expresion de genes.
Base de datos de ADN de Japon.
Este centro recopila y proporciona datos de secuencias de nucleotidos y apoya las actividades de investigacion en ciencias de la vida.
Mision
Historia
Actividades Principales
Construccion y Operacion de INSDC
En Japon, contribuye internacionalmente el centro de DDBJ como miembro de INSDC para recopilar datos de secuencia de nucleotidos.
El centro DDBJ esta oficialmente certificado para recopilar secuencias de nucleotidos.
Datos de secuencia incluidos en las solicitudes de patente
Ptente, Propiedad intelectual y Prioridad.
Columna de patente de DDBJ
Gestion y funcionanmiento del Instituto Nacional de Sistema de Supercomputacion Genetica.
Es un sitio de utilizacion de computadoras a gran escala con analisis del genoma.
Este sistema proporciona servicios de sistema de supercomputacion que incliyen computadoras de vanguardia de tipo clúster a gran escala.
Gestionde bases de Datos Biologicas: Herramientas para depositar y recuperar.
proporciona base de datos mantenidas por DDBJ.
puede descargar colectivamente bases de datos desde el sitio FTP.
Curso de formacion y publicacion.
El DDBJ organiza un grupo de capacitacion en bioinformatica.
Enseña como enviar datos de secuencias de nucleotidos y como utilizar servicios para analizar.
Centro Ncional de Informacion de Biotecnologia
¿Que hace?
crea bases de datos publicas, realiza investigaciones en biologia computacional y desarrolla herramientas para analizar datos genomicos.
hay 7 categorias en la barra superior del sitio web:
Entrez: integra base de datos cientificos y la secuencia de proteinas.
PubMed: es el servicio de busqueda de la biblioteca nacional de medicina que proporciona acceso a mas de 18 millones de citas en MEDLINE.
OMIM: es un catalogo de genes humanos y trastornos geneticos.
Taxonomia: incluye un navegador para las divisiones principales de los organismos vivos.
Estrucutra: mantiene base de datos molecular, una base de datos de estructuras tridimensionales macromoleculares.
Blast: es una herramienta de busqueda de similitud NCBI diseñado para apoyar el analisis de las bases de datos de nucleotidos y proteinas.