Categories: All - bases - biología - herramientas - datos

by veronica javier 5 years ago

441

base de datos

El Centro Nacional de Información de Biotecnología (NCBI) se dedica a la creación de bases de datos públicas, la investigación en biología computacional y el desarrollo de herramientas para analizar datos genómicos.

base de datos

Base de Datos Biologicas

Centro Ncional de Informacion de Biotecnologia

¿Que hace?
hay 7 categorias en la barra superior del sitio web:

Blast: es una herramienta de busqueda de similitud NCBI diseñado para apoyar el analisis de las bases de datos de nucleotidos y proteinas.

Estrucutra: mantiene base de datos molecular, una base de datos de estructuras tridimensionales macromoleculares.

Taxonomia: incluye un navegador para las divisiones principales de los organismos vivos.

OMIM: es un catalogo de genes humanos y trastornos geneticos.

PubMed: es el servicio de busqueda de la biblioteca nacional de medicina que proporciona acceso a mas de 18 millones de citas en MEDLINE.

Entrez: integra base de datos cientificos y la secuencia de proteinas.

crea bases de datos publicas, realiza investigaciones en biologia computacional y desarrolla herramientas para analizar datos genomicos.

Base de datos de ADN de Japon.

Este centro recopila y proporciona datos de secuencias de nucleotidos y apoya las actividades de investigacion en ciencias de la vida.
Actividades Principales

Curso de formacion y publicacion.

El DDBJ organiza un grupo de capacitacion en bioinformatica.

Enseña como enviar datos de secuencias de nucleotidos y como utilizar servicios para analizar.

Gestionde bases de Datos Biologicas: Herramientas para depositar y recuperar.

puede descargar colectivamente bases de datos desde el sitio FTP.

proporciona base de datos mantenidas por DDBJ.

Gestion y funcionanmiento del Instituto Nacional de Sistema de Supercomputacion Genetica.

Este sistema proporciona servicios de sistema de supercomputacion que incliyen computadoras de vanguardia de tipo clúster a gran escala.

Es un sitio de utilizacion de computadoras a gran escala con analisis del genoma.

Construccion y Operacion de INSDC

El centro DDBJ esta oficialmente certificado para recopilar secuencias de nucleotidos.

Columna de patente de DDBJ

Ptente, Propiedad intelectual y Prioridad.

Datos de secuencia incluidos en las solicitudes de patente

En Japon, contribuye internacionalmente el centro de DDBJ como miembro de INSDC para recopilar datos de secuencia de nucleotidos.

Historia

en 2004 NIG fue reorganizado como miembro de ROIS; ORGANIZACION DE LA INVESTIGACION DE LA INFORMACION Y LOS SISTEMAS.

en 2001 el CIB fue reorganizado como CIB-DDBJ; el CENTRO DE BIOLOGIA DE LA INFORMACION Y BANCO DE DATOS DE ADN DE JAPON.

en 1995 el centro de Biologia de la Informacion fue establecido en NIG

en 1987es el inicio oficial de la operacion de DDBJ ya que por el lanzamiento de la 1ra version de DDBJ es como se considera ese año.

en 1986 comite Consultivo de bases de Datos de ADN organizado

en 1984 el Instituto Nacional de Genetica se reorganizo como un III (Instituto de Investigacion Interuniversitario)

en 1983 se inicio la carga de los datos del ensayo con el objetivo de contribuir al banco de datos internacional para recopilar y evular datos de secuencia de nucleotidos.

en 1982 GenBack y EMBL invitaron a Japon para participar en su banco de datos e iniciaron la cooperacion internacional.

Mision

El centro de DDBJ debe desempeñar un papel muy importante en la investigación en biología de la información y ejecutar la operación en el mundo.

los análisis in silico e in vitro/in vivo juntos harán retroceder las fronteras de las ciencias de la vida.

acepta que la investigacion en biologia, hoy en dia requiere de equipos de computacion y experimentales igualmente.

Instituto Europeo de Bioinformatica

el EBI presenta 6 bases de datos moleculares:
ArrayExpress este es uno de los dos principales repositorios mundiales para expresion de genes.
Ensembl es uno de los 3 exploradores rpincipales del genoma.
MSD es una base de datos de estructura de proteinas.
TrEMBL son bases de datos de proteinas.
SWISS-PROT
EMBL-Banck es el repositorio de secuencias de ADN Y ARN.
Big Data
en 2017, la EMBL-EBI participo en 340 eventos de capacitacion, divulgacion e intercambio de conocimientos.
los centros EMBL-EBI tuvo 190 subvenciones financiadas conjuntamente con investigadores en 64 paises del mundo.
todos los dias se realizan mas de 38 millones de solicitudes a los sitios web.
los cientificos utilizan mas de 3.3 millones de sitios unicos de EMBL-EBI cada mes.
Innovacion y Traduccion.
Este tambien trabaja con pequeñas y grandes empresas para ayudar y aprovechar al maximo los recursos de datos biologicos publicos.
Estimula la innovacion en la investigacion biomedica y de ciencias de la vida.
Programa de insdustria.
El programa se centra en la colaboración precompetitiva, el software de código abierto y los estándares informáticos, que se han vuelto esenciales para mejorar la eficiencia y reducir los costos para la industria.
El Programa de Industria de EMBL-EBI es un foro único para la interacción y el intercambio de conocimientos para aquellos que trabajan en la vanguardia de la bioinformática aplicada.

Colaboracion Internacional de Bases de Datos de Secuencias de Nucleotidos.

La colaboracion internacional de bases de datos de secuencias de nucleotidos, es una iniciativa fundamental de laraga data que opera en distintos centros.
como enviar datos:

para obtenes detalles muy comp,etos sobre como enviar datos a la bases de datos, tiene que seleccionar un socio colaborador.

DDBJ, ENA, GenBack

El comiote esta formado por miembros de cada uno de los organos asesores de la base de datos.
Tipos:

secuencias anotadas

NCBI: Muestra bio

EMBL-EBI: Archivo (ENA)

DDBJ: Muestra bio

lecturas capilares

NCBI: Tarce archive

DDBJ: Trace archive

la proxima generacion lee

NCBI: Secuencia leer archivo

EMBL-EBI: Nucleotido Europeo

DDBJ: Secuencia de leer archivo

GenBak: Base de Datos de la Secuencia de Nucleotidos y proteinas mas conocidas.

esta compuesta por la mayoria de secuencias publicas conocidas de ADN proteinas.
dentro de cada base de datos, los datos de secuencia se representan en una variedad de formas.
Organismos en GenBank
Mas de 260000 especies diferentes estas representadas en GenBak, con mas de 1000 nuevas especies agregadas por mes.

diferentes especies son utiles para una variedad de diferentes estudios.

rana de garra occidental

pez cebra

arroz

uva de vino

tabaco

pan de trigo

rana

cerdo

maiz

rata

pollo

raton

vaca

humano

Taxonomia

Virus

Viridiplantae

Metazoa

Hongos

Eukaryota

Bacterias

Archaea

cantidad de datos de secuencia:
la secuenciacion de la proxima generacion implica la generacion de cantidades masivas de datos de secuencia, como 1 billoin de bases.
La division de WGS consiste en secuencias generadas por esfuerzos de secuenciacion de alto rendimiento.
GenBack contiene 100 mil millones de nucleotidos de 100 millones de secuencias.
Los EST son tipicamente clones de ADNc seleccionados al azar que se secuencian en una cadena.
GenBack divide tecnologias de la informacion entres categorias principales, humanos, ratos y otras. son 10 organismos a partir de los cuales se ha secuenciado el mayor numero de EST.