Bases de datos biológicas

DDBJ

Propósito principal:

Mejorar la calidad de INSD, como dominios públicos.

Bioinformation y DDBJ Center proporcionan servicios de análisis y compartición de datos de investigaciones de ciencias de la vida y avances científicos.

Está certificado oficialmente para:

Recoger las secuencias de nucleótidos de los investigadores y emitir el número de acceso reconocida internacionalmente para proveedores de los mismos.

EMBL

Bases de datos, herramientas y software que permiten alinear, verificar y visualizar los diversos datos producidos en investigaciones financiadas con fondos públicos.

Importancia

Comprender cómo la genética afecta la salud de los seres humanos, plantas y animales es esencial para los avances en la prevención de enfermedades.

Bases de datos moleculares de núcleo

EMBL-Bank:

Es el repositorio de secuencias de ADN y ARN que es complementaria a GenBank y DDBJ.

SWISS-PROT:

Base de datos de proteínas

TrEMBL:

Base de datos de proteínas.

MSD:

Es una base de datos de estructura de la proteína.

Ensembl:

Es uno de los tres genoma navegadores principales.

ArrayExpress:

Es uno de los dos principales repositorios de todo el mundo para la expresión génica.

Formato de Adhesión de la muestra:

Tres cartas y cinco dígitos, por ejemplo, AAA12345.

GenBank

Tipos de datos en GenBank

Bases de datos de proteínas que contiene datos de globina beta:

Proteina Entrez
no redundante (nr)
UniProt

Bases de datos de ADN de GenBank que contiene datos de globina beta:

no redundante (nr)
dbGSS
dbHTGS
dbSTS

Bases de datos de ADN de GenBank, derivado de ARN, que contiene datos de globina beta:

Gen entrez
dbEST
UniGene
Expresión génica Ómnibus

Cantidad de datos de secuencia:

Contiene alrededor de 100 mil millones de nucleótidos de 100 millones de secuencias (versión 168)

Está diseñada para proporcionar y alentar el acceso dentrode la comunidad científica a la información de secuencia de ADN más actualizada y completa.

Códigos para designar las divisiones de archivos de datos:

1. PRI: secuencias de primates

2. ROD: secuencias de roedores w info

3. MAM: otras secuencias de mamíferos

4. VRT: otras secuencias de vertebrados

5. INV: secuencias de invertebrados

6. PLN: secuencias de plantas, hongos y algas

7. BCT: secuencias bacterianas

8. VRL: secuencias virales

9. PHG: secuencias de bacteriófagos.

10. SYN: secuencias sintéticas

11. UNA: secuencias sin anotar

12. EST: secuencias EST (etiquetas de secuencia expresadas)

13. PAT: secuencias de patentes

14. STS: secuencias de STS (sitios marcados según la secuencia)

15. GSS: secuencias GSS (secuencias de estudio del genoma)

16. HTG: secuencias HTGS (secuencias genómicas de alto rendimiento)

17. HTC: secuencias de HTC (secuencias de cDNA de alto rendimiento)
1

18. ENV: secuencias de muestreo ambiental.

NCBI

Categorías de la página web NCBI

Entrez

Integra las bases de datos científicos literatura fi c, ADN y la secuencia de proteína.

Explosión

BLAST (Basic Local Alignment Search Tool) es una herramienta diseñado para apoyar el análisis de las bases de datos de nucleótidos y proteínas.

OMIM

OnlineMendelian Inheritance Inman, es un catálogo de genes humanos y trastornos genéticos.

PubMed

Libros

Ofrece varias docenas de libros en línea y están vinculada

Taxonomía

Navegador taxonomía para las divisiones principales de los organismos vivos (arqueas, bacterias y virus eukaryota).

Estructura

Incluyen PDBeast (un sitio dentro de la taxonomía MMDB), Cn3D (un visor de estructura tridimensional), y una herramienta de búsqueda de alineamiento vectorial (VAST), que permite la comparación de las estructuras.

VIsualizador de mapas en NCBI; Para cada genoma, cuatro niveles de detalle están disponibles:

(1) la página principal de un organismo.

(2) la vista genoma, mostrando ideogramas (representaciones de los cromosomas)

(3) la vista del mapa, lo que permite ver las regiones en varios niveles de resolución.

(4) la vista de secuencia, se presentan datos de la secuencia, así como la anotación de interés tal como la localización de genes.

Crea bases de datos públicas, realiza investigaciones en biología computacional, desarrolla herramientas de software para analizar datos genómicos y difunde información biomédica.

Bases de datos de bioinformática que no contienen datos de secuencias de nucleótidos o proteínas.

Bases de datos de literatura contienen: referencias bibliográficas para la investigación biológica (PubMed, SRS).

Bases de datos de estructuras contienen: información de estructuras de proteínas y macromoléculas.

Comparaciones:

Diferencias

UniGene tiene información detallada de expresión; se enumeran las bibliotecas de cDNA a partir del cual se han secuenciado EST particulares.

UniGene enumera los ESTs correspondiente a un gen, que permite una para estudiar en detalle.

Entrez Gene puede proporcionar una descripción más estable de un gen.

Tienen características en común, tales como enlaces a OMIM, homólogos, e información de mapeo. Ambos se muestran los números de acceso RefSeq.