La alta disponibilidad (HA) y la virtualización son esenciales para diseñar sistemas robustos y seguros que puedan tolerar fallos. La virtualización implica la abstracción de recursos físicos en un entorno virtual, permitiendo manejar diversas aplicaciones y sistemas operativos de manera eficiente.
Un dels millors metodes per proporcionar seguretat front a fallades es dispondre de un bon diseny de virtualització dels servicis, permet el desplegament de nous servidors en poc de tems i estalvi de costos de manteniment.
El hypervisor
Es un monitor de baix nivell per les maquines virtuals que sinicia en el arranc abanç de ejecutar el s.o.
Entorn de desenvolupament: testejar el software baix certes condicions.
Entorns de prova: Per provar actualitzacions en un entorn reduit pero paregut al de producció.
Entorns de producció: Es creu una infrastuctura virtual sobre la fisica per separar el hardware en el saplica.
Recursos
Virtualització de escritori:Abstracció del escritori del usuari permitint accedir desde cualsevol punt.
V.apliacions:Encapsular aplicacions en un contenedor
v.recursos:Abstracciço de un recurs individual; xarxa ,alamacenament
V.Plataforma: Abstracció de un sistema completa , per unificar servidors com una sola maquina
Asistida per hardware
tant Intel com AMD disposen de caracteristiques en els procesadors per millorar el rendiment de maquines virtuals.
Abstracció de recursos de un sistema que crea un envlotori de software entre el hardware de la maquina fisica i el s.o de la maquina virtual.
Sitemes en cluster
que conte?
Un gestor del cluster
conexió a xarxa externa per proporcionar els serveis del cluster
un sistema de almacenament
interconexio dels nodes a traves de una xarxa
Nodes(cada sistema individual)
Topologies en un cluster
Cluster Par+N: Un parell de nodes conectats al amacenament i n nodes que interconectes amb els dos per compartir la informació.
cluster N+1:Hi ha N nodes que poden accedir a el seu almacenament i un node privilegiat que pot accedir a tots els recursos
Parells clusterizats: Tots els nodes estan duplicats, aixi cada node pots accedir a la seua informacio i la de el seu homoleg, es un sistema altament redundant i tolerant a fallades.
Conceptes sobre clustering
Agent de recurs
un script(init) que controla un recurs
Recurs
Component per utilitzar o compartir
Quorum
Es el sistema de acords entres els nodes
Heartbeat
pols de comunicació entre els nodes
Failover
recupeció de una fallada atraves de un altre node
que es?
es un sistema compost per un conjunt de sistemes autoconectats que es utilitzat com un recurs unificat.
Sistemes tolerants a fallades
Tipus segons mode que atenen les peticions
Actiu/actiu:Els 2 nodes sempre estan atenent les peticions, cuan un falla el atre absorveix tota la carrega.
Actiu/pasiu:Les peticions son sempre dirigides al node actiu, el altre queda inactiu a la espera de una fallada del actiu
Tipus segons instalació
Tolerancia per redundancia.Les peticions sols es dirigeixen a una de les instancies identiques, denominada instancia master
Tolerancia per replicació, es te instancies identiques de lservei i les peticions es fan a tots elles en pararel
Balanç de carrega
Dispositiu hardware o software que asigna les solicituts dels clients i reparteix entre els servidors per no saturar un.
Recuperacio de desastre
Es deu incloure un pla de actuació despres de un desastre o catastrofe
Aquell sistema que te la capacitat de seguir donant servei despres de una fallada
Caracteristiques de la Alta disponibilitat
Disponibilitat de un servei
Predicció i prevenció de fallades,hi ha que intentar previndre les situacións de risc importants per a la disponibilitat
Minimitzar el MTTR,(Mean time to repair),el temps de recuperació de un servei te que ser el minim.
Recupació de estat de aplicacions i dades en cas de fallada
Redundancia(failover),Capacitat que un segon sistema agafe el control de un servici cuan el principal falle
Components de un sistema HA
Els elements que tinguem q considerar pe a disenyar un sistema altament disponible son: entorn, equipament de proces de dades i equipament de alamacenament.
Punt unic de fallada
SPoF, es una part del sistema que en cas de fallada parará tot el sistema, hi ha que intentar detectar i corregirlos.
Conceptes basics
Latencia de un error
Temps que pasa entre la aparició del error i la manifestació d en el exterior del sistema
Latencia de una fallada
Temps que pasa entre que es produeix una fallada fins que es manifesa el error
Tdisponible es el temps que el sistema esta operatiu, Tinuactiu el temps que el sistema no esta disponible, es compta el numero de "nous" per clasificar el sistemes altament disponibles.
Misió critica
Aquella que afecta a la vida, seguretat, o propietat de les persones i no pot pararse
Que es?
Es un protocol de diseny que mante un sistema amb una continuitat operacional durant el maxim temps posible.
Alta Disponibilitat(HA)
Objectius
Aprendre a manejar plataformes de virtualització
Instalar un sistema tolerant per una granja web
Coneixer el diseny dels sistemes de balaçeig de carrega