Guia Sobre R.a.i.d, guia explicativa sobre que es el raid

ShotGun

Well-known member
Que significa Raid??? Que es el sistema Raid?


Raid son las siglas de la frace inglesa Redundant Array of Independent Disks".la cual significa matriz redundante de discos independientes .
El sistema raid consiste en unir varios discos logicos(unidades fisicas) para que queden como uno solo disco y con ello almacenar la información en forma redundante con ello Ofrece mayor tolerancia a fallos y más altos niveles de rendimiento que un sólo disco duro o un grupo de discos duros independientes.

Un sistema raid consta de dos o mas discos duros (hdd) que ante el sistema es uno solo Un RAID, para el sistema operativo, aparenta ser un sólo disco duro lógico (LUN). Los datos se desglosan en fragmentos que se escriben en varias unidades de forma simultánea. En este método, la información se reparte entre varios discos, usando técnicas como el entrelazado de bloques (RAID nivel 0) o la duplicación de discos (RAID nivel 1) para proporcionar redundancia, reducir el tiempo de acceso, y/o obtener mayor ancho de banda para leer y/o escribir, así como la posibilidad de recuperar un sistema tras la avería de uno de los discos.
La tecnología RAID protege los datos contra el fallo de una unidad de disco duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta que se sustituya la unidad defectuosa.
La tecnología RAID se utiliza también con mucha frecuencia para mejorar el rendimiento de servidores y estaciones de trabajo. Estos dos objetivos, protección de datos y mejora del rendimiento, no se excluyen entre sí.
RAID ofrece varias opciones, llamadas niveles RAID, cada una de las cuales proporciona un equilibrio distinto entre tolerancia a fallos, rendimiento y coste.
Todos los sistemas RAID suponen la pérdida de parte de la capacidad de almacenamiento de los discos, para conseguir la redundancia o almacenar los datos de paridad.

Que ventajas tiene un sistema raid??
Tolerancia a fallos: RAID protege contra la pérdida de datos y proporciona recuperación de datos en tiempo real con acceso interrumpido en caso de que falle un disco.

*Mejora del Rendimiento/ Velocidad: Una matriz consta de dos o más discos duros que ante el sistema principal funcionan como un único dispositivo. Los datos se desglosan en fragmentos que se escriben en varias unidades de forma simultánea. Este proceso, denominado fraccionamiento de datos, incrementa notablemente la capacidad de almacenamiento y ofrece mejoras significativas de rendimiento. RAID permite a varias unidades trabajar en paralelo, lo que aumenta el rendimiento del sistema.

*Mayor Fiabilidad: Las soluciones RAID emplean dos técnicas para aumentar la fiabilidad: la redundancia de datos y la información de paridad. La redundancia implica el almacenamiento de los mismos datos en más de una unidad. De esta forma, si falla una unidad, todos los datos quedan disponibles en la otra unidad, de inmediato. Aunque este planteamiento es muy eficaz, también es muy costoso, ya que exige el uso de conjuntos de unidades duplicados. El segundo planteamiento para la protección de los datos consiste en el uso de la paridad de datos. La paridad utiliza un algoritmo matemático para describir los datos de una unidad. Cuando se produce un fallo en una unidad se leen los datos correctos que quedan y se comparan con los datos de paridad almacenados por la matriz. El uso de la paridad para obtener fiabilidad de los datos es menos costoso que la redundancia, ya que no requiere el uso de un conjunto redundante de unidades de disco.
*Alta Disponibilidad: RAID aumenta el tiempo de funcionamiento y la disponibilidad de la red. Para evitar los tiempos de inactividad, debe ser posible acceder a los datos en cualquier momento. La disponibilidad de los datos se divide en dos aspectos: la integridad de los datos y tolerancia a fallos. La integridad de los datos se refiere a la capacidad para obtener los datos adecuados en cualquier momento. La mayoría de las soluciones RAID ofrecen reparación dinámica de sectores, que repara sobre la marcha los sectores defectuosos debidos a errores de software. La tolerancia a fallos, el segundo aspecto de la disponibilidad, es la capacidad para mantener los datos disponibles en caso de que se produzcan uno o varios fallos en el sistema.


En un sistema raid hay varios tipos de “Raid” de ellos estan ..
*RAID 0: Disk Striping "La más alta transferencia, pero sin tolerancia a fallos".
También conocido como "separación ó fraccionamiento/ Striping". Los datos se desglosan en pequeños segmentos y se distribuyen entre varias unidades. Este nivel de "array" o matriz no ofrece tolerancia al fallo. Al no existir redundancia, RAID 0 no ofrece ninguna protección de los datos. El fallo de cualquier disco de la matriz tendría como resultado la pérdida de los datos y sería necesario restaurarlos desde una copia de seguridad. Por lo tanto, RAID 0 no se ajusta realmente al acrónimo RAID. Consiste en una serie de unidades de disco conectadas en paralelo que permiten una transferencia simultánea de datos a todos ellos, con lo que se obtiene una gran velocidad en las operaciones de lectura y escritura. La velocidad de transferencia de datos aumenta en relación al número de discos que forman el conjunto. Esto representa una gran ventaja en operaciones secuenciales con ficheros de gran tamaño. Por lo tanto, este array es aconsejable en aplicaciones de tratamiento de imágenes, audio, video o CAD/CAM, es decir, es una buena solución para cualquier aplicación que necesite un almacenamiento a gran velocidad pero que no requiera tolerancia a fallos. Se necesita un mínimo de dos unidades de disco para implementar una solución RAID 0.
*RAID 1: Mirroring "Redundancia. Más rápido que un disco y más seguro"
También llamado "Mirroring" o "Duplicación" (Creación de discos en espejo). Se basa en la utilización de discos adicionales sobre los que se realiza una copia en todo momento de los datos que se están modificando. RAID 1 ofrece una excelente disponibilidad de los datos mediante la redundancia total de los mismos. Para ello, se duplican todos los datos de una unidad o matriz en otra. De esta manera se asegura la integridad de los datos y la tolerancia al fallo, pues en caso de avería, la controladora sigue trabajando con los discos no dañados sin detener el sistema. Los datos se pueden leer desde la unidad o matriz duplicada sin que se produzcan interrupciones. RAID 1 es una alternativa costosa para los grandes sistemas, ya que las unidades se deben añadir en pares para aumentar la capacidad de almacenamiento. Sin embargo, RAID 1 es una buena solución para las aplicaciones que requieren redundancia cuando hay sólo dos unidades disponibles. Los servidores de archivos pequeños son un buen ejemplo. Se necesita un mínimo de dos unidades para implementar una solución RAID 1.
*RAID 0+1/ RAID 0/1 ó RAID 10: "Ambos mundos"
Combinación de los arrays anteriores que proporciona velocidad y tolerancia al fallo simultáneamente. El nivel de RAID 0+1 fracciona los datos para mejorar el rendimiento, pero también utiliza un conjunto de discos duplicados para conseguir redundancia de datos. Al ser una variedad de RAID híbrida, RAID 0+1 combina las ventajas de rendimiento de RAID 0 con la redundancia que aporta RAID 1. Sin embargo, la principal desventaja es que requiere un mínimo de cuatro unidades y sólo dos de ellas se utilizan para el almacenamiento de datos. Las unidades se deben añadir en pares cuando se aumenta la capacidad, lo que multiplica por dos los costes de almacenamiento. El RAID 0+1 tiene un rendimiento similar al RAID 0 y puede tolerar el fallo de varias unidades de disco. Una configuración RAID 0+1 utiliza un número par de discos (4, 6, 8) creando dos bloques. Cada bloque es una copia exacta del otro, de ahí RAID 1, y dentro de cada bloque la escritura de datos se realiza en modo de bloques alternos, el sistema RAID 0. RAID 0+1 es una excelente solución para cualquier uso que requiera gran rendimiento y tolerancia a fallos, pero no una gran capacidad. Se utiliza normalmente en entornos como servidores de aplicaciones, que permiten a los usuarios acceder a una aplicación en el servidor y almacenar datos en sus discos duros locales, o como los servidores web, que permiten a los usuarios entrar en el sistema para localizar y consultar información. Este nivel de RAID es el más rápido, el más seguro, pero por contra el más costoso de implementar.
*RAID 2: "Acceso paralelo con discos especializados. Redundancia a través del código Hamming"
El RAID nivel 2 adapta la técnica comúnmente usada para detectar y corregir errores en memorias de estado sólido. En un RAID de nivel 2, el código ECC (Error Correction Code) se intercala a través de varios discos a nivel de bit. El método empleado es el Hamming. Puesto que el código Hamming se usa tanto para detección como para corrección de errores (Error Detection and Correction), RAID 2 no hace uso completo de las amplias capacidades de detección de errores contenidas en los discos. Las propiedades del código Hamming también restringen las configuraciones posibles de matrices para RAID 2, particularmente el cálculo de paridad de los discos. Por lo tanto, RAID 2 no ha sido apenas implementado en productos comerciales, lo que también es debido a que requiere características especiales en los discos y no usa discos estándares.
Debido a que es esencialmente una tecnología de acceso paralelo, RAID 2 está más indicado para aplicaciones que requieran una alta tasa de transferencia y menos conveniente para aquellas otras que requieran una alta tasa de demanda I/O.
*RAID 3: "Acceso síncrono con un disco dedicado a paridad"
Dedica un único disco al almacenamiento de información de paridad. La información de ECC (Error Checking and Correction) se usa para detectar errores. La recuperación de datos se consigue calculando el O exclusivo (XOR) de la información registrada en los otros discos. La operación I/O accede a todos los discos al mismo tiempo, por lo cual el RAID 3 es mejor para sistemas de un sólo usuario con aplicaciones que contengan grandes registros.
RAID 3 ofrece altas tasas de transferencia, alta fiabilidad y alta disponibilidad, a un coste intrínsicamente inferior que un Mirroring (RAID 1). Sin embargo, su rendimiento de transacción es pobre porque todos los discos del conjunto operan al unísono.

RAID 5:
Discos de datos independientes con bloques de paridad distribuidos ( Bloques de Intervalo de Paridad Distribuida)

Cada vez que un bloque de datos (algunas veces llamado pedazo) es escrito en un disco dentro de un conjunto, un bloque de paridad es generado dentro de la misma división. (Un bloque o pedazo esta compuestos de muchos sectores consecutivos en un disco, algunas veces tanto como 256 sectores. Una serie de pedazos [un pedazo de cada disco dentro de un conjunto] es llamado colectivamente una división.) Si otro bloque, o alguna porción del bloque es escrita en la misma división, el bloque de paridad (o una parte del bloque de paridad) es recalculada y vuelta a escribir. El disco utilizado por el bloque de paridad es escalonado desde una división hasta la siguiente, de ahí el término bloques de paridad distribuidos.

Es interesante que, los bloques de paridad no son leídos en las lecturas de datos, ya que esto sería una sobrecarga innecesaria y podría disminuir el rendimiento. Los bloques de paridad son leídos, sin embargo, cuando la lectura de un sector de datos resulta en un error CRC. En este caso, el sector en la misma posición relativa en cada uno de los bloques de datos restantes en la división y dentro del bloque de paridad en la división son utilizados para reconstruir el sector erróneo. El error CRC se encuentra oculto para la computadora. De cualquier manera, si un disco falla en el conjunto, los bloques de paridad en los discos sobrevivientes son combinados matemáticamente con los bloques de datos de los discos sobrevivientes para reconstruir los datos de la unidad que ha fallado al vuelo. Esto es algunas veces llamado Modo Interno de Recuperación de Datos. La computadora no se entera de que el disco ha fallado. La acción de leer y escribir al conjunto de discos continúa normalmente, aunque con algúna degeneración de rendimiento. En RAID 5, en los conjuntos que solo tienen un bloque de paridad por división, la falla de una segunda unidad de disco resulta en la pérdida total de la información.

El RAID de nivel 5 requiere de al menos 3 unidades de disco para ser implementado. El número máximo de discos teóricamente es ilimitado, pero es una práctica común mantener un máximo de 14 unidades de disco o menos para implementaciones de RAID 5 que tienen un solo bloque de paridad por división. La razón para esta restricción es que existe una gran concordancia en cuanto a que una unidad de disco fallará en el conjunto cuando exista un gran número de unidades de disco. (El valor del Tiempo Estimado Entre fallas MTBF para una unidad de disco dentro de un conjunto se vuelve más pequeño.) En implementaciones con más de 14 unidades de disco, el RAID 5 con paridad dual (también conocido como RAID 6) es algunas veces utilizado ya que puede sobrevivir a la falla de dos discos.


Características y Ventajas Del RAID 5

Mayor tasa de transacciones de lectura De media a pobre tasa de transacciones de escritura, especialmente cuando el CPU realiza chequeos de paridad por software. Bajo coeficiente de discos ECC (Paridad) para los discos de datos significa alta eficiencia. Buena tasa de transferencia agregada.


Desventajas

El fallo de unidades de disco tiene un impacto medio en el caudal de salida. Diseño de controladoras más complejo. Dificultad para reconstruir en el caso de el fallo de una unidad de disco (comparada con el RAID de nivel 1). En bloques de datos individuales la tasa de transferencia es la misma que en un disco individual. Alta sobrecarga para escrituras pequeñas. Para cambiar 1 byte en un archivo, la división completa debe ser leída, el byte modificado, la información de paridad recalculada, y la división entera vuelta a escribir. Sin embargo, el hecho de que los sistemas de archivos tienden a dirigirse a los discos naturalemente en clusters oculta parcialmente este efecto.


Aplicaciones Recomendadas

* Servidores de Archivos y de Aplicaciones
* Servidores de Bases de Datos
* Servidores de web, e-mail y de noticias
* Servidores de Intranet
* Es el nivel de RAID más versátil




Fuente : www.smdata.com
Fuente Raid 5 : www.wikipedia.org
 
Volver
Arriba