LO QUE MANTIENE DESPIERTOS A LOS PROFESIONALES DE LA TECNOLOGÍA EN LAS NOCHES: 4 CONSEJOS PARA UNA GESTIÓN DE RECUPERACIÓN ANTE DESASTRES EFICAZ
18 Feb 2016
La recuperación de desastres (RD) ha sido un reto para la gente de TI durante décadas, gran parte de ese desafío derivado del costo y la complejidad de las soluciones existentes. Dado que las operaciones de TI tienen que evolucionar y lo seguirán haciendo, estas soluciones, a menudo heredadas, causan más problemas de los que solucionan. Pero hay buenas noticias: la madurez de la virtualización y la aparición de la nube pública a hiper-escala trae una nueva forma de ver la RD que no existía antes.
Definición de RD
Antes de profundizar en las cosas importantes a tener en cuenta para una recuperación ante desastres moderna y eficaz, vamos a empezar con la definición del tipo de RD en la que nos estamos centrando ya que con frecuencia este término es tratado en distintas formas. Por un lado, las organizaciones que emplean tecnologías de respaldo como aplicaciones y cintas o discos de copia de seguridad, se refieren al acto simple de mover sus copias de respaldo fuera del sitio como una forma de recuperación de desastres. Mientras esto se haga, de hecho significa que los datos están disponibles en caso de un evento desastroso, la única manera de «recuperar» una aplicación es restaurándola desde algún hardware remoto o local lo cual puede tomar días o semanas si ese hardware no está fácilmente disponible.
Pero el hecho es que para muchas aplicaciones dentro de las organizaciones, el tiempo de recuperación deseado se mide en minutos u horas, no días o semanas. Y ese tipo de recuperación de desastres ha implicado históricamente datacenters secundarios con una infraestructura redundante en espera – que es extremadamente costosa y compleja. Como resultado, muchas empresas no pasan de la copia de respaldo con datos fuera del sitio y lo llaman RD.
Yendo más allá de la herencia
Ahora, por primera vez, las grandes tendencias de la virtualización y la nube pública a hiper-escala pueden ayudar a resolver estos latentes desafíos de la Recuperación ante Desastres, permitiendo a los profesionales de TI concentrarse en sus otras múltiples tareas. Aquí hay cuatro consejos claves para lograr una verdadera Recuperación ante Desastres Vs. la copia de respaldo:
Tip # 1: No asuma que todos los desastres comienzan con una letra mayúscula «D».
Cuando muchos de nosotros pensamos en la planificación de recuperación de desastres, tendemos a enfocarnos, en gran medida, en la idea de perder todo un datacenter a causa de un desastre natural u otro evento catastrófico. Pero, de hecho, la mayoría de las interrupciones son parciales o pequeñas «ds». Se deben a una falla en la matriz de almacenamiento o disco, una actualización de aplicación fracasada, un problema de instalación (ej.: un apagón/ interrupción de la energía eléctrica), tuberías con fugas, o alguna otra interrupción contenida. Y mientras debemos planificar para los peores escenarios, no podemos hacerlo a causa de las ocurrencias más comunes.
Como resultado de ello, es fundamental contar con un plan de RD que permita a su datacenter primario trabajar en conjunto con un sitio secundario que corra sólo algunas de sus aplicaciones. Esto significa que los servicios de redes y core del negocio tales como el Domain Name System (DNS) y el Directorio Activo tienen que ser incluidos en el plan de manera que se pueda conmutar sin problemas en caso de que se presente un error en una parte del entorno y se pueda conectar a la infraestructura existente. El plan debe evitar cosas como el conflicto de direcciones IP y / o síndrome de split-brain o cerebro dividido. En este caso, es necesario asegurar que la tecnología que se despliegue o el proveedor que elija, tiene la capacidad técnica para adaptarse a los escenarios de RD más comunes y no sólo la pérdida completa de un datacenter.
Tip # 2: Establecer sus metas y objetivos.
Es muy probable que usted tenga aplicaciones y datos con diferentes niveles de prioridad dentro de su organización. Antes de asumir las limitaciones técnicas y de costos de cualquier solución que planea implementar, determine los requerimientos del negocio. Para cada aplicación clave, ¿cuán pronto la necesita disponible nuevamente? ¿Instantáneamente, en cuestión de horas? ¿O “días” es aceptable? ¿Qué cantidad de datos puede darse el lujo de perder? ¿Ninguna, a menos de un par de horas, o un día completo? Al hacer este ejercicio usted estará seguro al explorar todas las soluciones posibles antes de hacer compromisos económicos innecesarios. Siempre puede hacer esas dolorosas concesiones presupuestarias más tarde.
También, establecer claramente los objetivos, obliga a los socios de negocio dentro de la organización a entender el costo y la complejidad de sus requerimientos. Esto creará una visión más realista de lo que significa recuperar instantáneamente una aplicación crítica.
Tip # 3: Asegure la separación geográfica apropiada para sus instancias de aplicaciones/ datos.
Aunque no siempre es posible, es importante tener en cuenta las opciones que garanticen que las locaciones de los datacenters primario y secundario estén lo suficientemente separadas cuando su negocio sobreviva a un “D” capital. Si ocurre algo catastrófico, y usted tiene el datacenter secundario en la misma calle de su datacenter primario puede que no ofrezca la protección adecuada, especialmente teniendo en cuenta el costo. Al tener locaciones separadas geográficamente, puede asegurarse de que sus aplicaciones críticas son recuperables, independientemente del escenario.
Tip # 4: No ignore las grandes tendencias de la virtualización y la nube pública a hiper-escala
Este puede ser el punto más importante de todos. La virtualización ha transformado nuestra gestión de centros de datos, y los proveedores de nube pública a hiper-escala están a punto de hacer lo mismo. Muchas de las ventajas proporcionadas por ambas tendencias se prestan a la solución del problema de la RD.
En el caso de la virtualización, ya no se requiere tener un hardware idéntico en dos lugares para lograr una verdadera recuperación ante un desastre. Debido a que la virtualización nos abstrae del hardware primario, es posible aprovechar de forma inteligente la infraestructura para reducir su complejidad y costo.
Además, muchas de las herramientas integradas en entornos virtualizados permiten a las soluciones desplegar una automatización mucho más amplia de lo que era posible con varios sistemas en diferentes tipos de hardware. Mediante el uso de las API y otras herramientas de automatización, las soluciones de gestión de RD adecuadas pueden crear una interfaz de gestión transparente para unir una variedad de diferentes servidores subyacentes, redes y almacenamiento en un datacenter de software definido que puede ser replicado en un conjunto de tecnologías igual o diferentes.
Y ahora, por primera vez, podemos pagar por los recursos de infraestructura de TI, según demanda, en la nube pública a hiper-escala. Este es un ajuste perfecto para la recuperación de desastres, que se queda con frecuencia en la categoría «sin uso».
Contraste pay-as-you-go con la forma de recuperación de desastres antigua que requiere un sitio secundario dedicado lleno de almacenamiento redundante, servidores, redes y software. Estos activos con frecuencia permanecían inactivos hasta que se necesitaran por una falla en el sitio primario, a la par que consumía gran parte del presupuesto y tiempo de TI. Una falla de su sitio secundario es probable que sea menos importante que una en su sitio principal siendo que no puede estar seguro de que cuando necesitará que esa matriz secundaria esté en condiciones óptimas para responder a un evento.
En algunos casos, los departamentos de TI podrían desarrollar formas creativas para tratar de obtener algún valor de estos activos secundarios, tales como su uso para prueba de actualizaciones, etc., pero qué pasa si mientras lo hace tiene la necesidad de utilizar el sitio para su propósito real (RD) si se produce justo en medio de poner una a correr alguna aplicación en el sitio de recuperación?
Ahora, con la nube pública a hiper-escala, las soluciones de gestión de recuperación ante desastres bien diseñadas pueden explotar al máximo la posibilidad de incurrir en una inversión únicamente cuando sea necesario y de forma rápida. Dado que los costos de infraestructura de nube pública a hiper-escala están dominados por las operaciones de cálculo y gestión de almacenamiento, una solución RD inteligente puede aprovechar al máximo el hecho de que el entorno de RD en realidad se debe apagar más de un 95 por ciento de las veces. Como resultado, si actualmente tiene un sitio RD, puede reducir los costos de su actual estrategia de recuperación dramáticamente. O bien, si ciertamente la implementación de un sitio de RD ha estado fuera de su alcance por razones de presupuesto y complejidad, puede tener ahora una solución sensata para que usted pueda mejorar la capacidad de su negocio para soportar las interrupciones en el servicio que ocurran.
Marc Crespi
CEO y cofundador de OneCloud Software
Marc Crespi es responsable de la estrategia y la ejecución general de la compañía. Cuenta con más de 20 años de experiencia dirigiendo ejecuciones de producto y rentabilidad en organizaciones de alto crecimiento.