CONTINUIDAD DE NEGOCIOS Y RECUPERACIÓN ANTE DESASTRES EN LA ERA DE IOT

29 Ene 2020

Como profesional de la tecnología, me gusta jugar en automatización del hogar y dispositivos inteligentes. Tengo dos redes WiFi en casa, cables Cat6 en cada habitación, múltiples switches gigabit, y enrutadores, todos conectados a una red de fibra gigabit de proveedor de servicios de Internet (ISP). Cuando mi ISP tuvo una interrupción inesperada de la red durante dos días, me sorprendió descubrir cuánto impactó en mi vida diaria.

Si bien podía usar mi computadora portátil conectándola por USB a mi teléfono móvil, el resto de la casa estaba desconectado del mundo. Sin una conexión a Internet, no tenía acceso a Amazon Alexa, el centro de control de la mayoría de mis dispositivos inteligentes, lo que significa que no había cámaras, ni cerraduras de puertas inteligentes, ni abridores de puertas de garaje inteligentes, ni electrodomésticos inteligentes, ni luces inteligentes, ni interruptores inteligentes, sin servicio de transmisión de música y sin servicios de transmisión de TV. ¡Incluso mi sistema de rociadores inteligentes dejó de funcionar!

Durante dos días enteros, no tuve acceso a muchos de los servicios relacionados con Internet en mi hogar. Debido a la interrupción, tuve mucho tiempo libre para reflexionar sobre las implicaciones de la recuperación ante desastres (DR). ¿Qué pasaría si una empresa perdiera el servicio de Internet durante dos días?

En consultoría de servicios profesionales, abordamos los problemas metódicamente. Mi enfoque favorito es el Six Sigma DMIAC, que significa definir, medir, analizar, mejorar y controlar.

  1. Defina el problema: mi objetivo es proporcionar un nivel de redundancia para que la mayoría de los servicios de mi hogar puedan continuar funcionando en caso de otra interrupción.
  2. Mida la línea de base actual para mejorar: después de un inventario detallado, conté 97 dispositivos conectados a mi red doméstica, incluidos 62 dispositivos de Internet de las cosas (IoT). Si bien 35 de ellos no funcionarían en absoluto sin conectividad a Internet, los otros 27 dispositivos continuarían funcionando si tuviera algún tipo de administración local a través de WiFi.
  3. Analice la causa raíz: hay muchos factores que pueden causar la interrupción del servicio de Internet. Mi objetivo es continuar el servicio localmente. Descubrí que tenía tres problemas para abordar.

a) Conexión ISP única: el problema podría resolverse con una conexión ISP redundante. Necesitaría un enrutador de borde para conectarme a ambos ISP y equilibrar la carga de las conexiones. En caso de una interrupción del ISP, el tráfico se conmutará automáticamente por error al puerto del ISP en funcionamiento.

b) Conectividad física: ¿qué sucede si hay una interrupción física regional? Mi última interrupción estuvo relacionada con la construcción de carreteras cuando la tripulación cortó accidentalmente la línea de fibra enterrada del ISP. Esto podría afectar las líneas físicas de ambos ISP. Sería ideal una solución de ISP basada en celulares para hacer una copia de seguridad de las redes físicas. Después de una búsqueda rápida en Amazon, pude encontrar lo que necesitaba.

c) Hay muchos módems que pueden conectarse a la red celular a través de 4G LTE y recurrir a 3G si es necesario. El módem puede conectarse a uno de los puertos de red de área amplia (WAN) en el enrutador de borde y proporcionar una conmutación por error sin interrupciones.

d) Interrupción completa de Internet: finalmente, si el servicio de Internet no está disponible por completo, aún debería tener la capacidad de operar servicios críticos localmente en mi red doméstica. Identifiqué varios de estos servicios críticos y escribí las posibles soluciones.

Tres de los ejemplos son los siguientes:

i. Cámaras de seguridad alojadas localmente

ii. Servicio de transmisión de medios alojado localmente

iii. Bypass manual para control local de rociadores

 

  1. Mejorar: para abordar la lista de problemas de DR, implementé las siguientes mejoras:

a) Además de mi proveedor de ISP físico, agregué un módem celular con mi proveedor móvil actual para redundancia.

b) Instalé un enrutador de borde con tres puertos WAN. El tráfico normalmente pasaría a través de la conexión de fibra gigabit al puerto primario cuando estén disponibles los ISP tanto físicos como celulares. Si una conexión física no está disponible, el tráfico se conmutará automáticamente por error al ISP celular a velocidad 4G.

c) También agregué un servidor de medios a mi red para entregar contenido de transmisión en caso de una interrupción completa.

  1. Control: después de las implementaciones, continué identificando problemas con la nueva solución e hice mejoras adicionales. El último problema es el problema de bajo ancho de banda asociado con una conexión celular. Tengo cinco cámaras de seguridad en mi casa. Cada cámara requeriría una velocidad de carga de 2 Mbps para enviar video a la nube. Eso ya equivale a un total de 10 Mbps, y la velocidad de carga 4G típica es de solo 5-6 Mbps.

¡Entonces me di cuenta de que acababa de diseñar un entorno de cómputo perimetral de acceso múltiple (MEC) para mi hogar!

 

Declaración del problema de IoT

El número de dispositivos IoT está aumentando exponencialmente en los últimos años, especialmente en la categoría de conexiones celulares de área amplia. Según Ericsson, la cantidad de dispositivos IoT alcanzará los 18.1 mil millones para 2022. De ellos, 2.100 millones de dispositivos IoT utilizarán conexiones celulares, así como tecnologías de baja potencia sin licencia. La seguridad se volverá más crítica debido al intercambio de datos en tiempo real, algunos de los cuales pueden ser confidenciales.

Business Insider realizó una encuesta para la inversión planificada de IoT y descubrió que la inversión de IoT se está acelerando en los segmentos empresariales, gubernamentales y de consumo. Con este aumento, proporcionar una infraestructura segura y estable es aún más crítico para administrar los dispositivos IoT que generalmente tienen requisitos de red muy diferentes en función de diferentes casos de uso. Algunos requisitos incluyen lo siguiente:

  • Alta disponibilidad: el diseño MEC se puede utilizar en un diseño altamente disponible que es extremadamente tolerante a fallas.
  • Un entorno de nube distribuida MEC está muy poco acoplado para minimizar el impacto de las interrupciones regionales.
  • Alto rendimiento de datos: las implementaciones actuales de MEC basadas en 3G y 4G no son suficientes para este requisito. Sin embargo, con 5G justo en el horizonte, el rendimiento ya no sería un problema. MEC con implementación 5G puede proporcionar velocidad de datos gigabit a través de la señal de radio sin la limitación de los cables físicos.
  • Baja latencia: la arquitectura MEC se centra en el almacenamiento en caché de la red de entrega de contenido en caché (CDN) para minimizar la latencia.

 

Descripción general de MEC

El cómputo perimetral de acceso múltiple, anteriormente denominado cómputo perimetral móvil, es una solución natural para la convergencia de las redes de TI y telecomunicaciones. MEC es la aplicación de los principios de la arquitectura de la nube para la infraestructura de computación, almacenamiento y redes cerca del usuario en el borde de una red. El diseño de MEC ofrece muchas ventajas en comparación con las redes tradicionales, especialmente en un escenario de recuperación ante desastres, que incluyen las siguientes:

  1. Integra la red celular para la redundancia: en lugar de depender únicamente de líneas fijas físicas, la integración de la conexión ISP celular proporciona un nivel adicional de redundancia. La red celular también es más rápida de restaurar que las líneas terrestres en un escenario de desastre severo.
  2. Resistencia y aislamiento de fallas: si la conectividad a Internet no funciona, una nube perimetral aún puede funcionar. Las aplicaciones basadas en MEC utilizan nubes de borde distribuidas geográficamente para el aislamiento de fallas.

En el caso de una interrupción generalizada, los entornos de nube de borde separados aún pueden funcionar de forma independiente.

  1. Contenido localizado: el almacenamiento en caché de contenido en un diseño MEC de nube distribuida mejora el rendimiento para mejorar la experiencia del usuario local. En caso de desastre, el sistema de entrega de contenido localizado puede continuar brindando servicio.

Utilizando MEC para resolver desafíos de IoT

  1. Redundancia de red

En mi ejemplo de red doméstica, mi diseño de red redundante, implementé un módem LTE con ISP celular. Esta nueva conexión está conectada a un enrutador multi-ISP. En caso de falla de mi ISP físico, todo el tráfico de la red pasaría automáticamente a la red celular. Habría una breve reconexión de paquetes, pero el impacto para el usuario sería mínimo.

Escalar este enfoque a un entorno empresarial grande es similar. En lugar de instalar solo una red portadora de ISP física, el ISP celular se implementa por redundancia. Se puede lograr una capacidad de recuperación adicional mediante la implementación de una red celular dentro de la red de empresas privadas locales.

La implementación de MEC privado también está en aumento. Después de los ataques del 11 de septiembre en la ciudad de Nueva York, la infraestructura de la red pública sufrió graves daños. Los primeros en responder y las agencias gubernamentales no pudieron comunicarse usando teléfonos celulares. Sin embargo, el MEC privado operado por la compañía de servicios públicos todavía funcionaba, y la compañía de servicios públicos abrió su red a algunos socorristas para ayudar con los problemas de comunicación.

Utilizando mi red doméstica como ejemplo de redundancia a pequeña escala, tengo dos redes WiFi locales además de una red cableada. Designé la primera red WiFi para ejecutar todos mis dispositivos de infraestructura críticos, como mi sistema de seguridad, detectores de incendios y humo, abrepuertas de garaje, sensor de fugas de agua y sistemas de automatización del hogar. La segunda red WiFi se utiliza para el tráfico de red general con una red de invitados separada para familiares, amigos y vecinos. Cualquiera de las redes WiFi podría ejecutar los dispositivos de la otra red en caso de emergencia, y podría compartir mi conexión celular limitada con otros para proporcionar cobertura de Internet local.

  1. Resiliencia y aislamiento de fallas

Las cámaras de seguridad de mi red requieren un ancho de banda de red significativo para cargar los datos de video a la nube. Reemplacé cuatro de las cámaras con un sistema diferente con una grabadora de video local que funciona en mi red local. El sistema carga datos a la nube para realizar copias de seguridad cada hora. En caso de una interrupción física de la red, la regla de calidad de servicio (QoS) detendría el tráfico de respaldo. Esto permitirá que otros servicios más críticos funcionen con la red celular de respaldo y también continúe el monitoreo de seguridad de mi hogar. En caso de una interrupción total de la red para los proveedores físicos y celulares, las cuatro cámaras de mi red local aún podrán obtener imágenes de seguridad. Este es un buen ejemplo de cómo funciona MEC para proporcionar aislamiento de fallas.

  1. Contenido localizado

Poner contenido de Netflix en mi red local es la base de un CDN. Una CDN, o red de distribución de contenido (content distribution network), es una red distribuida geográficamente de servidores proxy y sus centros de datos. El objetivo es proporcionar alta disponibilidad y alto rendimiento mediante la distribución espacial del servicio en relación con los usuarios finales.

Enterprise CDN es similar en diseño. El servidor original con contenido está conectado a servidores perimetrales MEC distribuidos geográficamente más cerca de los usuarios finales. El contenido es entregado por servidores perimetrales localmente a los usuarios finales. Al almacenar en caché y almacenar contenido más cerca del borde de la red, podemos reducir el tráfico de Internet y proporcionar una experiencia de usuario mucho mejor en términos de rendimiento y tiempo de respuesta. También hay un aspecto BC / DR en esto. Un servidor de contenido localizado puede proporcionar servicio incluso si el servidor de origen no está disponible.

Resumen

Con el crecimiento exponencial de IoT, utilizar MEC es una gran solución para resolver muchos de los desafíos específicos de IoT. El ISP basado en celulares puede complementar la red física existente para redundancia. La arquitectura MEC puede proporcionar capacidades adicionales de resistencia y aislamiento de fallas.

CDN basado en MEC puede mejorar la experiencia del usuario local y continuar brindando servicios en caso de un desastre. Finalmente, las implementaciones de MEC se basan en tecnología 3G y 4G. 5G elevará el caso de uso de MEC a un nuevo nivel, asegurando una solución preparada para el futuro.

James Zhang es un arquitecto de recuperación ante desastres con los servicios profesionales de Verizon. Es un profesional certificado en continuidad del negocio (CBCP) con una amplia experiencia en infraestructura y arquitectura de soluciones. Zhang se graduó de la Universidad de Illinois en Chicago con un título en ciencias de decisiones de información. También tiene un MBA de Lake Forest Graduate School of Management con enfoque en comportamiento organizacional y análisis de gestión.

COMPARTIR

ÚLTIMOS ARTÍCULOS

Lista de verificación para un Análisis de Impacto al Negocio (BIA)

Durante el punto álgido de la pandemia, la mayoría de las organizaciones dejaron de realizar viajes de negocios por completo. Otros elevaron la autorización para viajes relacionados con negocios a los niveles más altos de C-Suite, asegurando una visión de arriba hacia abajo de los costos y las posibles ramificaciones reputacionales de viajar cuando otros no lo hacían.

Leer Más >>

Herramientas de Ciberseguridad a aplicar para cada función de la nueva versión de NIST CSF 2 y recomendaciones para maximizar la inversión

Durante el punto álgido de la pandemia, la mayoría de las organizaciones dejaron de realizar viajes de negocios por completo. Otros elevaron la autorización para viajes relacionados con negocios a los niveles más altos de C-Suite, asegurando una visión de arriba hacia abajo de los costos y las posibles ramificaciones reputacionales de viajar cuando otros no lo hacían.

Leer Más >>

De reactivo a proactivo: Elaboración de una estrategia de recuperación ante desastres preparada para el futuro

Durante el punto álgido de la pandemia, la mayoría de las organizaciones dejaron de realizar viajes de negocios por completo. Otros elevaron la autorización para viajes relacionados con negocios a los niveles más altos de C-Suite, asegurando una visión de arriba hacia abajo de los costos y las posibles ramificaciones reputacionales de viajar cuando otros no lo hacían.

Leer Más >>

Terremotos: predecir lo impredecible

Durante el punto álgido de la pandemia, la mayoría de las organizaciones dejaron de realizar viajes de negocios por completo. Otros elevaron la autorización para viajes relacionados con negocios a los niveles más altos de C-Suite, asegurando una visión de arriba hacia abajo de los costos y las posibles ramificaciones reputacionales de viajar cuando otros no lo hacían.

Leer Más >>

Desinformación sobre desastres

Durante el punto álgido de la pandemia, la mayoría de las organizaciones dejaron de realizar viajes de negocios por completo. Otros elevaron la autorización para viajes relacionados con negocios a los niveles más altos de C-Suite, asegurando una visión de arriba hacia abajo de los costos y las posibles ramificaciones reputacionales de viajar cuando otros no lo hacían.

Leer Más >>