El fracaso de Facebook muestra por qué no debemos confiar en él para todo

Tabla de contenido:

El fracaso de Facebook muestra por qué no debemos confiar en él para todo
El fracaso de Facebook muestra por qué no debemos confiar en él para todo
Anonim

Conclusiones clave

  • Los problemas técnicos de Facebook fueron desafortunados, pero es probable que el problema se hubiera resuelto mucho más rápido si no dependiera de tantos sistemas interconectados.
  • No hay forma de prevenir completamente las fallas del sistema, pero hay formas de hacerlas menos probables.
  • Tener planes de respaldo para cuándo (no si, cuándo) falla un sistema puede marcar la diferencia entre 'molesto' y 'catastrófico'.
Image
Image

La reciente debacle de Facebook demuestra cómo los sistemas interconectados están destinados a fallar y por qué no deberíamos usarlos para todo.

Perder Facebook, WhatsApp e Instagram durante varias horas el lunes fue inconveniente, perjudicial para las empresas y, en algunos casos, casi catastrófico. Según Facebook, todo se debió a cambios de configuración en sus enrutadores de coordinación de red.

Es una explicación razonable, pero el hecho de que un solo error como ese pueda detener no solo a Facebook, sino también a otros sistemas propiedad de Facebook, es un poco alarmante.

Un cambio incorrecto en la configuración del enrutador provocó que varios servicios, e incluso los auriculares VR, dejaran de funcionar por completo. Además de eso, según admitió Facebook, también tuvo un efecto en cascada en la forma en que se comunican los centros de datos de la empresa, lo que detuvo todos sus servicios.

"La dependencia de los sistemas interconectados conlleva un riesgo inherente de falla del sistema o incluso del servicio", dijo Francesco Altomare, ingeniero senior de ventas técnicas de GlobalDots, en una entrevista por correo electrónico con Lifewire, "Para contrarrestar este enorme riesgo, las empresas utilizan el principio de SRE (Ingeniería de confiabilidad del sistema), así como otras herramientas, que se ocupan de los distintos niveles de redundancia integrados en cada capa de la infraestructura de un sistema".

Image
Image

Qué puede salir mal

Vale la pena señalar que cuando un sistema como ese falla, por lo general requiere una tormenta perfecta de cosas que van mal. Es menos como un castillo de naipes esperando a caer y más como un puerto de escape térmico expuesto en una estación espacial del tamaño de una luna pequeña.

La mayoría de las empresas toman medidas para tratar de asegurarse de que lo único que podría convertir todo en un caos nunca suceda, pero a pesar de todo, puede suceder.

"Las fallas inesperadas son parte del negocio y pueden surgir como resultado de la negligencia de los trabajadores, fallas en la red del proveedor de servicios de Internet o incluso problemas en los servicios de almacenamiento en la nube", dijo Sally Stevens, cofundadora de FastPeopleSearch, en una entrevista por correo electrónico.

"…Mientras se implementen los pasos necesarios para proteger el sistema, como copias de seguridad, enrutador en el sitio y acceso por niveles, estas fallas son bastante improbables". Aunque incluso con un ejército de dispositivos de seguridad, es posible que el eje falle.

Si falla el sistema que controla cosas como las formas principales de contacto, electrodomésticos, puertas, etc., los resultados pueden ser significativos. Desde inconvenientes leves hasta catastróficos, dependiendo de cuánto confíen en ello las personas y las empresas.

Image
Image

"También existe el riesgo de que los piratas informáticos ingresen al sistema desde cualquiera de los dispositivos menos protegidos, como refrigeradores y hornos tostadores", agregó Stevens, "lo que podría provocar el robo de datos y el ransomware".

Cómo podemos prepararnos

No hay manera de garantizar que un sistema nunca fallará, pero hay pasos que se pueden tomar para hacer que la falla sea menos probable o para abordar la falla más fácilmente. Lo ideal sería una combinación de los dos enfoques que combine las medidas de seguridad y las contramedidas con planes de contingencia y sistemas de respaldo.

"Para eliminar estos peligros creados por productos y servicios de terceros que se manejan de manera efectiva, se deben describir estrictamente los roles y deberes con respecto a la gestión de riesgos de terceros", dijo Daniela Sawyer, fundadora y directora de tecnología de FindPeopleFast, en una entrevista por correo electrónico, "Para prosperar en este nuevo entorno, los administradores de riesgos deben comprender las partes esenciales de un ecosistema tan sofisticado".

Lo que sucedió con Facebook, WhatsApp e Instagram fue desafortunado, pero con suerte también revelador. Las personas que confían en los sistemas interconectados deben comprender que lo correcto que sale mal puede alterarlo todo. Y se deben implementar medidas (o analizar y refinar) para que tales interrupciones sean menos probables y menos impactantes.

En el caso de Facebook, su problema no eran los problemas del enrutador, sino tener casi todo su ecosistema conectado con todo lo demás. Por lo tanto, con Facebook (el servicio) inactivo, Facebook (la empresa) tuvo que gastar mucho más tiempo y energía simplemente organizando y abordando el problema. Si no utilizara un sistema interconectado tan arraigado o tuviera planes de respaldo para hacer frente a una interrupción como esa, probablemente habría tomado mucho menos tiempo arreglarlo.

Recomendado: