SPOF (Single Point Of Failure)

La regla básica para hacer un sistema HA es la replicación de elementos (Recordando la idea de RAID, Redundant Array of Independent Disks). Con SPOF se quiere hacer referencia a cualquier elemento no replicado y que puede estar sujeto a fallos; afectando con ello al servicio. Se debe evitar el SPOF en cualquier subsistema del sistema, ya que en caso de fallo puede peligrar el servicio de datos por culpa de un subsistema.

Por ejemplo, un adaptador de red que da acceso a un servidor a una red es un SPOF, una controladora SCSI tambien. Si en un entorno de servidores falla uno y no puede ser reemplazado fácilmente por otro, en los tiempos anteriormente mencinados, el servidor se considerará como SPOF.

En el caso de HA (Hardware y software adecuado) se puede reemplazar un adaptador de red o un servidor automáticamente. No solo los servidores han de ser redundantes si no los elementos que facilitan el servicio, como routers, puentes o la propia red local.

Es conveniente olvidar la redundancia a cierto nivel, pues habra un nivel en que la alta disponibilidad se hace extremandamente cara, consideremos que solo tenemos un solo edificio para nuestro sistema, perfectamente podemos considerarlo como SPOF (En caso de incendio en el edificio), pero replicar en otro edificio el sistema, se puede salir de presupuesto.