¿Qué es el análisis de árbol de fallos?
El análisis de árbol de fallos o un FTA (del inglés “fault-tree analysis”), es un análisis sistemático que permite identificar la causa raíz de un fallo a través de un diagrama. Un árbol de fallos permite el análisis de una sola ocurrencia indeseada, pero también puede utilizarse sistemáticamente para evaluar el funcionamiento de un conjunto de componentes, lo que hace que esta herramienta sea muy versátil.
Las herramientas de análisis de causa raíz más parecidas al árbol de fallos son el diagrama de dependencia, el diagrama de bloques funcionales y el análisis de Markov. El análisis del árbol de fallos y el FMEA también se comparan frecuentemente, pero hay diferencias sustanciales entre ambos.
¿Para qué sirve el análisis del árbol de fallos?
✓ diagnosticar la causa raíz de un fallo
✓ entender cómo el sistema puede fallar
✓ determinar los riesgos asociados con el sistema
✓ identificar medidas para reducir el riesgo
✓ estimar la frecuencia de los accidentes de seguridad
¿Cuáles son las ventajas de hacer un árbol de fallos?
✓ aumentar el cumplimiento de las normas de seguridad
✓ mapear la relación entre los fallos y los subsistemas
✓ establecer prioridades para el sistema en su conjunto
✓ implementar cambios en el proyecto aún en la fase conceptual para reducir el riesgo
✓ hacer una evaluación probabilística del riesgo
¿Cómo hacer un diagrama de árbol de fallos?
El punto de partida para el análisis del árbol de fallos es el fallo mismo. A partir de ahí, el diagrama se desarrolla con las posibles causas siguiendo una secuencia lógica.
Este tipo de diagrama aplica la lógica booleana, con símbolos que representan cada uno de los eventos que pueden haber desencadenado el fallo, incluyendo los eventos externos y los eventos condicionantes. Están unidos entre sí por puertas lógicas («y», «o») que establecen la relación entre ellos. Esta es la lista de símbolos utilizados en este tipo de análisis:
La secuencia de eventos también puede estructurarse en un software, en el que las puertas lógicas corresponden al valor 1 o 0. Además, el diagrama casi siempre se integra con conceptos de probabilidad y estadística, transformando el análisis del árbol de fallos en un método cuantitativo.
Teniendo en cuenta estas características, el análisis de árbol de fallos es uno de los métodos más comunes para llevar a cabo una evaluación probabilística del riesgo (también conocida como evaluación probabilística de seguridad). Esta evaluación es un enfoque sistemático que permite estimar los riesgos de un sistema, la probabilidad de que ocurran y la magnitud de las consecuencias.
¿Cuándo se debe utilizar un análisis de árbol de fallos en mantenimiento?
Dado que el FTA puede utilizarse para hacer una evaluación probabilística del riesgo, se aplica especialmente en industrias de alto riesgo como la aeroespacial, la nuclear, la química, la petroquímica y la farmacéutica. En los softwares, se utiliza como una técnica de eliminación de causas para corregir los bugs.
Como curiosidad, la NASA prefirió usar el análisis FMEA durante las misiones Apolo – que llevaron al hombre a la luna por primera vez – porque la probabilidad de regresar a la Tierra con seguridad era muy baja según el árbol de fallos. Después del accidente del transbordador Challenger en 1986, que colapsó 73 segundos después de despegar, la NASA comenzó a utilizar el FMEA en conjunto con el FTA.
Pero vamos ahora a lo que realmente nos importa: ¿cómo se puede utilizar el análisis de árbol de fallos en el mantenimiento?
Cuando se produce una parada inesperada, o un fallo que casi provoca una parada, es importante hacer un análisis del sistema y corregir la causa raíz. De lo contrario, el error persistirá. Por ejemplo, si el sistema de protección contra incendios falla, hay dos posibles modos de fallo: (hipótesis 1) hay un fallo en el sistema de detección de incendios, o (hipótesis 2) los medios de extinción de incendios fallan.
Si el sistema de detección de incendios no ha funcionado, significa que los detectores de humo han fallado y también los detectores de temperatura (ambos mecanismos tienen que fallar). Si ha sido la extinción del fuego lo que ha fallado, significa que no había agua en el sistema o que las boquillas de los rociadores estaban bloqueadas (cualquiera de los dos sería suficiente para que la extinción fallara).
Si llegamos a la conclusión de que el problema ha sido la falta de agua en los rociadores, entonces la causa raíz es la bomba de agua, que no tiene suficiente capacidad para todo el sistema. El árbol de la fallos puede parar por aquí, ya que el evento está marcado con un círculo («evento base», momento a partir del cual ya no es necesario investigar más).
Como responsable de mantenimiento, puedes seguir utilizando el árbol para analizar lo que ha fallado con la bomba (falta de mantenimiento, equipo al final de su vida útil, insuficiente para las necesidades del edificio, etc.) o hacer la transición a un método alternativo, como los 5 Porqués.
Investigar la causa raíz nos permite hacer los cambios apropiados en el plan de mantenimiento, aplicar nuevas normas de seguridad y calcular el riesgo asociado a un activo, como ya habíamos mencionado anteriormente. Como consecuencia, logramos aumentar la disponibilidad y la fiabilidad de los activos. Y esta es su gran ventaja para el mantenimiento de los edificios y equipos.
Aunque no se aplica sistemáticamente fuera de las industrias que hemos mencionado, el análisis de árbol de fallos es una herramienta muy útil para determinar la(s) causa(s) raíz y mejorar la estrategia de mantenimiento de cualquier empresa. Puede aplicarse en casi cualquier contexto, desde los fallos más simples hasta los más complejos. Muestra bien cómo no siempre hay un solo factor que contribuye a un cierto daño.
¿Cuáles son las limitaciones del árbol de fallos?
Ningún análisis de la causa raíz es infalible y el árbol de fallos también tiene algunas limitaciones. Estas son algunas de las desventajas del FTA:
- se trata de un modelo estático, que no tiene en cuenta el tiempo y la vida útil de los activos, lo que puede ser importante cuando estamos analizando el sistema en una fase de concepto o de proyecto;
- es un sistema binario – cada hipótesis se valida o se descarta, correspondiendo a 1 o 0 – lo que lo hace muy «rígido» cuando hay muchos condicionantes (el fallo sólo se produce en determinadas situaciones) o fallos parciales;
- no siempre es posible determinar la probabilidad de que se produzca un fallo, lo que hace imposible utilizar el FTA como método cuantitativo.
¿Quieres conocer otros métodos alternativos al FTA?
Lee nuestro artículo sobre herramientas de análisis de causa raíz.