LOS PATRONES DE FALLO, LA EDAD Y LA FIABILIDAD ¿QUÉ HA PASADO CON EL LEGADO DE NOWLAN Y HEAP?

| 21 septiembre 2018 | Respuesta

Es conocido que uno de los resultados que trascendieron el report publicado en 1978 títulado“Reliability Centered Maintenance”, fue la evidencia de la existencia de seis patrones de fallos identificados con letras (desde A y hasta F), por los autores. Estos patrones estaban basados en curvas obtenidas en United Airlines para componentes de aviones.

Tal resultado, fue descrito por los firmantes F. Stanley Nowlan y Howard F. Heap. en un report de 495 páginas codificado A066-579 y desde hace tiempo desclasificado. El report, fue desarrollado institucionalmente por United Airlines y esponsorizado por la “Office of Assistant Secretary of Defense” de Estados Unidos.

¿Quién de los apasionados y profesionales del mantenimiento y la confiabilidad, no ha leído en libros, tanto en inglés como en español, o escuchado en disertaciones de expertos la mención a los seis patrones de fallos referidos originalmente en el trabajo de Nowlan y Heap?

Sin embargo, una serie de interpretaciones de múltiples autores fácilmente consultables llevó a una distorsión de lo planteado, dando lugar a teorías o meras afirmaciones carentes de sentido y distantes del resultado obtenido por Nowlan y Heap, pero repetidas con mucha frecuencia (provocando una especie de verificación de la teoría propagandística de Goebbels, donde la repetición genera creencias y la mente se va adaptando). Pero también es cierto que “no hay peor ciego que el que no quiere ver”. Invito al lector a leer detenidamente la literatura del RCM más común que se divulga y encontrar las afirmaciones sobre los patrones de fallo y el modo en que se argumentan.

A continuación, una muestra de cuatro de estas frecuentes y grandilocuentes afirmaciones derivadas de interpretaciones que usan términos impropios a lo planteado según los resultados de Nowlan y Heap:

1. “La mayoría de los fallos no son más probables cuando el equipo envejece”.
2. “la mayoría de los fallos no dependen de la edad”.
3. “La probabilidad de fallo se mantiene constante para la mayor parte de los fallos.
4. “Cuando se cumple el patrón E, no hay nada que un reemplazo pueda hacer para reducir la probabilidad de un fallo”.

LOS PATRONES DE FALLOS Y EL LÍMITE DE EDAD OPERATIVA

En la sección “2.8 Age Reliability Characteristics”, del report de Nowlan y Heap sobre RCM, es que encontramos la figura (ver figura 1) que ya por años ha sido referenciada repetidamente en artículos, libros, congresos, programas académicos en universidades, entrenamientos en empresas, tesis de maestría, sea por parte de algunos expertos, como por profesores, divulgadores y técnicos del tema de la confiabilidad y del Mantenimiento Centrado en la confiabilidad en particular.

A continuación, la síntesis de lo planteado en el propio report de Nowlan y Heap, con respecto a los patrones de fallos. En negrita o cursiva lo subrayado por el autor. El lector que prefiera puede leer directamente los comentarios originales en la figura 1:

1. Los patrones A y B presentan un “constante o gradual incremento de la probabilidad de fallo, seguido de una pronunciada región de desgaste” y por tanto “una edad límite puede ser deseable”. La curva B “es característica de aviones con motores reciprocantes”.

2. El patrón C viene descrito con un “gradual incremento de la probabilidad de fallo, pero no se identifica una zona de deterioro. Usualmente no sería deseable imponer una edad límite (esta curva es características de aviones con motores de turbina)”.

3. El patrón D se caracteriza por una “baja probabilidad de fallo cuando el componente es nuevo, seguido de un rápido incremento a un nivel constante”.

4. El patrón E presenta una probabilidad de fallo constante en todas las edades (función de supervivencia exponencial”).
5. El patrón F, presenta “mortalidad infantil, seguido por un constante o muy bajo incremento de la probabilidad de fallo (particularmente aplicable en equipos electrónicos”.

Lo primero que salta a la vista es la continua referencia en los comentarios explicativos de los seis patrones de fallo, al término ‘’probabilidad de fallo”, cuando, en realidad, las figuras están describiendo el comportamiento de la “tasa de fallo local, λ(t)=λ” o “probabilidad condicional de fallo”. El problema que parece banal, lo sería, sino fuera porque “probabilidad condicional de fallo”no significa ni expresa lo mismo que la “probabilidad de fallo” a secas. Se trata de dos conceptos diferentes con curvas también diferentes.

Figura 1. Representación original de los patrones de fallos. Extraído del report de Nowlan y Heap. Reliability Centered Maintenance. United Airlines, 1978.

La evidencia es reveladora ya que son los mismos autores del report de 1978, que referencian que elpatrón A se conoce en la literatura de confiabilidad como “curva de bañera”. Y en la curva de bañera como es conocido se hace referencia al comportamiento decreciente, constante y creciente ¿de quién? Pues, de la tasa de fallos local o probabilidad condicional de fallo (para los períodos respectivos de mortalidad infantil, vida útil y envejecimiento o deterioro acelerado).

Con mayor evidencia se nota la incongruencia entre figura y descripción de la figura en el patrón E. Donde se sigue llamando “probabilidad de fallo constante” a lo que es tasa de fallos local o probabilidad condicional de fallo constante. En este caso, se menciona incluso a la distribución exponencial de probabilidad para el cálculo.

Sin embargo, unos párrafos más adelante, en el report original, los autores hacen uso explícito del término probabilidad condicional de fallo y así llegan a las siguientes conclusiones:

· Alrededor del 89% de los componentes analizados no presentan una zona de deterioro acelerado (wearout zone); por lo que su desempeño no podría mejorarse imponiendo una edad límite (para proceder al tipo mantenimiento que corresponda).

· De hecho, después de cierta edad la probabilidad condicional de fallo continuó a un ritmo constante (curvas D, E y F).

· Un 5% no tenía una zona de deterioro bien definida, pero tenía cada vez más probabilidad de fallar a medida que aumentaba la edad (curva C). Para unos pocos de estos elementos, un límite de edad podría resultar útil, siempre que fuera favorable un análisis de costo-efectividad.

· Sólo un 6% de los componentes estudiados mostraron una pronunciada zona característica de deterioro creciente (curvas A y B).

Y más adelante, siempre en la misma sección 2.8 del report, se encuentra la siguiente afirmación:

· En muchos casos mantenimiento programado, realmente incrementa la tasa de fallo general debido a la introducción de una alta tasa de mortalidad infantil en un sistema que de otro modo sería estable (“in an otherwise stable system”).

En pocas páginas del report, se ha creado una convergencia de conceptos fiabilísticos ─tasa de fallo, probabilidad de fallo, probabilidad condicional de fallo─ que hasta los mismos autores, aún advirtiendo en la referencia de la figura de los seis patrones, que el eje vertical “Y” es “probabilidad condicional de fallo” y el eje horizontal “X” es “edad operacional”, caen en la fatal omisión de simplificar y referirse en las notas explicativas a “probabilidad de fallo” en cada uno de los patrones de fallo de la figura.

Serán justo estos comentarios imprecisos en la figura, que omiten la palabra “condicional” (pero correctamente referidos en el título de la misma y en el texto explicativo), los que darán la vuelta al mundo en interpretaciones superficiales y contrarias al significado expresado en las curvas originales de probabilidad condicional de fallo, en componentes de aviones, sintetizadas por Nowlan y Heap.

Y SIN EMBARGO CRECE…EJEMPLO DEMOSTRATIVO DE CURVAS DE UN PATRÓN E

Para demostrar (lo demostrado ya) que no es lo mismo probabilidad condicional de fallo y probabilidad de fallo, en el siguiente ejemplo, se ha generado una población de tiempos hasta el fallo de un equipo a través de una simulación de 100 muestras aleatorias, con una distribución exponencial y asignando una tasa de fallos igual a λ(t)=λ=0,01.

Asumamos, que se trata de un determinado motor eléctrico, por ser un equipo común en todas las industrias. Se observa en la figura 2 la curva obtenida de fiabilidad o sobrevivencia del equipo en función del tiempo de operación, acompañada de la función densidad de fallo. Esta última, será necesaria para obtener la probabilidad condicional de fallo en función del tiempo de operación.

Se ha utilizado para la simulación el software DataAnalysis Proyecto PlanetRAMS. Grupo de Investigación CEANI, Instituto de Sistemas Inteligentes y Aplicaciones en Ingeniería (SIANI), Universidad de Las Palmas de Gran Canaria (ULPGC).

Figura 2. Función Confiabilidad [R(t), supervivencia] y Función densidad de fallo, FD. Ambas funciones son necesarias para la determinación de la Probabilidad Condicional de Fallo (PCF), para cualquier valor de edad del equipo. Muestra de 100 datos con distribución exponencial de tiempos para fallar de un equipo. Demostración con el Software libre Data Analysis.

En la figura 3, se observa la curva de probabilidad de fallo, en función del tiempo de operación. Se evidencia que es siempre creciente y no constante). Cualquiera que analice sus datos de fallos y determine las probabilidades de no fallar, R(t) o de fallar, F(t), conoce de estos resultados de incremento de la probabilidad de fallo con la edad operacional.

Por fuerza, si se trata de una distribución exponencial, debe corresponder al patrón E de fallos aleatorios, pero ¿Y qué ha pasado con aquella historia que algunos autores nos han contado enfáticamente que la “probabilidad de fallo” debía ser constante en este patrón E, y que no crece cuando el equipo envejece? ¿qué ha pasado con las cuatro afirmaciones iniciales de ejemplo, que sostienen la idea que el incremento de la probabilidad de fallo y la edad operacional no se relacionan en la mayoría de los casos?

Figura 3. Función Probabilidad de Fallo creciente [F(t), infiabilidad]. Para datos con tasa de fallos constante y distribución exponencial. Muestra de 100 datos de tiempos para fallar de un equipo. Simulación con el Software libre Data Analysis.

La probabilidad condicional de fallo (o tasa de fallos local) esta relacionada con la probabilidad de sobrevivencia (función fiabilidad) y con la función densidad de probabilidad de fallo. Y es esa la razón por la cual determinados la curva de densidad de probabilidad de fallo en el ejemplo.

En el glosario del report, Nowlan y Heap definen (textualmente):

  • “Probabilidad condicional de fallo (también referida como “local failure rate”, section 2-7, p43): como la probabilidad que un componente pueda fallar durante un particular intervalo de tiempo, dado que sobrevive el entero intervalo (ver densidad de probabilidad de fallo).”
  • “Densidad de Probabilidad de Fallo: es la probabilidad que un componente pueda fallar en un intervalo definido, es la diferencia entre la probabilidad de supervivencia al inicio del intervalo y la probabilidad de sobrevivir al final del intervalo (ver probabilidad condicional de fallo).”
  • “Probabilidad de supervivencia: probabilidad que un componente sobreviva, sin fallar, a una determinada edad operacional, bajo específicas condiciones de operación (ver curva de supervivencia).” Sería la curva de fiabilidad, R(t). Recordando que probabilidad de fallo, F(t)=1-R(t). Nota del autor.

En la tabla 1, se presentan los resultados fiabilísticos resultantes del procesamiento de las muestras de tiempos hasta el fallo del motor, para seis (6) tiempos de operación. La probabilidad condicional de fallo, se obtiene del siguiente modo: si el motor comienza a trabajar de 0, tiene una fiabilidad o probabilidad de no fallar a las 200 horas igual a R(200)=10% y la densidad de fallos (FDF) para las próximas 50 horas (a las 250 h) es igual a 0,0007.

Si el motor sobrevive las 200 horas, tiene una probabilidad condicional de fallo (PCF) entre 200 y 250 horas, igual a 0,0007/0,10. Es decir su PCF=0,0065. Resultado que se mantiene constante para el período de vida útil analizado en intervalos idénticos como se aprecia en la tabla. Esto es lo que significa mostrar una tasa de fallos constante. El lector puede notar que estos valores de probabilidad condicional de fallo (PCF) se mantienen constantes para todos los intervalos analizados. Además, si los valores obtenidos de PCF los aproximamos a dos cifras decimales, coincidirían para todos los intervalos con la tasa de fallos 0,01 aplicada para simular la distribución exponencial de probabilidad (caracterizada de una tasa de fallos constante).

Tabla 1. Resultados del análisis fiabilísticos para 6 tiempos de operación diferentes del motor de ejemplo.

A continuación, en la figura 4, se demuestran gráficamente los resultados de comportamiento de cada función relacionada, a través de las curvas resultantes.

Figura 4. Comportamiento de las funciones fiabilísticas relacionadas con un patrón de fallos con probabilidad condicional o tasa de fallo constante.

La figura 5 muestra dos ejemplos extraídos del report de Nowlan y Heap, donde se evidencia la relación entre probabilidad condicional, densidad de probabilidad de fallo y probabilidad de supervivencia para la aplicación de una distribución exponencial y para una distribución de Weibull.

La probabilidad condicional de fallo se mantienen constante para la distribución exponencial (patrón E), mientras que la probabilidad condicional primero crece y luego se mantiene constante en el segundo caso (patrón D) e igualmente los datos se ajustaron a una distribución de Weibull (para que no se crea que es aplicable únicamente al patrón A). En ambos casos, la probabilidad de no fallar (de supervivencia) decrece con el tiempo de operación (o lo que es lo mismo crece la probabilidad de fallo con la edad operacional).

CONCLUSIONES

1. La interpretación de los patrones de fallos, resultados de las curvas de probabilidad condicional de fallo presentados en el report de Nowlan y Heap de 1978, se ha prestado a interpretaciones inadecuadas, al interpretarse impropiamente por algunos autores que el término probabilidad condicional de fallo significa lo mismo que probabilidad de fallo.

2. Algunos autores referencian correctamente el término probabilidad condicional de fallo cuando se refieren al eje Y de las curvas representadas en los seis patrones de fallo, pero al explicar los patrones se refieren a que, en “la mayoría de los casos, la probabilidad de fallo se mantiene constante” y por esa razón “no tiene sentido reemplazar componentes a una cierta edad, si la probabilidad de fallo es constante en el tiempo”. Sin embargo, la probabilidad de fallo no es constante en el tiempo de operación.

3. El anterior razonamiento tendría sustento si no fuera por el hecho que la probabilidad de fallo no es lo mismo que probabilidad condicional de fallo. Y justo para los patrones y zonas de los patrones donde la probabilidad condicional de fallo es constante [λ(t)=λ], su probabilidad de fallo con la edad operacional, dentro del intervalo de vida útil, es creciente (¡!).

4. La asimilación del hecho que cuando la probabilidad condicional de fallo (o tasa de fallo local) es constante, la probabilidad de fallo crece en función del tiempo de operación, puede significar sensibles modificaciones de corrección de frecuencias de mantenimiento para muchas empresas que han creído que sus sistemas mantenían una probabilidad constante para todas las edades dentro del intervalo de vida útil.

5. Como la probabilidad de fallo es creciente en el tiempo de operación, durante el análisis y elaboración de las curvas fiabilísticas se debería dar respuesta a preguntas como: ¿Cuál sería el valor de probabilidad de fallo aceptable para los sistemas críticos específicos en mi contexto? ¿Para qué valor de probabilidad de fallo consideraríamos inaceptable el riesgo de continuar operando sin realizar algún tipo de intervención? ¿Qué deberíamos hacer para reducir la probabilidad de fallo a valores aceptables para cierto tiempo de operación y en mis condiciones de contexto?

6. Lo planteado por Nowlan y Heap con respecto a la edad y la fiabilidad, es que si la probabilidad condicional de fallo (obsérvese el término probabilidad condicional) de un componente crece con la edad, mostrando una zona de incremento rápido del deterioro, entonces sería oportuno asociar una “edad límite” de uso y lograr ejecutar alguna acción antes que el componente entre en la zona de deterioro (wearout zone). Esto con “el objetivo de reducir la tasa de fallo general” (overall failure rate). En este contexto, el deterioro (wearout) que se refleja con el incremento de la probabilidad condicional de fallo ─y cito textual─, “describe el efecto adverso de la edad en la fiabilidad y no necesariamente implica cambios físicos”. Nowlan y Heap afirman en su report que solo un 6% de los componentes de aviones estudiados presentaban una pronunciada “wearout zone” (curvas A y B) y una “edad límite” debería ser aplicable a esos componentes.

7. De otra parte, del estudio de Nowlan y Heap, resultó que el 89% de los componentes de aviones estudiados estaban representados por curvas de probabilidad condicional de falloconstante(curvas de la C a la F) ─que no mostraban una zona con crecimiento de la probabilidad condicional de fallo asociada con una cierta edad y por ello no sería recomendable establecer una “edad límite” para realizar alguna acción de reemplazo. Sin embargo, si habría que determinar hasta qué edad la probabilidad de fallo del componente que se analiza sería aceptable para continuar operando sin intervenciones de mantenimiento. En este punto, el análisis fiabilístico y el mantenimiento preventivo predeterminado y según condición (donde pueda ser aplicable y valer la pena) tienen espacio para su aplicación con éxito. A este propósito, hay que decir que ya Nowlan y Heap le llamaban “on condition task” e incluían al “mantenimiento predictivo” como parte de las “on condition tasks”, exactamente como esta estándarizado hoy en la norma europea EN 13306 Terminología de mantenimiento.

8. Los patrones con probabilidad condicional de fallos constante se asocian a la probabilidad de ocurrencia aleatoria de los fallos. Es decir, que un fallo puede ocurrir en cualquier momento de la vida del equipo, pero la probabilidad de que ese fallo aleatorio ocurra es diferente de momento a momento.

9. El report Reliability Centered Maintenance, presentado por los autores Nowlan y Heap, fechado en 1978, constituye una fuente original y confiable para asimilar el RCM, y establece claramente los elementos esenciales de un proceso RCM, que luego otros autores han extraído prácticamente sin modificaciones y otros han interpretado con fuerte distorsión, como demuestra este caso de la interpretación de los patrones de fallos (donde las curvas de probabilidad condicional de fallo han sido asumidas e interpretadas erróneamente como curvas de probabilidad de fallo).

10. Si usted pertenece a una empresa que ha basado su plan de mantenimiento asumiendo que para sus sistemas más complejos la probabilidad de fallo se mantiene constante con la edad operativa, pues sería recomendable que con los datos de fallos acumulados, construya realmente sus curvas para los sistemas críticos y actué de consecuencia con los resultados de probabilidad de fallos que resultarán, y sean consideradas aceptables, en función de la edad operacional.

Referencias

  1. F. Stanley Nowlan y Howard F. Heap. “Reliability Centered Maintenance”. December 29, 1978, U.S. Department of Commerce, National Technical Information Service. Produced by Dolby Access Press.
  2. EN 13306: 2017 Maintenance – Maintenance terminology.
 
Para referenciar este artículo:
 
Electronic Document: Sexto, Luis Felipe. LOS PATRONES DE FALLO, LA EDAD Y LA FIABILIDAD ¿QUÉ HA PASADO CON EL LEGADO DE NOWLAN Y HEAP?  [en línea]. Septiembre de 2018. [fecha que se cita xx/xx/20xx]. Disponible en Internet: blog master Sostenibilidad, Mantenimiento & Gestión de Activos, <https://se-gestiona.radical-management.com> y Portal Radical Management <https://www.radical-management.com>

Etiquetas: , , , , , ,

Categoría: Artículo técnico, Noticias

Responder

You must be Iniciar sesión to post a comment.