ТОиР 4.0

RCA. ПОИСК И АНАЛИЗ КОРЕННЫХ ПРИЧИН ОТКАЗОВ ОБОРУДОВАНИЯ

В медицине легко понять разницу между устранением симптомов и лечением самого заболевания. Например, сломанное запястье — это очень больно! Но обезболивающие препараты только снимут боль на время; вашим костям для того, чтобы срастись правильно, требуется другое лечение. 

Но что вы делаете, когда у вас проблемы на работе? Вы старательно устраняете внешние проявления проблемы или останавливаетесь, чтобы подумать, есть ли на самом деле более глубокая причина возникшей проблемы, требующая вашего внимания? Если вы исправите только симптомы — то есть то, что вы видите на поверхности — проблема почти наверняка вернется, и ее нужно будет исправить снова и снова.

Однако, если вы посмотрите глубже, чтобы выяснить причину возникновения проблемы, вы можете исправить базовые системы и процессы, чтобы она навсегда исчезла.

Анализ первопричин (RCA, Root Cause Analysis) — это популярный и часто используемый метод в сервисе, который, в первую очередь, помогает ответить на вопрос, почему возник отказ оборудования. Этот метод пытается определить причину отказа, используя определенный набор шагов со связанными инструментами, чтобы найти основную причину отказа, для того, чтобы:

  1. Определить, что конкретно произошло.
  2. Определить, почему это произошло.
  3. Понять, что нужно сделать, чтобы уменьшить вероятность того, что это произойдет снова.

RCA предполагает, что системы и события взаимосвязаны. Действие в одной области вызывает действие в другой, другой и так далее. Прослеживая эти события, вы можете обнаружить, где возникла проблема и как она переросла в симптом, с которым вы сейчас столкнулись.

Анализ первопричин (RCA) — это структурированный процесс, который выявляет физические, человеческие и скрытые причины любого нежелательного события на рабочем месте

Традиционный анализ RCA предполагает поиск четырёх основных типов причин отказов оборудования: 

  1. Человеческий фактор — люди сделали что-то не так или делали не то, что было нужно. Ошибки сервисного персонала приводят к физическим дефектам оборудования (например, никто не заливал тормозную жидкость, что привело к отказу тормозов).
  2. Организационные причины — некорректно выстроенные процессы, регламенты или политика обслуживания, которые люди используют для принятия решений или выполнения своей работы (например, по регламенту никто не отвечал за техническое обслуживание тормозной системы, и все предполагали, что кто-то другой залил тормозную жидкость).
  3. Операционные причины — фактически не сделанные или сделанные  вне допусков операционные процедуры; превышение нагрузки или произведение ошибочных расчётов; решения, принятые на основании недостоверных данных.
  4. Физические причины (материальные) — дефекты оборудования или его узлов, ведущие к нарушению выполнения функций оборудования (например, отказ автомобиля может быть связан с дефектом его тормозной системы).

RCA рассматривает все типы причин. Он включает в себя изучение моделей возникновения и развития негативных эффектов, поиск скрытых недостатков в системе обслуживания и выявление конкретных действий, которые способствовали появлению проблемы. Это часто означает, что RCA выявляет более одной основной причины возникновения отказа оборудования.

Вы можете применить RCA практически к любой ситуации. Определение того, как далеко зайти в вашем расследовании, требует здравого смысла с точки зрения оправданности ваших действий. Теоретически, вы могли бы продолжить прослеживать коренные причины еще до каменного века, но эти усилия не принесут никакой пользы. Будьте внимательны, чтобы понять, когда вы нашли существенную причину, которую можно изменить. Для определения того что ваш анализ завершен установите до его начала критерии решения вашего анализа.


*****

ПРОЦЕСС АНАЛИЗА ПЕРВОПРИЧИН

RCA имеет шесть основных шагов:

  1. Определение проблемы
  2. Сбор данных
  3. Выявление всех возможных причин (изучение)
  4. Определение возможных коренных причин (анализ)
  5. Рекомендация и разработка решения по устранению коренных причин отказа (корректирующие действие)
  6. Реализация и проверка достижения целей анализа (отчёт и мониторинг)


Шаг первый: определите проблему и создайте команду по проведению анализа

  • Опишите проблему. Что произошло?

(Остановка производственной линии, разлив нефти в море, падение космической станции...)

(Конвейерная лента на производственной линии не перемещается и горит красный индикатор; стало тише в цехе; нефть на поверхности воды, следы нефти на берегу и на животных...)


Шаг второй: сбор данных

  • Где это произошло? Какие у вас есть документальные доказательства того, что проблема существует?
  • Когда это произошло? Как долго существует проблема?
  • Какие последствия отказа?

Необходимо собрать как можно больше достоверных фактов по случившемуся отказу. Время на сбор данных, как правило, очень ограничено, поэтому на этом этапе помогут заготовленные шаблоны и регламенты по сбору данных. Проведите интервью с очевидцами события, сделайте подробные фотографии, соберите данные из журналов, отметьте документы, которые могут иметь отношение к отказу, соберите показания датчиков и систем, отслеживающих тренды. Включите в отчет все аспекты, связанные с отказом, такие как время простоя, стоимость ремонта, вовлеченные люди, используемые инструменты, эксплуатационное состояние, погодные условия и т. д.

Вам необходимо полностью проанализировать ситуацию, прежде чем вы сможете перейти к рассмотрению факторов, которые способствовали возникновению проблемы. Чтобы обеспечить максимальную эффективность процесса поиска коренных причин отказа, соберите всех — экспертов и сотрудников, которые понимают ситуацию. Люди, которые наиболее знакомы с этой проблемой, могут помочь вам лучше понять корневые причины ее возникновения.

Полезным инструментом на этом этапе является методика CATWOE — заполнение чек-листа, позволяющего создать четкую структуру для нахождения верного решения анализируемой задачи. Эта методика позволит вам посмотреть на эту ситуацию с разных точек зрения. Это будут: 

  • клиенты; 
  • действующие лица, которые внедряют решения по устранению отказов;
  • затронутые процессы производства;
  • общий взгляд на цели и задачи компании, которые не могут быть достигнуты по причине произошедшего отказа; 
  • владелец процесса;
  • ограничения внешней среды.

Определите, насколько значимы последствия разбираемого отказа, а также последствия возможных событий, которые удастся выявить на следующем шаге. Это необходимо для установления приоритета по разбору причин отказа, а также для установки границ целесообразности предлагаемых в ходе анализа решений.

Если в компании используется риск-ориентированный подход, то укажите уровень значимости последствий в матрице рисков.

CATWOE

Рисунок 1. Методика CATWOE


Шаг третий: выявить все возможные причины отказа

  • Какая последовательность событий приводит к отказу?
  • Какие условия приводят к возникновению проблемы?
  • Какие еще проблемы окружают возникновение центральной проблемы?

На этом этапе определите как можно больше потенциальных причин отказов.

Причинами являются обстоятельства, непосредственно предшествовавшие отказу, которые обычно можно увидеть или почувствовать. Например, если отказ является разливом нефти, непосредственной причиной может быть нарушение герметизации. Непосредственные причины часто совпадают с кодами сбоев, зарегистрированными в CMMS.

Слишком часто люди определяют один или два фактора и затем останавливаются, но этого недостаточно. Проводя RCA, вы не должны просто рассматривать самые очевидные причины — вы должны копать глубже. Мы должны рассмотреть все рационально возможные связи между функциональным отказом и видом отказа (поломкой).

Для поиска коренных причин отказов мы рекомендуем использовать инструменты менеджмента рисков (см. ГОСТ Р ИСО/МЭК 31010-2011. Менеджмент риска. Методы оценки риска), такие как ситуационный анализ, пошаговый метод, метод "5 почему", метод "галстук-бабочка". 

Соберите подтвержденные факты и определите все возможные последствия отказа.


Пошаговый метод анализа

Пошагово пройдите все возможные пути развития отказа.

Пошаговый метод анализа

Пошаговый метод анализа причин отказов

Рисунок 2. Пошаговый метод анализа



Метод "Галстук-бабочка"

Опишите события с помощью дерева неисправностей и анализ последствий с помощью дерева событий. Особое внимание сфокусируйте на барьерах между причинами и отказами, отказами и последствиями.

Метод "Галстук-бабочка"

Рисунок 3. Метод "Галстук-бабочка"



Ситуационный анализ

Оцените текущую ситуацию, основываясь на анализе собранных данных и возможных последствиях тех факторов, которые привели к сложившейся ситуации.

Ситуационный анализ

Рисунок 4. Ситуационный анализ



Метод "5 почему"

Спрашивайте: "Почему?", пока вы не доберетесь до корня проблемы.

5 почему

Рисунок 5. Метод "5 почему"


Метод "Drill Down"

Разбейте проблему на мелкие детали, чтобы лучше понять общую картину.

RCA анализ

Рисунок 6. Метод Drill Down


Диаграмма причинно-следственных связей

Создайте диаграмму всех возможных причинных факторов, чтобы увидеть, где проблема могла начаться.

Диаграмма Исикавы

Рисунок 7. Диаграмма Исикавы (Диаграмма причинно-следственных связей



Шаг четвертый: Определите коренную причину(ы) отказа


  • Какова реальная причина возникновения проблемы?

Тут хорошо использовать мозговой штурм с привлечением профильных специалистов. Составьте дерево отказов FTA, используя логические операторы. Найдя возможные коренные причины, подтвердите их фактами, собранными на этапе сбора данных. Часто собранных данных может не хватить, в таком случае запросите новые данные, составьте шаблон для будущих аналогичных случаев, в котором укажите полный объём необходимых данных, которые нужно собирать. Если на этом этапе уже невозможно получить данные, дерево отказов вы сможете использовать для расчёта вероятности отказа, задаваясь вероятностями первопричин.   

Анализ дерева событий подробно осписан в ГОСТ Р МЭК 62502-2014 Менеджмент риска. Анализ дерева событий.


FTA

Рисунок 8. Логические операторы FTA


Дерево отказов FTA

Рисунок 9. Дерево отказов FTA


Конечно, можно и нужно использовать так же и инструменты, которые вы использовали для определения всех возможных причин отказа (на третьем этапе), чтобы посмотреть на корни каждого из найденных факторов. Эти инструменты разработаны, чтобы побудить вас копать глубже на каждом уровне анализа причин и следствий отказов.

Идентифицированные причины отказов позволяют осуществлять значимый управленческий контроль. В случае разлива нефти, вызванного сломанным уплотнением, основными причинами могут быть неправильный тип используемого уплотнения, неисправность конструкции или неправильная его установка.

Отсутствие контроля означает недостаточный надзор за деятельностью от проектирования до планирования и эксплуатации. Контроль осуществляется с помощью стандартов и процедур эксплуатации, технического обслуживания и закупки, а также контроля за их соблюдением. Если разлив нефти произошел из-за неправильной установки уплотнения, отсутствие контроля может быть связано с нерегламентированными процедурами проверки после или во время технического обслуживания.

Используйте специализированное программное обеспечение для создания дерева отказов. Например,  Free Fault Tree Analysis Software — https://www.fault-tree-analysis.com/


Шаг пятый: рекомендовать и внедрять решения по устранению коренных причин отказа (корректирующих действий)


  • Что вы можете сделать, чтобы предотвратить повторение отказа?

  • Как будет реализовано решение?
  • Кто за это будет отвечать за реализацию корректирующих действий?
  • Каковы риски внедрения решения?

Проанализируйте ваш причинно-следственный процесс и определите эффективные решения по устранению отказов. Следуйте принципу «не навреди», помните, что проблема, КОТОРАЯ НЕ МОЖЕТ БЫТЬ ВОСПРОИЗВЕДЕНА, — это проблема, КОТОРАЯ ЕЩЕ НЕ БЫЛА РЕШЕНА. Поэтому обязательно оцените не только эффективность решения, но и заранее оцените последствия вашего решения. Таким образом, вы можете обнаружить потенциальные сбои, прежде чем они произойдут. Внедрите лучшее решение с учетом возможных последствий.

Один из способов сделать это — использовать методику FMEA

FMEA (Failure Mode and Effects Analysis) — анализ видов и последствий отказов) является методом идентификации видов и процесса развития отказа, а также последствий. Этот инструмент основан на идее анализа рисков для определения точек, где решение может потерпеть неудачу. 

Рекомендации по проведению FMEA вы можете найти в ГОСТ 27.310-95. "Надежность в технике. Анализ видов, последствий и критичности отказов".

Чем больше систем и процессов, будут анализироваться по методике FMEA в начале, тем меньше вероятность того, что в будущем у вас возникнут проблемы с RCA.

При выработке решения обязательно проверьте их на соответствие критериям решений:

  • Предотвращает повторение
  • В пределах вашего контроля (вы — это лицо или лица, ответственные за успех решения, предотвращающего повторение)
  • Отвечает вашим целям и задачам
  • Не вызывает других проблем (FMEA)

Для взвешенной оценки принимаемых решений на одну чашу весов положите возможные последствия отказа, выраженные в денежном эквиваленте, умноженные на вероятность их возникновения, а на другую чашу — стоимость предлагаемых мероприятий по предотвращению отказа.

Более подробно о методике FMEA мы поговорим на в другом уроке нашего курса Школы ТОиР 4.0.


Шаг шестой: реализация и проверка достижения целей анализа (Отслеживание выполнения корректирующих мероприятий)


  • Разработайте показатели эффективности принятых корректирующих мероприятий. Определите способ и периодичность сбора данных и условия повторного проведения анализа.

  • Для внедрение решений по предотвращению отказов разработайте мероприятия, направленные на устранение нарушений (физические, производственные, основанные на человеческом факторе и т.д.). 

  • Создайте отчёт о проведённом анализе и распространите его для общего пользования в целях исключения подобных отказов на аналогичных процессах и передачи опыта по поиску коренных причин.


*****

Ключевые моменты


Анализ первопричин — это полезный процесс для понимания и решения проблемы.

Выясните, какие негативные события происходят. Затем посмотрите на сложные системы вокруг этих проблем и определите ключевые точки отказа. Наконец, определите решения для устранения этих ключевых моментов или основных причин.

Вы можете использовать множество инструментов для поддержки процесса RCA. Диаграммы причин и следствий и «5 почему» являются неотъемлемой частью самого процесса, а FMEA поможет свести к минимуму потребность в RCA в будущем.

В качестве аналитического инструмента RCA является важным способом проведения всестороннего общесистемного обзора значительных проблем, а также событий и факторов, ведущих к ним.

Нажмите на ссылку ниже, чтобы загрузить шаблон документа, который поможет вам регистрировать отказы, вероятные причины и возможные решения.

Скачать шаблон "Поиск и анализ коренных причин отказов оборудования (RCA)" >>

 Шаблон анализа отказов оборудования