Как прогнозируются увольнения?
Какие именно факторы сигнализируют о возможном увольнении?
Насколько точным получается прогноз вероятности увольнения сотрудника?
Что делать с результатами прогнозирования увольнений?
4
вопроса
Можно ли предсказать увольнение?
Как в Дивизионе HR-сервисов при помощи Big Data предсказывают увольнения сотрудников компаний-клиентов, рассказывает руководитель проектов Дивизиона Мария Прямкова.
Как прогнозируются увольнения?

В целом задача по прогнозированию увольнений схожа с другими задачами из области предиктивной аналитики, такими, например, как прогнозирование оттока клиентов или прогнозирование неисправностей в работе оборудования. Мы используем методологию и инструменты data science, но учитываем специфику HR.

При формировании признаков, «вводных» для модели мы исходим из нескольких предположений. Во-первых, мы считаем, что между моментом принятия человеком решения об увольнении и самим увольнением проходит какое-то время. В течение этого периода поведение тех, кто принял решение покинуть компанию в ближайшее время, будет отличаться от остальных – явно или неявно, но каким-то образом эти отличия можно проследить, анализируя его «цифровой след», например, часы присутствия на рабочем месте. Во-вторых, мы предполагаем, что анализируя характеристики сотрудника на момент принятия решения об увольнении, можно выделить общие черты или паттерны для тех, кто решает покинуть компанию.

Результатом модели является индивидуальный прогноз для каждого сотрудника – вероятность того, что он уволится по собственной инициативе на горизонте, например, 3 месяцев. На основе этой вероятности мы выделяем «группу высокого риска», с которой предлагаем работать клиенту.

Какие именно факторы сигнализируют о возможном увольнении?

Важно понимать, что для каждой компании и каждой группы персонала будут работать свои наборы факторов. Все примеры, которые мы приводим, скорее интересные иллюстрации, нежели рекомендации к действию.

В одном из кейсов, с которыми мы работали, сигналом того, что сотрудник принял решение уволиться был тот факт, что он/она прекращал/а проходить регулярные обязательные онлайн-тренинги по политикам и процедурам компании.

Что касается характеристик сотрудников на момент принятия решения об увольнении, как правило, здесь для одной и той же группы персонала возникает несколько сценариев, в каждом из которых – свой набор факторов. Могут оказаться значимыми уровень дохода в сравнении с другими сотрудниками его специальности и грейда, находящимися в том же городе, в сочетании с продолжительностью работы на том же проекте, опять же, в сравнении с коллегами, какие-то факторы, связанные с руководителем сотрудника, например, разница в стаже сотрудника и руководителя и т.д. 

Насколько точным получается прогноз вероятности увольнения сотрудника?

Площадь под ROC-кривой нашей текущей модели составляет около 80%. Чем выше этот показатель, тем качественнее модель. Площадь под ROC-кривой, равная 50%, означает, что модель насколько же хороша, как случайное гадание.

С точки зрения практического применения для клиента важны два параметра модели, примерно соответствующие статистическим метрикам «точность» и «полнота» модели – это то, с группой риска какого размера мы предлагаем работать, а во-вторых, какой процент действительно увольняющихся мы находим.

Что делать с результатами прогнозирования увольнений?

С одной стороны, можно попробовать индивидуально работать с теми, кто оказался в «группе риска». Чтобы правильно сфокусировать свои ресурсы, можно при этом опираться на результаты выполнения KPI или оценку потенциала (то есть удерживать только самых продуктивных или тех, кто, по мнению компании, обладает высоким потенциалом к дальнейшему росту). Еще более правильно опираться на экономику, то есть в первую очередь удерживать тех, кто еще не «вернул» вложенные компанией в него/нее «инвестиции» (расходы на найм, адаптацию, обучение).

Не менее важна (а, возможно, даже более эффективна) системная работа с факторами текучести. Я дам, наверное, неожиданную рекомендацию – не торопитесь приступать к анализу факторов текучести персонала.

Задумав провести такой анализ, вы скорее всего, начнете с исследования с того небольшого количества данных, которое в данный момент под рукой. Текучесть персонала – это сложный, многогранный процесс и не включив в анализ достаточно большой набор данных вы рискуете с самого начала пойти в ошибочном направлении.

Обязательно подключите к работе профессионала в области анализа данных – в частности, он поможет избежать таких часто встречающихся у HR-ов ошибок, как путаница между корреляцией (статистической взаимосвязью между двумя параметрами) и причинностью (одно является причиной другого), а также между индикативными факторами и влияющими факторами.