ИИ 6 декабря 2013 3 мин чтения

Машинное обучение во фроде: где ИИ сохраняет деньги, а где только усложняет расследование

Разбор контура принятия решений и проблемы объяснимости в антифродовых системах на основе ML.

Антифродовые системы - одна из самых ранних и зрелых областей применения машинного обучения в бизнесе. Банки и платёжные системы используют статистические модели для выявления мошенничества уже много лет. Казалось бы, здесь всё решено.

На практике я вижу другую картину. Компании внедряют ML-модели и получают реальный эффект - количество пропущенных мошеннических операций снижается. Но вместе с этим появляются новые проблемы, которые не были видны до внедрения.

Где модель действительно помогает

Машинное обучение во фроде работает там, где человеческий аналитик физически не успевает. Потоки транзакций в реальном времени, тысячи операций в минуту, многомерные паттерны поведения - это задача для модели, не для человека.

Хорошо обученная модель замечает то, что человек пропустит: нетипичное время операции, нехарактерная геолокация, необычная последовательность действий перед транзакцией. Совокупность слабых сигналов, каждый из которых по отдельности не подозрителен, в сумме дают высокий скор риска.

Это реальная ценность. Скорость и охват, недоступные ручному анализу.

Где начинаются проблемы

Проблема возникает не в детектировании, а в следующем шаге: что делать с результатом.

Когда модель помечает транзакцию как подозрительную, кто-то должен принять решение - заблокировать, пропустить, запросить подтверждение. В автоматическом контуре это делает сама система. В ручном - аналитик. В гибридном - аналитик, опираясь на скор модели.

Здесь возникает первый вопрос: может ли аналитик понять, почему модель присвоила именно этот скор? Большинство современных ML-моделей - ансамбли деревьев решений или нейронные сети - это "чёрные ящики". Они дают ответ, но не объясняют рассуждение.

Проблема объяснимости в расследовании

Когда фрод-кейс доходит до расследования - внутреннего или с привлечением правоохранителей - объяснимость становится критической. "Модель присвоила скор 0.94" - это не доказательство и не объяснение. Это число.

Аналитик, который не может объяснить решение модели, оказывается в неудобной позиции. Он либо принимает решение на основе числа, которое не понимает, либо фактически игнорирует модель и делает вывод самостоятельно.

В обоих случаях ценность ML снижается - либо потому что решения принимаются некритично, либо потому что модель стала украшением, а не инструментом.

Контур принятия решений важнее точности модели

Я заметил, что компании часто оптимизируют метрики модели - precision, recall, AUC - и гораздо меньше думают о том, как эта модель встраивается в реальный процесс принятия решений.

Ключевые вопросы контура:

Кто принимает финальное решение - автоматика или человек, и при каком скоре?
Как аналитик может оспорить решение модели?
Как фиксируются решения и их основания?
Как оценивается качество решений - не метрики модели, а результаты по делам?
Как модель дообучается на новых паттернах фрода?

Если на эти вопросы нет чётких ответов, качество самой модели вторично.

Практический тест

Возьмите последние десять кейсов, где система флагнула транзакцию, а человек принял решение. Попросите аналитика объяснить каждое решение. Если ответ сводится к "ну скор был высокий" - контур принятия решений нужно перестраивать, независимо от точности модели.

ML во фроде - зрелая технология. Но зрелость технологии не означает зрелости процесса вокруг платёжной инфраструктуры как мишени.

К списку статей

Контакт

Если эта статья отозвалась - напишите. Я отвечаю лично.

Telegram TenChat MAX