Машинное обучение во фроде: где ИИ сохраняет деньги, а где только усложняет расследование
Разбор контура принятия решений и проблемы объяснимости в антифродовых системах на основе ML.
Антифродовые системы - одна из самых ранних и зрелых областей применения машинного обучения в бизнесе. Банки и платёжные системы используют статистические модели для выявления мошенничества уже много лет. Казалось бы, здесь всё решено.
На практике я вижу другую картину. Компании внедряют ML-модели и получают реальный эффект - количество пропущенных мошеннических операций снижается. Но вместе с этим появляются новые проблемы, которые не были видны до внедрения.
Где модель действительно помогает
Машинное обучение во фроде работает там, где человеческий аналитик физически не успевает. Потоки транзакций в реальном времени, тысячи операций в минуту, многомерные паттерны поведения - это задача для модели, не для человека.
Хорошо обученная модель замечает то, что человек пропустит: нетипичное время операции, нехарактерная геолокация, необычная последовательность действий перед транзакцией. Совокупность слабых сигналов, каждый из которых по отдельности не подозрителен, в сумме дают высокий скор риска.
Это реальная ценность. Скорость и охват, недоступные ручному анализу.
Где начинаются проблемы
Проблема возникает не в детектировании, а в следующем шаге: что делать с результатом.
Когда модель помечает транзакцию как подозрительную, кто-то должен принять решение - заблокировать, пропустить, запросить подтверждение. В автоматическом контуре это делает сама система. В ручном - аналитик. В гибридном - аналитик, опираясь на скор модели.
Здесь возникает первый вопрос: может ли аналитик понять, почему модель присвоила именно этот скор? Большинство современных ML-моделей - ансамбли деревьев решений или нейронные сети - это "чёрные ящики". Они дают ответ, но не объясняют рассуждение.
Проблема объяснимости в расследовании
Когда фрод-кейс доходит до расследования - внутреннего или с привлечением правоохранителей - объяснимость становится критической. "Модель присвоила скор 0.94" - это не доказательство и не объяснение. Это число.
Аналитик, который не может объяснить решение модели, оказывается в неудобной позиции. Он либо принимает решение на основе числа, которое не понимает, либо фактически игнорирует модель и делает вывод самостоятельно.
В обоих случаях ценность ML снижается - либо потому что решения принимаются некритично, либо потому что модель стала украшением, а не инструментом.
Контур принятия решений важнее точности модели
Я заметил, что компании часто оптимизируют метрики модели - precision, recall, AUC - и гораздо меньше думают о том, как эта модель встраивается в реальный процесс принятия решений.
Ключевые вопросы контура:
- Кто принимает финальное решение - автоматика или человек, и при каком скоре?
- Как аналитик может оспорить решение модели?
- Как фиксируются решения и их основания?
- Как оценивается качество решений - не метрики модели, а результаты по делам?
- Как модель дообучается на новых паттернах фрода?
Если на эти вопросы нет чётких ответов, качество самой модели вторично.
Практический тест
Возьмите последние десять кейсов, где система флагнула транзакцию, а человек принял решение. Попросите аналитика объяснить каждое решение. Если ответ сводится к "ну скор был высокий" - контур принятия решений нужно перестраивать, независимо от точности модели.
ML во фроде - зрелая технология. Но зрелость технологии не означает зрелости процесса вокруг платёжной инфраструктуры как мишени.