Ответ 1
По крайней мере, в значительной степени это моя дневная работа. Из вашего вопроса кажется, что вы думаете о дисциплине машинного обучения (а не в более широкой рубрике, AI). И я думаю, что ваши инстинкты верны - алгоритм ML идеально подходит для прогнозирования/обнаружения мошенничества, потому что он может обобщать на высоко нелинейный домен и он может адаптироваться (по мере поступления к нему новых данных). Поэтому из-за этих двух основных характеристик для мошенников гораздо сложнее выявлять "правила" алгоритмов для прогнозирования, поскольку эти правила на самом деле представляют собой сложный сетчатый набор мягких ограничений и которые со временем меняются по мере того, как алгоритм учится против новых данных. (Я мог бы предложить, хотя бы отбросив A *, если у вас нет особых причин полагать, что поиск путей является полезной эвристикой для вашей проблемы - я не хочу сказать, что нет никакой связи, но если есть, это, безусловно, неортодоксальный никогда не видели пути, связанные с этой проблемой).
Единственный факт, о котором вы говорили о типе онлайн-мошенничества, которого вы интересуете, - это несколько учетных записей одним пользователем. Несомненно, здесь могут быть применены различные методы, но я упомянул об одном аналитическом методе, в частности потому, что: (i) я действительно использовал его в упомянутом вами сценарии; и (ii) до сих пор выходит за рамки других ответов.
Метод основан на теории графов.
Предпосылка: учетные записи, принадлежащие одному и тому же пользователю, часто лучше всего идентифицируются не по их индивидуальному поведению (clickstream), а по их отношению друг к другу - другими словами, по их сетевому поведению.
Пример: chip-dumping в онлайн-покере. Здесь человек открывает несколько новых учетных записей на сайте покера (используя фиктивную информацию), а затем заявляет рекламируемый бонус для каждой учетной записи (e..g, депозит в размере 100 долларов соответствует бонусу в размере 100 долларов США). Конечно, бонус имеет очень ограничительные правила выплат, как правило, пороговое количество рук, которые были сыграны до того, как бонус станет как наличные деньги и может быть снят с игровых счетов в виде наличных денег.
Таким образом, цель демпинга чипов - превратить эти бонусные доллары в реальные деньги. Один человек открывает пять отдельных учетных записей (как пять разных людей), затем открывает еще одну "законную" учетную запись (используя свою подлинную личность). Эти шесть игроков - на самом деле просто один игрок - будут играть за один стол друг против друга, а пять фиктивных аккаунтов быстро потеряют свои стеки на законную учетную запись, которая быстро выкупает свои выигрыши, потому что, конечно, ограничения на выбытие бонусы применяются только к учетной записи, на которую они были первоначально предоставлены; следовательно, ограничения на вывод средств полностью обойдены.
Что сложнее в этом типе схемы, так это то, что незаконное поведение практически невозможно обнаружить на отдельной учетной записи - * плохое поведение, сговор, возникает из взаимодействия группы обычно - другими словами, поведение интереса необходимо изучать на сетевом уровне.
И поэтому теория графов является естественной основой для анализа.
Метод, который я применил, основывался на академической работе Чау и др. в Carnegie Mellon, под названием Обнаружение мошеннических личностей в сетях онлайн-аукционистов (PDF).
Сценарий мошенничества, лежащий в основе этой статьи, таков: продавец на eBay хочет продать очень дорогой товар (который они, вероятно, даже не принадлежат, но в любом случае не намерены когда-либо отправлять покупателю ) желающему покупателю. Чтобы побудить невинного покупателя к добровольному участию в сделке, мошеннический продавец сначала приобретает очень высокую (искусственно высокую) репутацию, участвуя в ряде "успешных" продаж предметов группе покупателей; эти покупатели часто обманывают счета, контролируемые покупателем.
Более конкретно, авторы этой статьи объединяют данные на двух уровнях (уровень учетной записи и уровень сети) с использованием алгоритма распространения вероучения в Марковском случайном поле.
Структура графического подписи, кстати, известна как двухпартийное ядро , возникающее из группы учетных записей, которые имеют очень большое количество транзакций среди членов этой группы, но очень мало вне этой группы (т.е. с остальной частью сообщества eBay).