Карьера
Бизнес
Жизнь
Тренды
Ударим логарифмом по мошенникам!

Ударим логарифмом по мошенникам!

Наблюдательный математик Саймон Ньюкомб обратил внимание на закономерности износа страниц в справочниках логарифмов, а другой математик Фрэнк Бенфорд описал его формулой. Сегодня она помогает аудиторам и службам антифрода обнаружить незаконные транзакции и списания со счетов клиентов банков. А как именно — объясняет доцент факультета экономических наук и старший научный сотрудник Международного центра анализа и выбора решений НИУ ВШЭ Генрих Пеникас в девятнадцатом выпуске рубрики «Экономист на диване».



Генрих Пеникас,
доцент факультета экономических наук,
старший научный сотрудник
Международной научно-учебной лаборатории
анализа и выбора решений НИУ ВШЭ


Если вы учили высшую математику, то наверняка почувствуете всё отчаяние фразы: «Возьми меня море и стукни о рифы, как надоело решать логарифмы!». А ведь сегодня посчитать любой логарифм проще простого — на калькуляторе или на компьютере. Зато двести лет назад это действительно была м у ка! Приходилось брать справочники, таблицы логарифмов и искать в них нужные значения. Однако благодаря поту и крови поколений логарифмистов, материализовавшихся на страницах этих справочников, появился интересный способ выявления мошенников. Его идея изящна, проста, но не очевидна! Данным способом активно пользуются и сегодня, правда, как я понимаю, пока только за рубежом. 

В XIX веке американский математик Саймон Ньюкомб обратил внимание, что страницы справочников логарифмов истёрты неравномерно. Больше потрепаны первые страницы и гораздо меньше последние. Если вы когда-нибудь учили иностранный язык используя бумажные словари, то сразу поймёте почему так происходило. В словаре сначала ищут по первой букве, потом по второй. Даже в китайском. Там ищут по части иероглифа из левого верхнего угла, а затем по элементах в остальных частях. В итоге, страницы разделов, где начинаются новые буквы или иероглифы, всегда истёрты больше, чем в конце этих разделов.

Пятьдесят лет спустя после наблюдений Ньюкомба другой математик Фрэнк Бенфорд предложил формулу, описывающую это явление. Для её расчета нужно посмотреть на первые цифры в числах. Например, для чисел 5, 546, 58342 таковой будет пятёрка. Согласно формуле Бенфорда, единица на первом месте встречается в 30% случаев, двойка — в 18%, тройка — в 12%; четвёрка — в 10%; а остальные, упрощённо, — в 5%.

Впоследствии аудиторы научились применять эту закономерность для обнаружения мошенников в финансовой отчётности. Чтобы понять каким образом, давайте рассмотрим гипотетический пример. Представьте себе, что возможный мошенник хочет скрытно вывести через платёжную систему тысячу рублей. Он понимает, что круглые цифры вызовут подозрение, поэтому решает разделить эту сумму так, чтобы в конце переводов не было нуля или пятерки. Для этого 1000 делится на два транша в 942 и 58 рублей. Теперь, когда аудитор будет смотреть на реестр всех транзакций, такие неровные суммы меньше привлекут его внимание, чем перевод на круглую тысячу.

Ок, но что в таком случае нам даст «закон истёртых страниц» Ньюкомба-Бенфорда? Пусть для простоты нет больше никаких других переводов. Будь транзакция на тысячу рублей, то у нас была бы только одна единица. Значит, она встретилась в 100% случаев. Конечно, это больше, чем 30% по основному «закону истёртых страниц». Тем не менее, единицы встречаются первом месте чаще, чем иные цифры, а значит, хотя это и не идеальное совпадение, общая логика закона выполняется. Тогда как при двух переводах на 942 и 58 рублей, на первом месте встречаются уже две цифры: пятёрка и девятка. Доля случаев, когда встречается каждая из них, составляет 50%. Теперь логика закона нарушена. Ведь пятёрка и девятка встречаются много чаще, чем, скажем, единица или двойка.

Таким образом, пытаясь подобрать последние цифры и забыв о первых, наш потенциальный мошенник на самом деле себя ещё больше выдал. Прелесть этого «закону истёртых страниц» в том, что на самом деле сложно быстро поделить любую транзакцию на такие части, чтобы закон выполнялся. Не верите? Попробуйте сами поделить нашу тысячу на части, соответствующие закону, и напишите нам в комментариях к заметке в социальных сетях о том, сколько это у вас заняло времени.
IQ

Автор текста:Пеникас Генрих Иозович,21 июня, 2021 г.