Как узнать вероятность наступления какого-либо события, если до этого оно никогда не происходило? И зачем такая информация банкам? Объясняет доцент факультета экономических наук и старший научный сотрудник Международного центра анализа и выбора решений НИУ ВШЭ Генрих Пеникас в четвёртом выпуске рубрики «Экономист на диване».
Генрих Пеникас,
доцент факультета экономических наук,
старший научный сотрудник
Международной научно-учебной лаборатории
анализа и выбора решений НИУ ВШЭ
Помните вопрос Чеширского Кота, который озадачил Алису в Стране чудес? Он тогда спросил её: «Что остаётся, если ничего не остаётся?». Здесь не только элегантная игра слов и остроумие писателя. Стоит вспомнить, что он был ещё и профессором математики в Оксфорде, а за каждой казалось бы выдуманной фразой есть конкретный смысл. Так, например, однажды в вагоне поезда Алисе встретился человек в газетах (a man in papers). Переводчики предполагают, что автор здесь имел в виду премьер-министра Великобритании Бенджамина Дизраэли. Ведь он очень много внимания уделял газетам (papers). Так что же мог значить вопрос Чеширского кота?
В математике, точнее в теории вероятностей, есть задача прогноза — наступит какое-то событие или нет. Самая простая — так называемая «наивная» — модель говорит, что вероятность наступления события равна доле таких событий в имеющихся данных. Это очень просто. Если из ста выданных кредитов не вернули десять, то для любого следующего кредита можно ожидать, что его не вернут в десяти случаях из ста, то есть вероятность невозврата составит 10%.
Здесь вроде бы всё понятно. Сложность возникает, когда в первичных данных нет нужных нам событий. Например, все выданные кредиты вернули. В чём здесь сложность? Казалось бы, если невозвратов не было, значит, вероятность невозврата ноль процентов, не так ли? Вроде бы так, но как-то не верится. Наверное, мы что-то не учли…
Математики подумали точно так же и предложили решения для задачи прогноза наступления события, когда нужных событий в прошлом не было. Общим среди данных решений является то, что исследователи, кажется, чувствуют, что раз событий не было, то вероятность должна быть близка к нулю. Вопрос только в том, будет это 0,01%, или 0,001%, или ещё меньше…
Описанные события в математике называют дискретными, потому что они как встреча с динозавром — либо произошла, либо нет, то есть вероятность равна или единице, или нулю. Так вот, дискретные события могут быть взаимосвязаны. До недавнего времени исследователи почему-то не учитывали эту их особенность при прогнозе вероятности наступления событий. В чём же особенность её учета и как она связана с Чеширским Котом?
Возьмем крайний случай. События полностью взаимосвязаны. Это значит, что если в одной ситуации интересующее нас событие наступило, то и во всех иных оно наступит. Например, если один кредит не возвращают, то и остальные девяносто девять не вернут. И, наоборот, если один вернули, то и все иные возвратят. Это значит, что для набора (портфеля) таких кредитов у нас только два возможных значения долей невозврата: или ноль процентов, или сто. При этом не важно, какова вероятность невозврата отдельно взятого кредита. При абсолютной взаимосвязанности событий у нас только два исхода: всё или ничего.
Таким образом, если попробовать ответить на вопрос Чеширского Кота, то вообще-то вариантов будет два: или ничего (как все и ожидают), или… всё (а вот этого не ожидает никто)! Надеюсь, вы оценили, насколько невероятным может быть осознание, что при отсутствии чего-то, вполне реальным может быть ожидание стопроцентной реализации события!
Если вам захочется подробнее познакомится с математической стороной данной задачи, то предлагаю прочитать статью «Низкодефолтные кредитные портфели в «Базель II» и «Базель III» как частный случай существенно несбалансированных классов в моделях бинарного выбора».
IQ
В подписке — дайджест статей и видеолекций, анонсы мероприятий, данные исследований. Обещаем, что будем бережно относиться к вашему времени и присылать материалы раз в месяц.
Спасибо за подписку!
Что-то пошло не так!