Скоринг: выехать на кредитной машине.

При обращении за кредитом потенциальные заемщики часто слышат от сотрудников банка такие понятия как: скоринг, скоринговая система, кредитный рейтинг, кредитная история. Но при этом не все достаточно хорошо понимают, что означают эти термины. Попробуем разобраться, что это такое, зачем нужно и как это работает. А главное — как скоринг влияет на получение кредита и вообще на жизнь заемщика. В том числе, даже спустя несколько лет после обращения в кредитную организацию.

Что такое скоринговая система?

Скоринг или скоринговая система — это система оперативной оценки клиента (потенциального заемщика), которой преимущественно пользуются розничные банки и микрофинансовые компании. Название происходит от английского слова “score”- что означает зарабатывание/ подсчет очков, например, в игре.

Так за возраст менее 28 и более 35 лет клиент скорее всего будет получать снижающие баллы, аналогично — за проживание в более криминальных районах города и за работу, где не требуется высокой квалификации (например, официант). Как ни странно, съемная квартира и дети – могут оказаться фактором, прибавляющим баллы (клиент умеет планировать финансы, уверен в будущем).

Компании, которые продают скоринговые системы по всему миру имеют возможность глобально отслеживать взаимосвязь тех или иных факторов и поведения заемщика. Оказалось, что в независимости от страны — женщины аккуратнее гасят кредиты, аналогично поступают и более старшие по-возрасту клиенты, аналогично – семейные пары с детьми (у них у всех выше ответственность). А вот за уровень образования- баллов в российском банке скорее всего почти не добавят, скорее — за опыт работы более 3-5 лет.

Кроме того, в ряде случаев, когда сотрудник банка имел возможность лично пообщаться с клиентом, он дополняет его профиль своими субъективными впечатлениями – о его адекватном поведении, внешнем виде, одежде, классе мобильного телефона, часов, наличии дорогостоящей электроники при себе, грамотной речи, явных признаках, что клиент говорит неправду и т.п. В результате система каждому пункту анкеты присваивает оценку, и выдает в конце оценки – итоговый балл. Отдельно проверяется достоверность данных клиента — легальность паспорта, существование адреса и т.п.

Как cкоринг работает, откуда берет данные?

Есть несколько видов скоринга. Один из них был описан выше – то есть кредитоспособность клиента оценивается в момент его обращения. По тем данным, которые он сам и предоставляет (application scoring – заявочный скоринг). Сам, как правило, заполняет и анкету. В случае с микрофинансовыми компаниями – это происходит зачастую прямо онлайн в интернете.
Еще один вид скоринга – поведенческий (behavioral scoring). В зависимости о того, как клиент ведет себя с течением времени (за определенный период) банк выставляет ему более высокий кредитный рейтинг или более низкий. И в зависимости от этого уменьшает/увеличивает ему лимиты по кредитам, предлагает какие-то дополнительные услуги.
Также существует оценка потенциального мошенничества (fraud scoring).

Одно дело, когда человек получил кредит, но не рассчитал свои финансовые возможности, или внезапно заболел, потерял в доходе и т.п. И другое дело –когда имеет место заранее планируемый невозврат кредита –то есть мошенничество. Эксперты говорят, что таких случаев — порядка 10% всех невозвратов. Любой кредитор (особенно хорошо процесс отлажен в МФО) пытается еще до выдачи кредита оценить риск мошенничества со стороны заемщика.

Следует отметить, что современные системы скоринга зачастую являются самообучающимися, т.е. учитывают модели поведения клиентов, которые ранее были приняты на обслуживание. Система пытается вычислить какие-то общие черты у тех, кто впоследствии оказался мошенником, стал допускать просрочки (ретро-скоринг).
Очевидно, что скоринговые системы имеют и недостатки – большую часть данных для оценки предоставляет клиент. Перепроверка этих данных вручную при мелких суммах кредита – слишком дорогое занятие. Кроме того, даже обучающиеся системы не могут быстро перестроиться при резком изменении экономической ситуации в рамках страны. Поэтому их приходится все время дорабатывать и поддерживать.

Пользуются ли скорингом банки и МФО?

В кредитовании, пожалуй, самая дорогостоящая часть – это время на первоначальную оценку заемщика. Это и скоринг, и служба безопасности, и запрос кредитной истории в Бюро (что не бесплатно для банка), ее изучение, оценка и принятие решение на кредитном комитете банка. Для выдачи каждого кредита задействуется несколько сотрудников, как правило, с высокой оплатой труда.

Хотя у каждого банка своя кредитная политика и свои схемы одобрения кредитных заявок (более или менее бюрократические), но общий подход – минимизировать затраты времени и издержки на обслуживание каждого клиента. Кроме того, банки с более консервативной политикой оказались в более выигрышном положении во время кризиса 2008 года, чем те, кто выдавал кредиты всем подряд.

Поэтому МФО – это сейчас основные пользователи и разработчики скоринговых систем, где они пытаются оптимальным образом соединить все виды скоринга – и заявочный, и поведенческий, и оценку мошенничества. Кроме того, скоринг позволяет уменьшить и время принятия решения о выдачи кредита. В современных условиях – это значит быть более конкурентоспособным.

Поскольку обороты МФО по кредитованию населения в последний год значительно увеличились, в декабре 2013 года были также приняты поправки в закон 218-ФЗ, которые обязали МФО также подавать данные о своих заемщиках в Бюро кредитных историй.
Следует также отметить, что сегодня более, чем 30 млн. человек в России имеют кредиты. Новых, хороших, высоко-рейтинговых, клиентов – осталось немного. Это вынуждает банки предоставлять кредиты клиентам с более низкими рейтингами. Это влечет за собой удорожание их проверки и банки ищут пути снижения таких издержек. Появляются новые комбинированные системы, где большую роль начинают играть кредитные истории.

Скоринг и кредитная история

С учетом того, что треть граждан уже имела опыт по получению займов хотя бы 1 раз — на первый план выходит изучение того, насколько заемщик фактически закредитован, и насколько добросовестно он погашал кредиты в прошлом. Так по-данным банка “Связной” доля заемщиков, у которых обнаружилось 5 и более кредитов – выросла за последний год в три раза.

В связи с тем, что в Бюро кредитных историй (БКИ) теперь добавились заемщики микрофинансовых организаций и кредитных кооперативов, многие Бюро стали предлагать банкам и МФО скоринговые модели, дополненные данными, которые содержаться в БКИ. Эти скоринговые модели ранжируют заемщиков по вероятности дефолта (невозврата) займа, вероятности просрочек и т.п. Системы обрабатывают сведения о клиенте в Бюро и выставляют ему рейтинг. Добросовестные — получают наивысший балл, недобросовестные – низший. При этом результат (балл) указывается вместе с несколькими основными причинами, которые оказали наибольшее влияние на его снижение (4-5 факторов, а всего их может быть более 100).

В частности модель скоринга по кредитным историям, которую разработало НБКИ – это семь скор-карт, которые обновляются ежеквартально, чтобы учитывать изменения условий на рынке. Таким образом, Банки постепенно переходят от заявительного скоринга — на матричный (состоящий из нескольких моделей и источников). Это в 1,5 раза повышает эффективность оценки, улучшает выставление лимитов по каждому клиенту, помогает собирать просроченную задолженность.

Кроме того, кредитные бюро стали предлагать услугу – автоматически информирующую банк (без специального запроса от банка, ежедневно):

  • об открытии его клиентом новых счетов в других банках
  • о новых кредитах клиента
  • о новых просрочках этого клиента
  • об изменениях его лимитов по кредитам, овердрафтам,
  • о его новых паспортных данных и т.п.

Пока эта услуга работает с оплатой по-клиентно и в рамках конкретного БКИ, что снижает возможности банка масштабно отслеживать жизнедеятельность всех клиентов. Однако вероятнее всего, в какой-то перспективе, БКИ начнут объединяться, обмениваться информацией между собой.

Повышение доходности кредитного портфеля банка напрямую зависит от грамотного управления кредитными рисками. И именно скоринговые системы позволяют снизить риски без потери доходности, предложив ответ на ключевые вопросы: насколько проблематичной будет работа банка с конкретным заемщиком, какое значение кредитного лимита установить, и вернет клиент кредит или нет.

В 1941 г. Дэвид Дюран впервые применил методику классификации кредитов на «хорошие» и «плохие». Он определил не только группы факторов, позволяющие максимально определить степень кредитного риска, но и коэффициенты, характеризующие кредитоспособность частного клиента. Таким образом, заемщик, который преодолел пороговое значение, набрав достаточное количество баллов, потенциально мог получить запрашиваемую сумму. Идея Дюрана получила продолжение - вскоре в Сан-Франциско образовалась первая консалтинговая фирма в области скоринга Fair Issac, а несколько позже, с появлением новых массовых кредитных продуктов (кредитных карт), к идее скоринга обратились все финансовые учреждения США.
По сути, скоринг является методом классификации совокупности заемщиков на различные группы, когда необходимая характеристика не известна, однако, известны другие характеристики, которые каким-либо образом коррелируют с интересующей. На практике, в зависимости от задач анализа заемщика, кредитный скоринг включает application-скоринг - оценку кредитоспособности претендентов на получение кредита (скоринг по анкетным данным используется в первую очередь), behavioral-скоринг - оценка вероятности возврата выданных кредитов (поведенческий анализ), а также collection-ско-ринг - оценка возможности полного либо частичного возврата кредита при нарушении сроков погашения задолженности (расчет рисков по портфелю).
Известные сегодня разработки SAS, KXEN, Experian, SPSS, EGAR - это не специализированные программные средства для скоринга, а универсальные аналитические инструменты (Data Mining), так называемое «интеллектуальное ядро», которое можно в том числе использовать и для построения собственных скоринговых моделей. Поэтому, в более полном понимании, скоринговая система изнутри представляет собой сложную систему автоматизации выдачи потребительских кредитов в банковских отделениях, торговых точках, через интернет, которая в качестве аналитического ядра использует решение одной из известных компаний-разработчиков.
Сам по себе скоринг - это не только работа с определенными скоринго-выми моделями, но и построение скоринговой инфраструктуры. Так, во многих Data mining продуктах результат анализа статистических данных (матмо-дель) можно сохранить в виде программного кода, а его вставить в банковское программное обеспечение. То есть, под скоринговой системой подразумевают специальное программное обеспечение, с помощью которого можно рассчитать необходимый показатель на основе исходных данных (рисунок). Скоринговая карта - это набор утвержденных банком определенных характеристик и соответствующих весовых коэффициентов (в баллах).
Скоринговых карт в банках обычно несколько, поскольку они сильно зависят от кредитных продуктов. К примеру, под недвижимость необходима одна карта, а на покупку автомобиля уже совершенно другая. По мнению экспертов, можно использовать и одну общую карту, однако это неудобно для пользователей. Моделей также почти всегда несколько. Обычно заявка на кредит проходит через большое количество моделей, причем для разных категорий лиц могут применяться различные модели даже на одной скоринговой карте.
В процессе эксплуатации скоринговой системы важен мониторинг качества и эффективности работы скоринговой модели. Обычно именно здесь специалисты видят одну из основных проблем кредитного скоринга

Упрощенная модель работы скоринговой системы

ОГРАНИЧЕНИЯ СКОРИНГА И ДЕРЕВО РЕШЕНИЙ

Одной из основных трудностей известных скоринговых систем, как и всех технологических решений в сфере core banking, является плохая адаптируемость. Дело в том, что с течением времени могут меняться условия, в которых функционирует заемщик. А значит, скоринговые модели необходимо актуализировать на наиболее «свежих» клиентах, периодически перепроверяя и, при необходимости, разрабатывая новую модель, как для различных периодов времени, так и для различных регионов. В Западной Европе новая модель разрабатывается в среднем раз в полтора года. В условиях Украины максимальным периодом будет полгода-год. Период между заменой модели может изменяться в зависимости от конъюнктуры рынков и стабильности экономики в это время.
Для адаптации скоринговой модели специалисту финансового учреждения необходимо определить коэффициенты для различных факторов, характеризующих кредитоспособность частного клиента. А значит, аналитик должен быть в состоянии оценить текущую ситуацию на рынке. Результатом работы будет набор факторов с весовыми коэффициентами и пороговое значение (балл отсечения), которые являются весьма субъективным мнением и зачастую являются статистически необоснованными.
Преодоление таких ограничений скоринга решается с помощью инструментов Data minig. Наиболее распространенным методом автоматического анализа данных является построение дерева решений. Поставщики решений уверены: для того чтобы получить обоснованные выводы, не обязательно быть статистиком. К примеру, AnswerTree (продукт SPSS) автоматически строит дерево, позволяя на базе диалоговых окон даже неподготовленному пользователю начать работу с программой. Сам AnswerTree автоматически просеивает данные и находит статистически значимые группы.
С помощью интуитивно понятных древовидных диаграмм, графиков и таблиц программа самостоятельно сегментирует данные, при этом аналитику необходимо лишь указать целевую переменную, переменные-предикаторы и выбрать алгоритм построения дерева решений. Удобно, что древовидная диаграмма, которая похожа на блок-схему, позволяет визуализировать выделенные сегменты и закономерности в данных.
Для получения максимально достоверных результатов обычно рекомендуется обучить модель на подвыборке, а затем протестировать надежность на оставшихся данных. Насколько хорошо модель описывает данные, можно увидеть, переключаясь с обучающей модели на контрольную. Представить результаты анализа можно в любом формате, к примеру, вывести информацию по каждому узлу в виде таблицы или графика.
Правильно построенное на данных прошлых периодов дерево решения обладает еще одной очень важной особенностью, а именно, «способностью к обобщению». Это означает, что если возникает новая ситуация, можно с достаточно большой долей уверенности сказать, что вновь обратившийся заемщик поведет себя так же, как и те заемщики, характеристики которых схожи с характеристиками новых клиентов.

КРИТЕРИИ ВЫБОРА

Критерии выбора скоринговой системы напрямую зависят от задач. Большинство украинских банков воспринимают скоринг довольно узко, как процесс математического расчета скорингового балла на основе введенных данных. При этом часто роль скорин-говых систем нивелируется до уровня «скорингового калькулятора». А ведь скоринговый комплекс можно использовать не только для полной автоматизации работы инспекторов, но и для решения других важных задач - работы с «плохими кредитами», оптимизации маркетинговых кампаний и сегментации клиентской базы, борьбы с мошенничеством, анализа технических сбоев и управления ликвидностью.
Помимо определенности в том, нужен ли кредитной организации просто «скоринговый калькулятор» или автоматизация всего бизнес-процесса скоринга, важную роль играют также:

  • известность бренда (для банков, делающих ставку на рост капитализации);
  • гибкость системы (возможность сохранения формата карты при корректировке методики расчета балла, и в более широком смысле слова «гибкость» - при интеграции в информационную среду банка, учета украинской специфики и другое);
  • способность системы работать на малом объеме кредитных историй с возможностью получения удовлетворительного результата;
  • применяемые статистические/математические методы;
  • скорость внедрения системы;
  • наличие поддержки.

Главным препятствием на пути внедрения каких-либо скоринговых систем, по мнению Яны Нидельской, начальника управления кредитных операций «Агрокомбанка», все-таки остается отсутствие накопленной информации. Лишь при этом условии можно говорить о высокой степени достоверности получаемых в результате данных. Использование же комплексных скоринговых систем на банковском рынке Украины целесообразно лишь для крупных системных банков, которые делают основной упор на розничное кредитование - когда оно поставлено на поток (в особенности ипотека и автокредитование).

ТИПЫ СКОРИНГОВЫХ СИСТЕМ

Скоринговая система традиционно состоит из модуля подготовки исходных данных, аналитического модуля и модуля отчетности.
Данные системы скоринга, могут быть трех типов. Первый тип - знания персонала кредитных отделов банков о конкретных типах кредитных продуктов (потребительских, авто и ипотечного кредитования) и своих клиентах. Второй тип данных - статистика по уже выданным кредитам, учитывающая «хороших» и «плохих» заемщиков. И, если банк не обладает ни одним из типов указанных данных - ни экспертными знаниями, ни статистикой выданных кредитов, модель, лежащая в основе системы скоринга, преимущественно строится на основе региональных и отраслевых данных.
Все фронт-офисные решения для автоматизации процесса потребительского кредитования в большинстве случаев представляют собой Web-приложения, что обеспечивает хорошую масштабируемость системы и простоту подключения к процессу выдачи кредитов новых отделений банка и представительств в торговых точках.
Есть предложения разработчиков скоринга для Украины, которые обеспечивают автоматизацию всего процесса (одновременно создание скоринговой карты и автоматизацию подачи заявки и процесса принятия решения). На рынке есть предложения западных поставщиков (часто дорогие брендовые решения, ориентированные на крупные банки) и украинских компаний-представителей (простые и дешевые расчетные системы-«калькуляторы», где учтена специфика отечественного рынка).
Наиболее известными западными скоринговыми системами сегодня являются SAS Credit Scoring, EGAR Scoring, Transact SM (Experian-Scorex), K4Loans (KXEN), Clementine (SPSS). Среди разработчиков из СНГ - BNS, Basegroup Labs. Наиболее серъезными и дорогими являются решения SAS (около 200 тыс. дол.), достойными также считаются разработки KXEN (около 30 тыс. дол.).
Практически посередине ценового диапазона стоит предложение по скорингу компании EGAR Technology, которая, с одной стороны, является западным вендором, предлагающим скоринговую систему, использующую классические западные модели, с другой стороны,- это решение (EGAR Scoring) максимально адаптировано к украинским условиям и дополнено специальными подходами - например, макроэкономическим подходом к оценке кредитоспособности заемщика, учетом особенностей самих кредитных продуктов и другими возможностями.
Рассматривая различные скоринговые решения, корректно говорить о системах для западного рынка и о системах для украинского (российского) рынка, так как есть и западные поставщики, например, EGAR, которые предлагают версию скоринга, полноценно учитывающую украинскую (российскую) специфику.
Безусловно, системы для западного рынка значительно более функциональны, чем разработки для Украины или СНГ, но заставить их работать в отечественных условиях трудно: необходимо пройти сложный процесс внедрения, интеграции и адаптации.
Сравнивая западные и отечественные системы, необходимо заметить следующее:

1. Западные системы появились намного раньше, у них большой срок эксплуатации, соответственно большой объем кредитных историй, но эти истории не подходят для украинского рынка;
2. В западных системах нет инструментов (возможностей) для работы с малыми объемами кредитных историй (что необходимо для украинского рынка). Разработки в области классического скоринга позволяют работать с ограниченными объемами кредитных историй.

Еще одна особенность - большая разница между скоринговыми картами в зависимости от локальных рынков и для разных банковских продуктов. Соответственно, западные системы недостаточно гибки для отечественного рынка.

ИНТУИТИВНЫЙ СКОРИНГ

При реализации системы скоринга в Украине традиционно работает два подхода. Первый - классический (ретроспективный) скоринг на основе анализа исторических данных с применением современных математических методов, когда такой анализ позволяет выбрать самые значимые поля для анкеты заемщика и другие показатели.
Второй - это скоринг «по правилам», когда просто, например, экспертом, задаются правила оценки кредитоспособности, и программа автоматизирует этот алгоритм без применения каких-либо статистических методов анализа исторических данных.
Сегодня именно второй вариант чаще всего работает не только в средних и малых банках, но и во многих крупных. За последний год, однако, заметно активизировался спрос и на первый вариант, так как появились небольшие, но все-таки значимые объемы кредитных историй по некоторым рынкам.
К примеру, в «Агрокомбанке», как и в большинстве малых и средних банков, используется скоринговая система собственной разработки (с учетом опыта других банков). Это своего рода комплексная оценка, включающая ряд объективных и субъективных показателей. К объективным показателям относятся финансовые показатели деятельности предприятия, а основные направления в оценке по объективным показателям традиционно регламентируются 279 Постановлением Национального банка («…о порядке формирования и использования резерва для возмещения возможных потерь по кредитным операциями банков»). Что касается субъективных показателей - здесь гораздо больше свободы выбора, и банки обычно используют такие факторы, как кредитная история, репутация, территориальное размещение, объем и качество обеспечения.
В крупном банке «Надра» также используют скоринг «по правилам». По словам Андрея Шутова, и. о. директора департамента риск-менеджмента банка «Надра», скоринго-вая система, используемая «Надра»,- это авторская разработка собственных специалистов, которая была создана при участии финансовых консультантов из других стран. Система проста: клиент предоставляет банку минимальный пакет документов - информация заносится в систему - система суммирует данные и дает ответ, указывая степень банковского риска в каждом конкретном случае.
В качестве фактора, который обозначает доминирование скоринга «по правилам», в Украине можно отметить и малое распространение в банковской среде статистических пакетов типа SPSS и SAS. Ведь, не так уж много требуется, чтобы начать анализировать своих клиентов,- ретроспектива прошлых клиентов и статистический пакет.
Ожидается, что в ближайшие несколько лет именно на системы статистического скоринга («скоринг по правилам», «макроэкономический скоринг») будет расти спрос по мере накопления достаточного количества кредитных историй («скоринг по правилам», скорее всего, будет применяться для ипотеки).
В «Дельта-банке», по информации Андрея Ладановского, начальника управления рисками, используются скоринговые карты, разработанные экспертами банка. Работа происходит следующим образом: берутся существующие кредиты с негативной и позитивной кредитной историей, статистическими методами выделяются показатели, которые влияют на кредитную историю, каждому показателю присваивается определенный вес в общей оценке. Соответственно, анкета клиента проходит через систему автоматических проверок на целостность заявки. В результате заемщику автоматически присваивается определенный внутренний рейтинг, что определяет условия кредитного договора.
На текущий момент наиболее эффективным является сочетание нескольких методов скоринга статистического и скоринга «по правилам». Тот факт, что в системе реализованы инструменты, которые позволяют совместить статистический подход и «скоринг по правилам», а также учесть региональную специфику рынка и кредитных продуктов, позволяет говорить о том, что ее можно эффективно использовать в странах с развивающейся экономикой - в России, Украине и Казахстане.
По данным экспертов, у «Райффайзенбанк Украина» (теперь ОТР) также была система, разработанная внутренними ресурсами. Банк «Ренессанс» использует разработку на базе Fair Isaak. Среди отечественных банков, занятых в рознице, уже намечается тенденция к переходу на именитых поставщиков.

УПРАВЛЕНИЕ ПРОБЛЕМНЫМИ АКТИВАМИ

Одна из интересных возможностей, которая открывается перед кредитной организацией с внедрением эффективной системы кредитного скоринга - это участие в торговле портфелями проблемных активов. 2004 год в Европе ознаменовался бумом продаж сомнительных кредитов иностранным инвесторам. Так, Morgan Stanley приобрел портфель сомнительных кредитов итальянского Banca Nazionale del Lavoro на сумму 430 миллионов евро. Чуть позже Dresdner и Hypo Real Estate также провели реструктуризацию портфелей и реализовали их иностранным покупателям.
В качестве причин активности на рынке NPL (проблемных кредитов) аналитики сходны рассматривать высокую конкуренцию и насыщение кредитных рынков Европы, более жесткие требования рейтинговых агентств и новых нормативов Базель 2, а также давление со стороны собственников. Во многом из-за этого продажа части, а то и всего портфеля NPL считается рациональным выходом для банковских учреждений, так как позволяет улучшить способность к возврату средств без ухудшения возможностей генерирования будущих денежных потоков.
Иными словами, когда показатель проблемных кредитов превышает некий допустимый уровень, их уже весьма невыгодно держать на балансе банка, даже если они гипотетически способны возвращать позитивный результат.
Управление проблемными активами потенциально может рассматриваться как выгодный бизнес также и на уровне украинских кредитных организаций. Средний показатель сомнительной задолженности по потребительским кредитам сегодня находится на уровне 7-12% от кредитного портфеля украинских банков. Однако, по мнению экспертов, это далеко не «мертвые» кредиты, ведь некоторые заемщики просто забывают или не успевают вовремя сделать погашение. По словам Андрея Ладановского, «плохой кредит» не всегда однозначно отрицательное явление, так как теоретически самым выгодным клиентом является тот, который платит весь долг с просрочкой, погашая еще и штрафные начисления. Кроме того, важно учитывать диверсификацию по типам кредитования - задолженность по потребительским кредитам и по ипотеке отличается в разы, впрочем, как и средняя доходность по данным видам продуктов.
Единственная проблема, которая сегодня является весомой преградой в деле секью-ритизации и торговле банковскими активами - это отсутствие в украинских банках опыта реструктуризации кредитной задолженности. Согласно доступной статистике, профессиональных мошенников в общей структуре задолженности отечественных банков пока около 1,5-2%, но реального положения дел не знает никто. Таким образом, создание фондов, которые могли бы управлять сомнительной и безнадежной задолженностью украинских заемщиков, может оказаться бизнесом с большой долей риска.
В этих условиях наиболее вероятными покупателями «плохих кредитов» могут выступить скорее коллекторские компании, чем специальные фонды. Так, недавно на рынке появилась киевская «Credit Collection Group» (ССG), которая основывает свою деятельность на работе с просроченной задолженностью.

ПЕРСПЕКТИВЫ И РАЗВИТИЕ СКОРИНГА

Сейчас, за некоторыми исключениями, ни у одного украинского банка нет действующей классической системы скоринга, а кредитоспособность заемщиков обеспечивается преимущественно собственными программными продуктами.
Такая ситуация объективна - намерение внедрить достойное скоринговое решение зачастую наталкивается на отсутствие необходимых исторических данных и возможности применить какой-либо статпакет. Поскольку вся доступная статистика содержится на бумаге и в кредитных делах экспертов, то для создания необходимого «кредитного кладбища» из 10-20 тысяч заемщиков может понадобиться мобилизация значительных ресурсов, на что сегодня готово далеко не каждое финансовое учреждение.
В ближайшее время развитие рынка кредитных продуктов для частных лиц в Украине по прогнозам будет определяться такими тенденциями:

  • рост интереса к «классическому» скорингу будет происходить по мере накопления кредитных историй;
  • крайне актуальной будет становиться задача улучшения качества кредитного портфеля;
  • все более важным станет вопрос управления бизнес-процессом скоринга, а не просто «калькулятор»;
  • в столице некоторые сегменты рынка прогнозируемо исчерпают себя (потребительское кредитование будет постепенно вытесняться кредитными картами);
  • стоимость входа на рынок розничного кредитования резко увеличится, а значит, выйти на рынок новым игрокам станет сложнее.

Технологии скоринга – автоматической оценке кредитоспособности физического лица – в банковской среде традиционно уделяется повышенное внимание. Сегодня можно сказать, что экспертные методы уходят в прошлое, и все чаще при разработке скоринговых моделей обращаются к алгоритмам Data Mining. Классическую скоринговую карту можно построить при помощи логистической регрессии на основе накопленной кредитной истории, применив к ней ROC-анализ для управления рисками.

Постановка задачи. В коммерческом банке имеется продукт «Нецелевой потребительский кредит»: займы предоставляются на любые цели с принятием решения за один день. В настоящее время решение о выдаче кредита принимается на основе скоринговой карты, построенной экспертным способом, с процентом отказа, равным 55%, при этом объем просроченной задолженности велик. Накоплена статистическая информация о заемщиках и качестве обслуживания ими долга за несколько месяцев. Руководство банка, понимая, что высокий уровень отказов препятствует расширению розничного бизнеса в области потребительского кредитования, поставило перед отделом розничных рисков задачу разработать новую скоринговую карту, которая позволила бы значительно сократить число отказов в выдаче и снизить сумму просроченной задолженности.

Исходные данные. Вообще говоря, информация о заемщиках – физических лицах и кредитных договорах хранится в банковской информационной системе. Там же содержатся графики и даты погашений кредита, сведения о просрочках, об их суммах, о процентах и т.д. Получить для построения скоринговой модели таблицу с параметрами заемщиков и информацию о наличии просрочек – отдельная задача. Будем считать, что она уже выполнена и результат представлен в виде текстового файла.

Важным также является вопрос о том, что понимать под параметрами заемщика. Здесь уместно обратиться к методическим аспектам подготовки и сбора данных для анализа, и вспомнить, что на этом этапе требуется активное взаимодействие с экспертами: они с высоты своего опыта ограничат круг входных переменных, которые потенциально могут влиять на кредитоспособность будущего заемщика. Кроме того, следует учитывать аспекты бизнеса и технические вопросы (например, сложно проверить в короткий срок достоверность признака «Сфера деятельности компании», а потому полагаться на него не стоит).

Скоринговые карты часто строятся на категориальных переменных, и для этого непрерывные признаки квантуются при помощи ручного выбора точек разрыва (или полуручного, см., например, «Тест Чоу»). Скажем, переменная Стаж работы разбивается на три категории: «до 1 года», «от 1 до 3 лет», «свыше 3 лет». Такую модель легче интерпретировать, но она менее гибкая при моделировании связей: горизонтальные «ступени» дают плохую аппроксимацию при наличии частых крутых «склонов».

В банковской практике перед скорингом заемщик, как правило, проходит процедуру андеррайтинга – проверку на удовлетворение жестким требованиям: соответствие возрасту, отсутствие криминального прошлого и, конечно, наличие определенного дохода. При этом выдвигаются требования к минимальному уровню дохода, и рассчитывается возможный лимит кредита. При его расчете участвует один из двух коэффициентов – П/Д либо О/Д.

Коэффициент «Платеж/Доход» (П/Д) – отношение ежемесячных платежей по кредиту заемщика к его доходу за тот же период. Считается, что значительная величина этого коэффициента (свыше 40%) свидетельствует о повышенном риске как для кредитора, так и для заемщика.

Коэффициент «Обязательства/Доход» (О/Д) – отношение ежемесячных обязательств заемщика к его доходу за тот же период с учетом удержаний налогов. В обязательства включаются расходы, связанные с выплатой планируемого кредита, а также имеющиеся другие долгосрочные обязательства (выплаты по иным кредитам, на содержание иждивенцев, семьи, алиментов, обязательные налоговые платежи и пр.). Считается, что размер ежемесячных обязательств заемщика не должен превышать 50-60% его совокупного чистого дохода.

Заявки клиентов, не прошедшие андеррайтинг, получат отказ и даже не попадут на скоринг. Поэтому на вход скоринговой процедуры выгоднее подавать не доход клиента, а отношение О/Д или П/Д.

В нашей задаче представлено 2709 кредитов (файл loans.txt) с известными исходами платежей на протяжении нескольких месяцев после выдачи кредита.

В табл. 5.1 отображены структура и описание полей текстового файла с кредитными историями.

Таблица 5.1. Данные по заемщикам и качеству обслуживания ими долга

Поле

Описание

Служебный код заявки

Дата выдачи кредита

Дата/время

Коэффициент О/Д («Обязательства/До­ход») в %

Вещественный

Возраст заемщика (полных лет) на момент принятия решения о выдаче кредита

Проживание

Основание для проживания: собственник; муниципальное жилье; аренда

Строковый

Срок проживания в регионе

Менее 1 года; от 1 года до 5 лет; свыше 5 лет

Строковый

Семейное положение

Холост/не замужем; женат/замужем; разве­дена/вдовство; другое

Строковый

Образование

Среднее; среднее специальное; высшее

Строковый

Стаж работы на последнем месте

Менее 1 года; от 1 года до 3 лет; свыше 3 лет

Строковый

Уровень должности

Сотрудник; руководитель среднего звена; руководитель высшего звена

Строковый

Кредитная история

Информация берется из бюро кредитных историй. Если имеется негативная информация о клиенте (просрочки по прошлым кредитам), то ему присваивается категория «отрицательная»

Строковый

Сегодня это действительно слишком просто: вы можете подойти к компьютеру и практически без знания того, что вы делаете, создавать разумное и бессмыслицу с поистине изумительной быстротой. (Дж. Бокс)

Cкоринг-карты

Начальный анализ характеристик определяет набор тех из них, которые должны быть учтены в итоговой модели и преобразует их в группированный формат переменных. На стадии составления предварительной скоринг-карты различные методики прогнозирования могут использоваться для нахождения такого набора характеристик, который способствует обеспечению наибольшей точности прогноза.

Применяются методы логистической регрессии, а также деревья решений и нейронные сети. Вообще говоря, итоговые скоринг-карты, создаваемые на этой стадии, должны состоять из 8-20 характеристик. Такое количество значений берется для обеспечения устойчивости карты даже при изменении одной или нескольких характеристик. Скоринг-карты с очень маленьким набором характеристик как правило, не выдерживают испытаний, так как они неустойчивы при малейших изменениях в выбранном профиле (наборе характеристик).

Вне зависимости от используемой методики моделирования, результатом работы должна явиться готовая скоринг-карта, состоящая из оптимальной комбинации характеристик, принятых во внимание, например, могут учитываться:

  • корреляция между характеристиками;
  • статистическая сила скоринг-карты;
  • интерпретируемость выбранных характеристик в конкретной отрасли/отделе;
  • используемые средства моделирования;
  • понятность методологии, соответствие предъявляемым требованиям.

Понятие профиля риска

Скоринг-карты могут разрабатываться и использоваться для различных целей: максимизации качества статистических показателей, эффективности (с использованием небольшого числа переменных), и т.д.

В бизнесе скоринг-карты разрабатываются, чтобы помочь специалисту в принятии решений. Они выступают в роли арбитров, хранят в себе правила для принятия решений. Опытный специалист никогда не будет принимать свое решение исходя только из 4-5 правил формы приложения или истории расчетов. Скорее, он проанализирует сразу несколько обобщающих показателей для формирования профиля риска клиента. Так почему же скоринг-карты разрабатываются всего с 4-5 переменными или характеристиками?

Цель процесса разработки карт - построить наиболее полный профиль риска для каждого клиента. Такой широкий подход делает скоринг-карты не только более эффективными, но и менее восприимчивыми к изменениям в одной отдельной области. Такой профиль риска должен включать в себя характеристики, отражающие столько независимых типов информации, сколько возможно. Для примера, кредитная скоринг-карта пользователя должна включать в себя: демографическую информацию о клиенте (возраст, место проживания, регион и стаж работы); раздел кредитных характеристик, отражающих владение недвижимостью, профессию, платежеспособность, некоторую финансовую информацию, а также степень доверия клиенту в отношении погашения долгов (общий коэффициент невозвращения долга), а также другую значимую для рассмотрения информацию о существующих пользователях.

Профиль пользователя также помогает при последующем мониторинге скоринг-карт по релевантности. Большинство аналитиков, занимающихся изучением рисков, используют ежемесячные отчеты типа "стабильность системы" или "стабильность численности клиентов" для подтверждения эффективности применения карт при текущей численности клиентов. Эти отчеты показывают меры эффективности, исходя лишь из характеристик, используемых в скоринг-карте. Общий же профиль риска более реалистично отражает текущие изменения численности, чем при использовании ограниченного количества переменных из скоринг-карты.

Создание карты клиента на основе профиля риска в теории практически ничем не отличается от других процедур прогнозного моделирования. Разница состоит лишь в представлении конечного набора характеристик. Существует большое количество разнообразных методов, которые могут быть использованы для включения значений профилей рисков клиента в скоринг-карту. Оставшаяся часть статьи будет посвящена методам, использующим logit-регрессию для построения скоринг-карт клиентов.

Logit-регрессия

Logit-регрессия применяется для разработки скоринг-карт в большинстве приложений финансовой сферы, где переменные являются категориальными. В случае непрерывных переменных прогноза используется линейная регрессия. Далее будет рассмотрено использование множественной logit-регрессии для прогноза бинарной переменной (имеющей значения плохо/хорошо).

logit-регрессия, как и большинство других методов прогнозирования, использует набор характеристик прогнозирования для определения вероятности (или возможности) достижения результата (цели). logit-преобразование уравнения возможности наступления события выглядит следующим образом:

Р - итоговая вероятность наступления события;

Х - зависимые переменные;

Начальный(нулевой) уровень линии регрессии;

Параметры

Логит-преобразование - это логарифм отношения вероятности наступления события к вероятности его ненаступления: log(p(наступления события)/р(ненаступления события)), и используется оно для линеаризации итоговой вероятности, ограничивая вероятность от 0 до 1. Для оценки параметров и используется метод максимального правдоподобия. Эти параметры оценивают меру изменения результата логит-преобразования при изменении входной переменной на одну единицу (в согласовании с другими входными переменными). На самом деле, эти коэффициенты показывают наклон линии регрессии между переменной-целью (target), и соответствующей входной переменной .

Параметры зависят от единицы измерения входной переменной, например, выражаются в процентном отношении к объему всех анализируемых данных, и их необходимо стандартизировать для облегчения анализа. Стандартизация может быть выполнена различными методами, включая и метод стандартизированных оценок. Другой способ стандартизации состоит в общей отмене единиц измерения входных данных, и выполнении регрессии не на входные данные, а на WOE для каждой группировки, созданной на прошлом шаге.

Регрессия подразумевает наличие целевой переменной и серий входных данных. Эти данные могут иметь различные формы представления. Наиболее общий способ - это использовать необработанную входную информацию для числовых данных и создавать замену для переменных с категориальными данными. Далее в анализе используется метод стандартизированных оценок для нейтрализации эффекта, оказываемого различными единицами измерения входных данных.

В случае скоринг-карт по сгруппированным переменным, входные данные могут быть представлены в виде средних значений для числовых переменных, например средний возраст по каждой группе, или некоторое взвешенное среднее, или замененные переменные для категориальных групп. Но использование замененных переменных для категориальных переменных имеет существенный недостаток - получается, что разница между группой категориальных переменных состоит в их названии. Более предпочтительно использовать для сгруппированных переменных WOE каждой группы в качестве входных данных. Данный подход не только решает проблемы различий единиц измерения входных переменных, но и принимает в расчет точный тренд и шкалу отношений одной группы к другой. В дополнение, если группировка была произведена верно, можно быть уверенным, что значения, распределенные по группам при шкалировании скоринг-карты являются логически обоснованными и отражают разницу в родстве между группами.

Регрессия может быть применена для нахождения наиболее вероятной модели, использующей все доступные опции. Обычно это принято называть методикой "регрессии по доступным параметрам". Данный метод оказывается довольно эффективным, особенно если имеется большое количество независимых входных переменных. Гораздо реже используются следующие три типа поэтапной logit-регрессии:

Предварительный выбор:

Этот метод строит модель по одной характеристике(переменной), затем постепенно добавляет остальные характеристики в эту модель по возрастанию до тех пор, пока не останется переменных с р-value меньше уровня значимости (например, 0,5). Этот метод эффективен, но может не работать, если имеется очень большое количество переменных или присутствует высокая степень их корреляции.

Метод исключения:

Противоположный предварительному выбору метод, работает сразу со всеми переменными модели, и последовательно исключает переменные с наименьшим уровнем значимости. Процесс идет до тех пор, пока все оставшиеся переменные не будут иметь р-value ниже уровня значимости, например 0,1. Этот метод учитывает корреляцию больше, нежели метод предварительного выбора, или поэтапного выбора. Однако это не идеальный метод для исключения корреляции. Обратное исключение также может быть использовано для объединения значимых взаимодействий в модель.

Поэтапный выбор:

Комбинация двух предыдущих методов. Использует и добавление и удаление переменных динамически в карту качества на каждом этапе, вплоть до достижения наилучшей комбинации признаков. Пользователь может задать минимальные p-value, при которых переменная добавляется в создаваемую модель, или остается в модели. Дополнительную информацию Вы можете получить на статистическом портале и сайте компании СтатСофт.

Конструирование скоринг-карты

Пока возможно построить карту качества, применив ко всем переменным регрессионную модель и сгенерировав статистически оптимальный результат, этот метод не может принести лучшие результаты. Разработчик скоринг-карты обычно опирается на некоторые статистические показатели, такие как p-value, ХИ-квадрат, R-квадрат и некоторые другие для определения качества построенной модели. Далее приведены некоторые задачи, решение которых необходимо при разработке скоринг-карты.

Первая задача состоит в определении наилучшего набора входных переменных, и построении полного профиля рисков. Методика построения профиля рисков была описана выше. В идеале, этот профиль должен быть построен с использованием как можно большего числа независимых переменных, например демографических, финансовых, кредитных вопросов, платежеспособности, и т.д. Процесс разработки должен учитывать проблемы корреляции и коллинеарности, и другие факторы, затрагивающие надежность модели.

Разработанная скоринг-карта должна соответствовать по своей структуре с последовательностью принятия решений в организации. Если модель является единственным решающим фактором, необходимость построения всестороннего профиля рисков возрастает. Если модель предполагается использовать для поддержки принятия решений, то переменные, включаемые в карту, должны перекликаться с остальными показателями, и не противоречить им. Например, включение таких характеристик как банкротство, TDSR, информация о совершенных преступлениях, должно быть сведено к минимуму, так как присутствует в полицейских стандартах.

Пример, приведенный в таблице 1, показывает переменные-факторы скоринг-карты, взятые из профиля рисков. Заметьте, что среди показателей представлены различные типы информации, как из внутренних, так и из внешних источников. Включение запросов за последние 12 и за 3 месяца сделано для того, чтобы можно было определить масштаб как коротко- так и долгосрочного кредитования. Банкротство и "статистика нарушений" не были включены в карту показателей, так как они используются в полицейских правилах и автоматически отсеиваютсоответствующих кандидатов.

Обычно подобная скоринг-карта не является результатом автоматического регрессионного алгоритма. Как же получается подобная скоринг-карта?

Рассмотрим на примере.

Разработчик скоринг-карт имеет на вооружении несколько методов, с помощью которых он может построить итоговую форму модели. Предполагается отбор параметров, при котором изначально рассматриваются лишь необходимые, или те, которые "может быть пригодятся".

Один из способов добиться результата - это предположить значимые для модели переменные, шаг за шагом, причем переменные предполагаются совершенно специфичным для каждого шага путем. Этот процесс похож на регрессию с поэтапным выбором (stepwise). Пример приведен в таблице 2 ниже:

Используя данный метод, регрессионный алгоритм сначала выбирает параметры, используя logit-регрессию либо по предварительному отбору, либо по методу исключения, либо поэтапный выбор. Характеристики, удовлетворяющие поставленным критериям отбора (напр. Когда p-value параметра оценивается на каком-либо уровне доверия, параметры добавляются к карте в первую очередь, или наоборот, удаляются из нее в случае регрессии по методу исключения.) В приведенном примере характеристики "возраст", "дата смены места жительства" и "опыт работы" будут вычислены при первой итерации. Характеристика "возраст" появится в модели как оказывающая наибольшее влияние на прогноз.

При второй итерации того же уровня, алгоритм рассмотрит две оставшиеся характеристики, принимая во внимание уже отобранную переменную "возраст". Если окажется, что одна либо обе рассматриваемые переменные оказывают значимое влияние на результат прогноза, то они тоже будут добавлены в модель. Регрессионный анализ остановится, когда не будет ни одной переменной, которую можно было бы добавить, либо исключить из набора данных для анализа.

Все характеристики, включенные в модель на первом шаге, будут участвовать в ней и на 2м шаге. Регрессионный алгоритм на этом шаге проверит такие характеристики как "район", "индекс", и "область", но проверка начнется с характеристик, отобранных на первом шаге и уже включенных в модель. Вновь, такие показатели как p-value и уровень значимости будут использованы для определения значимых характеристик (которые войдут в модель).

Подобный анализ будет проведен для каждого последующего уровня. Итогом анализа будет являться скоринг-карта. Характеристики, включенные в модель на более ранних шагах, будут также включены в модель и при последующих итерациях.

Статистические показатели, такие как ХИ-квадрат или стандартизированные оценки могут быть использованы для определения силы прогноза модели на каждом шаге итерации.

Опытный пользователь может проконтролировать процесс анализа для увеличения шансов вынесения правильного диагноза. Слабые и "Привилегированные" характеристики могут быть помещены на более ранние шаги итерации в целях увеличения шансов их добавления в модель, и для максимизации влияния бесспорных (проверенных) переменных. В дальнейшем, добавление других переменных увеличит точность прогноза.

Более значимые характеристики помещаются в конец, и могут не войти в скоринг-карту, если их влияние может быть уже смоделировано по одному или нескольким другим критериям. Использование нескольких слабых критериев для моделирования поведения одного более значимого применяется для стабилизации, причем без потери силы прогноза, например, 5 характеристик, добавляющих 200 баллов каждая в скоринг-карте предпочтительнее, чем две характеристики, добавляющие по 500 баллов каждая. Модель будет эффективна при более широкой базе (наборе характеристик). Это соответствует идее создания профилей рисков.

Схожие критерии("возраст", "дата смены места жительства" и "опыт работы") объединяются в один шаг итерации для того, чтобы корреляция между этими характеристиками была рассмотрена в дальнейшем. Наиболее подходящие среди коррелированных характеристик войдут в скоринг-карту. Схожие коэффициенты должны быть также помещены в один и тот же шаг итерации в качестве информации о числителе и знаменателе. Вдобавок, рассмотрение различной независимой информации на каждом шаге увеличивает шансы добавления хотя бы одной переменной из каждой группы в итоговую скоринг-карту.

Регрессионный анализ будет повторяться для различных комбинаций характеристик на разных этапах и с разными уровнями доверия в цикличном процессе для построения наилучшего набора правил модели. Характеристики могут быть перемещены на более высокие или более низкие шаги в целях достижения разнообразных комбинаций для скоринг-карт. Эти карты будут оценены позже, с использованием бизнес критериев и статистических показателей прогнозной силы модели.

На практике этот подход реализуется моделью с опцией выбора последовательности в logit-регрессии с поэтапным выбором. Вот два наиболее часто используемых подхода:

Простая регрессия

Выполняется однократный запуск алгоритма регрессионного анализа, причем порядок размещения характеристик следующий: - Все "слабые" характеристики размещаются вверху(вначале), все более значимые характеристики - в конце. Внутри каждого типа информации характеристики могут быть отсортированы, начиная самой менее значимой, и заканчивая наиболее значимой характеристикой. Весомость каждой характеристики может быть рассчитана по ее значению.

Множественная регрессия

При использовании данного подхода алгоритм регрессионного анализа повторяется многократно, рассматривая различную информацию на каждом шаге анализа.

  • Все "слабые" характеристики рассматриваются в первую очередь, на начальных шагах регрессионного анализа.
  • При каждом регрессионном анализе характеристики располагаются в порядке возрастания их значимости, то есть от самой "слабой" к самой "сильной".
  • Характеристики, включенные в скоринг-карту на более ранних шагах анализа, включаются во все последующие шаги.

Также, как и при процессе группировки, такой подход к разработке скоринг-карт восприимчив к понижению эластичности. Хорошее понимание всех шагов анализа, а также статистических компонентов, таких как набор анализируемых характеристик, снизит шансы получения неудовлетворительного качества прогнозирования. Данный подход должен быть протестирован с использованием нескольких различных комбинаций характеристик, чтобы понять динамику изменения данных перед составлением итоговой скоринг-карты.

Этот процесс включает в себя статистическое моделирование (например, регрессионный анализ) и бизнес-анализ. Осуществляется разработка устойчивой, эффективной скоринг-карты, содержащей характеристики из различных источников, и отображающей различные независимые типы информации(демографическая, запросы, информация о прошлой деятельности, о з/п и т.д.). Заметим, что регрессионный анализ выполняется с использованием устойчивого набора характеристик, выбранных из первично отобранных характеристик, и все слабые критерии уже были устранены. Все тесты на значимость следуют из выбора итоговой композиции характеристик, входящих в скоринг-карту, но это не единственный критерий для рассмотрения. Получившаяся карта имеет свою статистическую силу и воздействие. Чаще всего, это как раз то, что используют риск-менеджеры и другие специалисты по принятию решений для выработки компенсирующих риски стратегий.

Когда набор характеристик для включения в скоринг-карту получен, эти характеристики могут быть применены к анализу в сгруппированном виде, для получения итоговых параметров регрессии. Подобные процессы происходят с каждой скоринг-картой при построении, для каждого сегмента в отдельности. Типично несколько скоринг-карт используют различные комбинации характеристик для каждого сегмента, и учитывают поставленные цели и задачи для определения итогового решения. Скоринг-карта с более низкой "силой" может получить больший приоритет, если она нацелена на стратегию, цели и задачи организации.(например, большая прибыль), чем другая, с большей "силой", и поэтому необходимо сравнить несколько карт соответствующим образом, чем полагаться единственно на статистические показатели. Кстати выбор критериев скоринг-карт и их утверждение будет рассмотрено в последующих главах.

В итоге на данном этапе создаются несколько различных скоринг-карт, обобщающих некоторое число характеристик и их параметры регрессии.

Средний размер ипотечного займа за март 2014 составил порядка 1.5 млн рублей . Средний размер автокредита составляет
не менее 0.5 млн рублей . Спасибо за предоставленные ссылки.
Исходя из вышеприведенных цифр, можно предположить, что банк умудрился за месяц выдать кредит около двумстам тысячам человек.
Конечно, в этом банке используют скоринговые системы.
Я узнал про скоринговые системы пару лет назад и был потрясен. Сама идея, что бездушная машина может принимать решение о выдаче кредита на основе статистических данных, не выходила из головы. Я захотел поиграть в банк и проверить, выдаст ли компьютер кредиты моим друзьям, just for fun. Настоящие скоринговые системы я никогда не видел, но решил, что это и неважно, напишу сам.
Сказано - сделано.

Осторожно, много изображений!

Вступление

Конечно, это лишь модель, на которой можно обучать студентов-экономистов младших курсов,
зато все мои друзья теперь знают что дифференцированные платежи выгоднее аннуитетных.

Программа написана 2 года назад, за 2 недели, на C# + MSSQL.
Сейчас случайно откопал ее и решил показать хабрасообществу. А вдруг какой-нибудь мелкий банк купит?
Открыл код, испугался, добавил немножко многопоточности и закрыл.

SQL-запросы прямо в обработчиках - это ужасно, я знаю. Но доделывать неинтересно, уже наигрался.

Разработка

Алгоритм с точки зрения клиента примерно такой:
  1. Клиент заполняет анкету с вариантами ответов.
  2. Далее выбирает сумму кредита, в базе данных создается заявка.
  3. Система считает баллы за выбранные ответы и определяет, выдать кредит или нет.
  4. Если кредит одобрен, в базе данных создается договор и таблица платежей.
  5. Клиент выполняет платежи.
  6. Когда накопится статистика, можно посмотреть, какие критерии клиента влияют на его платежеспособность.
  7. ???????
  8. PROFIT!

Значит, для начала нужна анкета, которая по-умному называется «скоринговая карта».
На сайтах 3 крупнейших российских банков были найдены анкеты для получения потребительских кредитов. Собираем из трех одну, распечатываем и создаем экспертную комиссию. Были пойманы 15 человек, этого оказалось достаточно. Эксперт оценивает каждый критерий скоринговой карты в диапазоне от 0 до 100 баллов. Также есть следующие варианты:

  • -1 балл - ответ нестандартный и оценивается кредитным специалистом.
  • -10 - отказ в кредите.

Затем находится средний балл за каждый критерий и получается итоговая анкета.

Показатель Значение показателя Балл
Фамилия -1
Имя -1
Отчество -1
Дата рождения -1
Место рождения -1
Пол -1
-1
Серия, номер -1
Кем выдан -1
Дата выдачи -1
Телефон -1
Адрес -1
Возраст Менее 20 лет 8
20-25 лет 21
25-30 лет 36
30-35 лет 53
35-50 лет 60
50-60 лет 37
60-65 лет 15
Больше 65 лет -10
Проживание Собственное жилье 47
Аренда жилья 13
Общежитие 8
У родственников 10
Воинская часть 9
Другое (уточните) -1
Гражданство РФ 43
Другое (являюсь резидентом РФ) (уточните) 5
Не являюсь резидентом РФ -10
Семейное положение Холост (не замужем) 40
Женат (замужем) 65
Женат (замужем) но живет раздельно 26
В разводе 29
Вдовец (вдова) 34
Наличие детей Нет детей 66
Один 57
Два 48
Три 36
Более трех 24
Наличие иждивенцев Нет 66
Один 57
Два 48
Три 36
Более трех 24
Уровень образования Ниже среднего 11
Среднее 21
Среднее специальное 33
Незаконченное высшее 39
Высшее 58
Несколько высших 77
Ученая степень 84
Занимаемая должность (позиция) Руководитель (дир., зам.дир., гл. бух.) 94
ИП 92
Госслужащий 47
Военнослужащий 56
Специалист 46
Спортсмен 30
Рабочий 32
Студент (неработающий) 9
Пенсионер (неработающий) 8
Безработный 0
Количество мест работы за последние 3 года Одно 52
Два 38
Три 21
Более трех 9
Стаж на данном месте работы Менее 1 года 7
До 3 лет 24
До 5 лет 40
Более 5 лет 56
Общий стаж работы Менее 1 года 10
До 3 лет 20
До 10 лет 37
Более 10 лет 62
Вид деятельности организации Финансы, банки, страхование 37
Консалтинговые услуги 32
Строительство 39
Органы власти и управления 42
Промышленность и машиностроение 37
Инофрмационные технологии/телекоммуникации 38
Оптовая и розничная торговля 35
Транспорт 30
Туризм 36
Охранная деятельность 34
Образование 32
Медицина 30
Наука 33
Вооруженные силы 31
Социальная сфера 21
Другие отрасли (уточните) -1
Среднемесячные доходы -1
Среднемесячные расходы -1
Собственность недвижимого имущества Гараж 38
Квартира 58
Дом 65
Дача 51
Земельный участок 63
Другое (уточните) -1
Наличие транспортного средства Наименование, марка, год выпуска (уточните) -1
Нет транспортного средства 0

Эта анкета заносится в систему.

Вообще, обязательных вопросов всего 2 - «Среднемесячные доходы» и «Среднемесячные расходы». Без них нет смысла в кредитовании вообще. Остальные вопросы можно изменять, удалять, или добавлять свои.

Кнопка «Сортировать» определит максимальный и минимальный балл скоринговой карты, а также определит тип вопроса.
При прохождении анкеты элементы создаются автоматически. Если у вопроса один ответ, он будет отображаться как поле, если больше 1 ответа, он превращается в выпадающий список. Так выглядит анкета с точки зрения клиента.

А это клиент указал наличие транспортного средства, и описал его. Кредитный специалист оценил в баллах данный критерий.

Оценка системой анкеты.

Чистый среднемесячный доход - это разница между доходами и расходами. Для повышения гарантии платежа, в программе учитывается понижающий коэффициент платежа от чистой прибыли, например 0.7. Это значит, если клиент указывает 100 рублей чистой прибыли в месяц, банк рассчитывает до 70 рублей ежемесячного платежа. Чистый доход умножается на данный коэффициент. Коэффициент можно изменять в настройках.

У анкеты существует верхний и нижний предел прохождения. Нижний предел уменьшает количество одобренных кредитов, но повышает платежеспособность клиентов. Верхний предел отсекает мошенников, которые создают идеальные анкеты для максимально выгодного кредита. Верхний и нижний пределы задаются в процентах, их можно изменять в настройках. Если анкета клиента, а точнее, сумма баллов за анкету проходит в окно между верхним и нижним пределами, кредит считается одобренным. Теперь клиент может выбрать одно из кредитных предложений, сумму и продолжительность выплат. Выплаты можно посчитать аннуитетными или дифференцированными платежами.

Клиент хочет получить 230 000 рублей со сроком выплаты 24 месяца дифференцированными платежами под 22,5 процента. За 24 месяца клиент выплатит 283 906 рублей.

Вот график платежей.

Потными от волнения руками нажимается кнопка «Оформить». Первый платеж клиента самый большой, он составляет 13 896 рублей. Месячная платежеспособность клиента определена в 14 611 рублей, поэтому банк согласен выдать кредит.

Ура! Если кредит одобрен, создаются заявка, договор и таблица платежей.

Обратите внимание на статус - клиент плохой. Статусов всего 2 - хороший и плохой. Почему плохой, клиент же только что взял кредит? Дело в том, что первый платеж должен поступить уже сегодня.

Система определяет статус клиента по таблице платежей. Для каждого платежа указана дата. Определяются платежи, которые на сегодняшний день уже должны быть оплачены. Клиент признается плохим, если количество невыплат:

  • ≥ 1/3 от всех платежей по договору, или
  • ≥ 4 (задается в настройках).

Платеж оплачен, транзакция прошла!
Если честно, то номера счетов, договоров, заявок и транзакции платежей генерируются случайным образом, и для работы системы не нужны вообще. Но я же солидный банк!
Зато клиент стал хорошим.

Грязный хак - можно хорошего клиента сделать плохим, отменив его платежи.

Статистика

И наконец-то добрались до самого интересного - статистики!
Список вопросов формируется из анкет клиентов, которым одобрен кредит.
Можно выбрать любой вопрос и смотреть соотношение хороших/плохих клиентов.

Кредитное предложение «Добрый кредит»

Можно создавать свои кредитные предложения. Редактор позволяет задать максимальную сумму и длительность выплат, выставить процентную ставку в зависимости от размера кредита.

А теперь я хочу взять 140 000 рублей на год под «Добрый кредит».

Переплата 303 рубля - мечта!

Но вот все друзья получили кредит, статистика идеальна, рынок насытился. Банк в стагнации. Что делать? НУЖНО БОЛЬШЕ КЛИЕНТОВ! Где их взять? Сгенерировать!

Генерация клиентов

Были найдены текстовые файлы:

Итак, генератор для стандартной анкеты:

Вопрос Ответ
Пол Случайно
Имя Из списка
Фамилия Из списка
Отчество Имя из списка плюс «ович» или «овна»
Место рождения Из списка
Дата рождения От 1940 г. до 1997 г.
Документ, подтверждающий личность Паспорт
Номер паспорта От 0000 000000 до 9999 999999
Дата выдачи Любой момент, с тех пор как клиенту исполнилось 14 лет
Место выдачи Из списка
Среднемесячные доходы От 4 тыс. до 60 тыс. руб.
Среднемесячные расходы От 2 тыс. до 30 тыс. руб.
Остальные вопросы Случайно
Кредитное предложение Случайно
Сумма кредита От 1 тыс. руб. до максимальной суммы кредитного предложения
Количество месяцев выплат От минимального до максимального для данного кредитного предложения

Хотя доходы в 2 раза превышают расходы, все равно иногда попадается, что чистый доход отрицателен.

Если выбран ответ с уточнением, заявка аннулируется, а в строке состояния появляется подпись «Невозможно сгенерировать заявку с уточнением».

Если кредит одобрен, то генерируются выплаты. Вероятность неплатежа равна 1/20, но некоторым клиентам не везет и они пропускают по 4 платежа подряд.

Генератор был вынесен в главное меню, можно создать 1 или сразу 200 заявок.

Также генератор есть при прохождении анкеты.

Баллы сгенерированных клиентов подчиняются нормальному распределению. Крайний левый столбец - это те, кому отказано в кредите.

В анкетах конечно получаются глупости, зато статистика сразу стала повеселее!

Вывод - худшим клиентом является холостой (незамужняя) индивидуальный предприниматель, с несколькими высшими образованиями.

Могут понадобиться