Проект платформы социального скоринга (материалы к Учёному совету РГСУ)
В рамках квалиметрической проблематики, первым прикладным проектом которой стала утверждённая Учёным советом Университета платформа «Сешат», сегодня мы обсудим ещё одной квалиметрическую тему. Речь пойдёт о скоринге (scoring).
Самой распространённой трактовкой этого термина является используемая банками корреляционно-статистическая система оценки клиентов, обработкой анкет которых система оценивает кредитоспособность и автоматически принимает решение о выдаче/невыдаче кредита и определяет их условия. Далее, что называется, «на усмотрение заёмщика» - брать или не брать. Изредка, и как правило в серой зоне баллов и/или на кредитных десках некрупных банков, функционал кредитного скоринга ограничивают лишь подсказом вердикта инспекторам.
Один из авторов застал время, когда в России скоринговые таблицы банкинга (и страхования) были ярким предметом вожделения финансовых менеджеров (и даже целью бизнес-шпионажа), а носители скоринговых компетенций и данных были самыми желанными трудовыми ресурсами. Сегодня же скоринговый функционал зачастую даже не входит в структуры банков, а приобретается ими как конкурентная и множественная услуга со стороны. В этих случаях, на основе купленного скоринга банки формируют свои рейтинги. Как они это делают, как правило, не раскрывается. Инсайд: да точно также, но на своей статистике.
Хотя на рынке банковского программного обеспечения существуют готовые решения, многие банки разрабатывают свои собственные системы. Многие из них не только обрабатывают введенные данные, но и настроены на «как бы самообучение»: модели поведения уже принятых скорингом клиентов учитываются при корректировке оценок вновь поступающих на конвейер будущих заёмщиков.
Банковский скоринг - история исключительно прагматичная. Считается, что существует корреляция между определенными социальными данными (типа наличие детей, отношение к браку, высшее образование) и добросовестностью заемщика. Заметьте - не кредитоспособностью, а добросовестностью. Переход между этими двумя сущностями в математике большинства скоринговых систем - воистину вода, которая, как известно, «темна … в облАцех воздушных» (Псалтырь, пс.17, ст.12).
Логика скоринга, в пределе, цинична. Мало того, она ещё и несколько странновата: почему наличие стационарного телефона позитивно важно в наше время — вот реально непонятно. Но гораздо важнее другое - она антисоциальна и прямо антигосударственна. С одной стороны, вроде как наличие полной семьи приветствуется, т.к. такой маритальный статус даёт наибольшие плюсы. Но с другой стороны — дети и любые иждивенцы дают серьёзные минусы. В некоторых системах — больше, чем развод. Известен даже случай, когда скоринг-минус от детей превысил минус судимости. И это ведь не просто парадокс или оксюморон, это позиция; банкирам, очевидно, хочется полных, но бездетных семей. Мотивирует, по крайней мере, их скоринг именно такую демографию «наоборот»: спланированное и финансово-поддержанное вымирание народа, пользующегося банковскими кредитами. Интересно, кто всё-таки победит: банки со скорингом или государство с материнским капиталом? Почему-то кажется, что этот вопрос совсем не так прост.
Вернёмся к технологии. Основных видов кредитного скоринга в современных банках четыре: application-scoring (скоринг заявки), collection-scoring (скоринг задолженности), behavioral-scoring (скоринг поведения) и fraud-scoring (скоринг мошенничества). Важно, что в наиболее серьёзных скоринговых системах первичные структуры данных и математика разных видов оценивания общие, а вот подгружаемые данные и машинки отчётности различны. Характер оцениваемых сущностей весьма широк и включает в себя не только оценки, но и прогнозы с суждениями. Делаем отсюда вывод, что это не просто возможно, но практически реализовано.
В качестве модельного лидера банковского скоринга безболезненно можно считать Райффайзен Банк, который при своём весьма невеликом размере за четверть века закредитовал российских граждан на 135 млрд.₽ со средним чеком более $16,5К ($800..$80К). На момент перехода в режим «вождя» в феврале этого года доля их онлайн-кредитов в их же портфеле потребительских кредитов превысила 80% при времени выдачи 5 мин. Правда в сентябре 2020 года МКБ заявил 1 мин., причём на ипотеку, но у них не очень пошлО.
Кроме времени обработки, скоринг как технология снижает издержки и риски, даёт возможность гарантированной реализации общей кредитной политики (что важно - централизованной), неплохо защищает от мошенничества и уменьшает коррупционную компоненту. Это из плюсов. К явным минусам скоринга, без учёта этических аспектов, можно точно отнести заявительный характер данных, а также необходимость постоянной контент-поддержки систем. Хотя будут ли эти особенности реальным минусом вне банкинга - как посмотреть.
Скоринговые модели кредитования субъектов хозяйствования существенно сложнее и используются значительно реже. Но они тоже существуют, а у их относительной непопулярности много разных, в т.ч. субъективных причин. В целом же, цитируя с перефразом замечательную комедию «Hot fuzz»: «скоринг - он и есть скоринг». В смысле удовлетворяемых хотелок, скоринг - «система количественных оценок качеств клиента, важных для осуществления активных действий в его отношении». Чьих действий, как и каких именно, как говорится, зависит. Давайте именно такое определение и отфиксируем для дальнейшего использования.
Какой ценностно-этический профиль характерен для современных финансистов мы теперь хорошо понимаем. И не только на примере критериев скоринга. Тут и реклама кредитов в прайм-тайм с возрастной категорией «0+»; ну действительно, кредиты от госбанка — это же прям заветная мечта любого российского грудничка. Тут же все доступные товары потребительского класса в кредит; берите сколько унесёте. И push-реклама кредитных лимитов по телефону, который был заявлен только для расчётно-кассового обслуживания. Особый цинизм просматривается в использовании грабительскими микрофинансовыми организациями понятий «касса взаимопомощи» или «пенсионная касса.рф». Да и десятки других подобных проявлений явной асоциальности современных финансовых институтов.
К сожалению, наоборот тоже верно. Современные наши социальные институты очень далеки от понимания особенностей организации финансовых потоков и от сонастроя с их мотивами/интересами. А это тоже весьма вопросительно — реалии таковы, что финансовая система не менее значимый элемент инфраструктуры нашего бытия, чем социальная система. При этом финансовая богаче, организованнее и амбициознее. Социальным институтам не по чину обслуживать финансовые, но и игнорировать их сегодня было бы верхом непрофессионализма.
В этом смысле наш Университет имеет уникальное конкурентное преимущество. Мы по-прежнему лидер отечественной социальной научно-образовательной среды. Конечно, лет 10 назад мы были бесспорно первыми; мы были среди тех, кто делал разницу и устанавливал правила. Сегодня, мало того, что сам профиль социальной работы изменился и как-то подрастворился. Так ещё и наш стейтмент «первого социального» активно оспаривается на практике весьма неприятными акторами. Неприятными в смысле их конкурентности, динамизма, аппетитов и уровня. Но ведь потенциал-то наш никуда не делся. Более того, считаем, что с принятием нашей новой стратегии он вырос. Необходимо начать его активно использовать.
Даже сейчас ни у кого в России нет такой широкой совокупности социальных и смежных профилей, как в РГСУ. Мы имеем в виду компетенции социальной работы, разные формы управления, экономику и финансы, психологию и социологию, юризм общей практики, гуманитарные дисциплины и информационные технологии.
Считаем уместным предложить к обсуждению проект, прямо ориентированный на интегрированное использование наших компетенций. Если предметом «Сешата» стало научное оценивание, то сегодня предлагаем поговорить о платформе социального оценивания, создание которой планируется в рамках нового проекта с рабочим названием «Мы». Конкретно, речь пойдёт о создании современной системы социального скоринга (4С) на специально созданной квалиметрической платформе с использованием вероятностных и статистических моделей оценивания.
Платформа «Мы»
Президент установил в своих публичных выступлениях и документах большинство социальных акцентов и приоритетов, которые в каком-то приближении и как-то удачно операционализировали Правительство и законодатель. Практическое же и чёткое их применение затруднено гигантскими масштабами социальной поляны, огромным ассортиментом социальных мер и отсутствием понятного, общедоступного, прозрачного механизма. Вот и получается, что имеются многочисленные примеры разрывов прав и обязанностей, решений и исполнений, а многие процедуры социальной поддержки и обеспечения по-прежнему базируются на суждениях инспекторов и являются отражением их вкусовщины.
Возможно даже, что их большинство; этих самых процедурных проявлений вкусовщины. Качественных исследований на этот счёт нам найти не удалось. Планируем одним из проектов нашей команды собрать такую информацию широким рецептивным исследованием пассивного формата способами когнитива социального контента в информационном интернет-трафике. Пока же, такая вкусовщина ставит получателей в позицию социального попрошайничества, унижает их человеческое достоинство, формирует вектор серьёзного напряжения в отношении к власти. Надо отметить, что исторически, в подавляющем большинстве случаев, главной проблемой Державы было не столько содержание решений власти, сколько их трансляция без изменения сути и корректное исполнение на местах. Классические «дураки и дороги», просто дороги здесь информационные.
Лёгкого решения здесь быть не может. Масштабы самОй поляны на конец 2020 года поражают: >43,4 млн. пенсионеров получили за год 8,1 трлн.₽ пенсий, а >75 млн.чел. получили социальную поддержку на сумму свыше 11,9 трлн.₽, подав более 350 млн. прошений на всех трёх уровнях (на федеральном - 100 млн.). Всего в стране на тот момент было 387 видов мер социальной поддержки (федеральных - 44) с общим числом непосредственно мер >20 тысяч. Сегодня и видов, и мер стало ещё больше.
Пока готовится к представлению выверенный проект социальной сетки и документируются нюансы и смыслы всей этой умонепостижимой картины для начала проекта её дигитализации, видится целесообразным запустить опережающими темпами проект социального скоринга, имея в виду создание надёжной, понятной, строгой и независимой от прикладных социальных ведомственных практик количественной метрики социальных статусов и уровней граждан посредством процедур социального оценивания. Выходные данные будут выпускаться в виде двухкомпонентного скоринг-кода (СК), где оба компонента будут двухразрядными числами, определяющими социальный статус человека (первый) и его социальный уровень (второй). Например 47-29. Социальный статус - отражение своего рода «заслуг» человека, а социальный уровень - оцифровка как-бы его «перспектив». Оба названия компонентов, как и самого скоринг-кода, неудачные. Но можем уверенно предполагать, что в ходе проекта разработается строгий понятийный аппарат и подберутся уместные названия. Пока же, здесь и сейчас, предложим краткие замысловые дескрипторы подсказа.
Социальный статус скоринг-кода - метрика накопленных качеств и особенностей человека, отражение его совокупного опыта, образования, возраста, заболеваний, заслуг, социальных особенностей, наград, потребностей, подтверждённых прав и прочих нюансов, в совокупности характеризующих его значимость в социальном плане и градус социального внимания, проявление которого ожидается в отношении данного человека в моменте, но в связи с его прошлым.
Социальный статус (СС), например, многодетной матери-одиночки со средним образованием, проживающей в двухкомнатной квартире на условиях социального найма, воспитывающей ребёнка с ОВЗ и на полставки работающей уборщицей в школе, легко и значительно может превышать СС орденоносного академика, лауреата и директора института. Этот компонент скорее про признание отношения государства к пенсионерам, ветеранам, пострадавшим от несчастных случаев на производстве и профессиональных заболеваний, инвалидов, малоимущих, безработных, получателей мер социальной защиты материнства и детства и т.д.
Социальный уровень скоринг-кода - количественная характеристика достигнутых промежуточных результатов, специальности и профессии, должности, того же образования и возраста, амбиций и устремлений, достижений, мотивов и прочих особенностей, в совокупности характеризующих его потенциал в социальном плане и угол социальной перспективы, под которым ожидается проявление внимания к данному человеку в текущем моменте, но в связи с его будущим.
Социальный уровень (СУ), скажем, того же академика, вполне может уступать СУ молодого неженатого мастера, работающего на машиностроительном заводе и производящего на продажу детские санки в своём гараже или быть меньше СУ врача-диетолога, самозанятого, помимо работы в районной поликлинике, как тренер по фитнесу и изучающего китайский язык для того, чтобы расширить свои знания о травах и компетенции по терапевтическим сборам. Второй компонент маркера больше про ожидания государства от резервов развития человека и проявление готовности поддержать реализацию его персональных перспектив на благо страны и для развития солидарного общества.
Детальная проработка своего рода «сборочных чертежей» СС и СУ и будет основным креативом проекта «Мы», поскольку именно на этой фазе и для этих целей, проектному офису предстоит проанализировать все выступления Президента, установив отражение тех самых структурных скелетов социальности как государственной политики. Далее, в порядке наращивания тканей на него, в аналитическую работу дОлжно будет ввести те Федеральные законы, официальные подзаконные акты, документы законо- и нормо- творчества регионального и местного уровней, которые прямо касаются социальной сферы. Маркер полноты здесь, по крайней мере для граждан, понятен — это те самые 387 видов мер социальной поддержки для граждан.
Когда (и если!) проект «Мы» коснётся рамок и категорий социального оценивания хозяйствующих субъектов — будет много сложнее, поскольку к аналитическим задачам добавится пространство оценочных суждений о том, какие установленные виды и/или предусматриваемые меры относятся к социальной работе, а какие — есть отражение других политик государства: безопасности, промышленной, инвестиционной, научной и т.д. Есть, однако уверенность, что с привлечением широкой общественной экспертизы удастся справиться и с этой проблемой. Хотя именно по этой причине функциональность социального скоринга юридических лиц мы видим не в рамках MVP проекта, а в порядке развития продуктива платформы. Это будет (если будет!), так сказать, социальный скоринг версии 2.0.
Но вернёмся к первой версии социального скоринга.
Финишируя креатив проекта «Мы», в синтетической фазе проекта на созданный анализом скульптурный дуэт скоринг-системы «скелет-и-плоть» нам предстоит набросить тогу тех доказанных, предполагаемых и статистических факторов и связей, которые будут прямо проистекать из анкеты социального оценивания, подтягиваться из разработанных в рамках проекта статистических и вероятностных справочников и таблиц модели или станут продуктом интегрального обсчёта общих мастер-данных платформы и индивидуальных динамических данных получающего скоринг.
Это серьёзная исследовательская задача. Она, впрочем, видится вполне решаемой при использовании комбинированной методологии двух подходов - сегментов и шкал. Сегментный подход должен стать отражением материальности и значимости тех составных социальности, которые установил своей публичной позицией Президент. Воспринимая совокупность его выступлений в отношении социальной сферы как целостное множество, вряд ли мы обнаружим какие-то важные элементы этого множества, не отражённые в его сводной позиции. Он ведь, помимо всем очевидного, вроде поддержки детей, помощи малоимущим и социальном обеспечении инвалидов, и о бездомных высказывался, и о матерях-сидельцах, и о попавших в трудную жизненную ситуацию, и о трудовых мигрантах; причём неоднократно.
Однако предположим, что таки не равна нулю вероятность того, что нам всё же удастся обнаружить какие-то узлы в той самой социальной сетке, которая суть глобальной задачи, и о которых Президент сам не говорил. Скажем, что-то самоочевидное и унаследованное из более раннего времени. Или что-то, что было сказано голосом законодателя. Или какое-то отражение удачной региональной инициативы. В теории такие варианты вполне возможны. В таких случаях нам будет необходимо расширить целостное множество скоринга, включив в него и эти узлы.
Далее - относительно простая (методически простая!) задача сегментирования и развесовки целостного множества с тем, чтобы ничего не упустить, но и ничего не посчитать дважды. Потом - нормирование суммы до 100. Оговоримся: может статься, что двух разрядов для аналитичности не хватит и скоринг-код немного загрубится. Если проектный офис решит, что так и получилось, он вполне может нормироваться до трёх разрядов, т.е. до 1000. При этом скоринг-код станет потяжелее; что-то типа 512-406. Хотя и в этом случае обязательно будут люди, у которых скоринг-коды будут одинаковыми, пусть и по-разному при этом скалькулированными. Это абсолютно нормально, ожидаемо и ничему не противоречит.
Вместе с тем базовый план проекта «Мы» видится всё же именно таким — нормирование до 100 и двухразрядные метрики социального статуса и социального уровня. Сегменты платформы и их веса, при этом, раскрывать широкой публике следует с аккуратностью — это внутренняя информация системы, составляющая, к тому же, существенную часть её ноу-хау. Следующий шаг квалиметрии — шкальный подход. Он применяется в отношении каждого отдельного сегмента в интервале 0..1 с любым уместным количеством знаков (0..10, 0..100, 0..1000); причём совсем не обязательно, чтобы расчётная (рассчитываемая) разрядность рабочих шкал была бы одинакова для всех сегментов. «0» шкалы означает отсутствие характеристики, свойства, проявления или качества, «1» шкалы — максимальное их присутствие из достижимого.
Уравнения шкал не обязаны быть гладкими; они просто обязаны быть. Быть и отражаться в контекстных справочниках, обеспечивая заполнение анкеты социального оценивания выбором (или выборами в случае допускаемой множественности) из раскрываемого под каждую шкалу словаря. Очевидно, что разработка таких словарей и справочников, как и остальной нормативно-справочной информации системы - ещё одна задача креатива проекта «Мы» и ещё один из главных активов платформы.
Завершает расчёт значений СК простая пара операций: перемножение и сложение. Перемножение значения шкал на вес сегментов и сложение полученных величин. Однако для ряда шкал перед перемножением будет необходима корректировка значения шкал на какие-то факторы «чёрного ящика», отражающие как интуитивно понятные взаимосвязанности, так и отмечаемые с высокой валидностью статистические феномены проявления, логика взаимосвязи которых отсутствует либо непознана. Пример последнего — часто используемое в различных видах ассессмента правило «кто любит мясо с кровью - имеет склонность к алкоголизму». Понятно, что можно предположить, что вегетары всех типов чаще пьют не настолько; но вся логика этого правила в целом от большинства экспертов (и от нас в частности) ускользает…
Теперь три важных оговорки. Обобщающие, либо комплексные корректировки калькуляций в проекте допускаются; также, как и множественные выборы. Но они скорее исключения, нежели правила - система тем стабильнее, чем больше в ней мэппинга «один в один»; мэппинг же «много в много» в социальном проекте вообще считаем не вполне справедливым и к использованию недопустимым.
Вторая оговорка. Скоринг-код - величина динамическая, зависящая от целого ряда переменных параметров. Поэтому включать его в какой-то вариант ID нельзя, но связь какую-то установить можно и, скорее всего, даже нужно. Причём не с условным СНИЛСом, ИННом, паспортом или телефоном, а с ними со всеми сразу и в параллель. Тогда и перспектив практического использования СК станет больше. А носителем СК на старте системы можно сделать QR с перспективой переноса на другие, более субстантивные носители кристаллического семейства.
И завершающая оговорка. В текущей модели проекта «Мы» режим заполнения анкет социального оценивания предполагается инициативный «от клиента». Подтверждений каких-либо не требуется. Соответственно, на уровень доверительности возвращаемых на платформе социальных метрик СС и СИ будет влиять не только качество нашего проектного созидания, но и качество ответов на вопросы анкеты. Если человек, проходящий социальное оценивание, скажем так, ошибётся, то процедуры социального скоринга поймать это и подсказать не смогут. Однако в дальней перспективе, при вероятном расширении статуса социального оценивания до нормативной процедуры, можно будет организовать подгрузку большинства ответов из смежных информационных систем, что резко положительно скажется на валидности социального скоринг-кода.
Предполагать такую целесообразность и заложить потенциал такой возможности необходимо прямо со старта проекта «Мы».
Собственно и всё! Проанализировали постановку Президента, составили покрытие, непротиворечивое и безизбыточное, развесовали его на сегменты, выйдя тем самым на содержание анкеты социального оценивания, подсчитали шкалы, скорректировали их, перемножили, сложили и напечатали отчёт. А по дороге — глубоко «погрузились в сладостный, волшебный, поэтический мир сводок, цифр, отчетов» (копирайт Эльдар Рязанов) и выполнили всю необходимую описательную и технологическую работу.
Подробнее:
https://rgsu.net/platform/proekt-platformy-sotsialnogo-skoringa-materialy-k-uchenomu-sovetu-rgsu.html#ДискурсРГСУ
Нет комментариев