Jeden z najbardziej konserwatywnych aspektów finansów, decyzja o udzieleniu komuś kredytu, jest przekształcana przez oparte na AI scoringowanie kredytowe. Jest to stopniowa zmiana dla osób, których historia kredytowa jest bogata i które są związane z bankami przez długi czas. Może jednak zmienić życie kredytobiorców o ograniczonej dokumentacji oraz tych, którzy działają w szarej strefie. Mogą w końcu zostać wykryci, zamiast być niewidoczni dla systemu. Niniejszy artykuł omawia zastosowanie alternatywnych danych do tworzenia opartych na AI ocen kredytowych dla osób fizycznych i małych przedsiębiorstw, które nie posiadają tradycyjnej historii kredytowej, ryzyko niesprawiedliwości i stronniczości, gdy dane biur kredytowych są niedostępne, oraz regulacyjne dążenie do stworzenia wyjaśnialnej AI w ocenie ryzyka populacji o ograniczonym dostępie do usług bankowych.
Konwencjonalne oceny kredytowe zakładają pewnego rodzaju istnienie finansowe. Zakładają, że osoba posiada konto bankowe, formalne produkty finansowe oraz wcześniej zaciągnęła pożyczkę lub korzystała z karty kredytowej. Zakładają, że pracodawcy prowadzą listę płac w formalny sposób, a sprzedawcy działają w widocznej części gospodarki — udokumentowanej części. W praktyce ogromna część świata tak nie wygląda. Młodzi dorośli często nie mają żadnych pożyczek ani kart. Migranci mogą posiadać dobrą historię kredytową w swoich krajach pochodzenia, a nic w nowych. Większość ich transakcji odbywa się gotówką lub na platformach cyfrowych, które nie raportują do biur: pracownicy na zlecenie, sprzedawcy uliczni, nieformalni sklepikarze i ogromna liczba mikroprzedsiębiorców. Tam, gdzie istnieją biura, nawet ich pokrycie może być powierzchowne lub stronnicze w kierunku miejskich, formalnie zatrudnionych populacji. Akta biura takich wnioskodawców wydają się puste lub prawie puste dla pożyczkodawców. Ponieważ zespoły ds. ryzyka są przeszkolone, aby ufać danym biur, popełniają błędy na rzecz ostrożności. Wynik jest przewidywalny: zwiększona liczba odrzuceń, zawężone limity, zwiększone ceny lub całkowite wykluczenie.
Ci kredytobiorcy niekoniecznie są bardziej ryzykowni; po prostu system jest głuchy i ślepy na sygnały, które faktycznie charakteryzują ich życie finansowe. Podstawowa koncepcja zastosowania AI do scoringowania kredytowego jest tutaj prosta. Tam, gdzie statystyki biur są niewystarczające lub zbyt skąpe, należy szukać gdzie indziej. We współczesnym życiu istnieje wiele cyfrowych śladów. Kiedy takie ślady są gromadzone w odpowiedzialny sposób za zgodą i przekształcane w bardziej uporządkowane sygnały, mogą wiele powiedzieć o stabilności osoby, jej potencjale zarobkowym i szansach na spłatę. Jednym z pierwszych i najbardziej wartościowych źródeł są często dane telekomunikacyjne. Operatorzy mobilni rozumieją, jak ktoś regularnie doładowuje salda przedpłacone, czy używa tego samego numeru przez lata, czy często go zmienia, czy jest stabilny, czy przypadkowy w swojej aktywności oraz czy nabywa pakiety danych tego samego rozmiaru. Osoba, która utrzymuje jeden numer przez długi czas, doładowuje numer i wykazuje spójne wzorce wykorzystania, jest generalnie bardziej zakorzeniona w społeczności i bardziej konsekwentna w swoim zachowaniu w porównaniu z kimś, kto rezygnuje lub waha się w wykorzystaniu. Czy istnieje stabilność, jest związane ze zmniejszonym ryzykiem kredytowym.
Innym źródłem siły jest e-commerce i dane z platform cyfrowych. W akcie biura kierowcy świadczącego usługi przewozu można zawrzeć niewiele, ale platforma może uzyskać dostęp do liczby przejazdów, dochodu tygodniowego, danych o anulowaniach, recenzji klientów i czasu trwania działalności kierowcy. Mikro-sprzedawca jako sprzedawca na rynku pozostawia za sobą historię zrealizowanych zamówień, dokonanych zwrotów, zgłoszonych reklamacji, braków magazynowych i wzorców wzrostu. W przypadku nieformalnych przedsiębiorstw dane platformy mogą być wykorzystywane jako najbliższy odpowiednik oficjalnych sprawozdań finansowych. Następnie istnieje konto bankowe, portfel cyfrowy i dane dotyczące przepływów pieniężnych z API open banking. Chociaż kredytobiorca może nie mieć długiej historii kredytowej, zwykle posiada konto, na które wpływa wynagrodzenie, dochód ze zleceń, przekazy lub przychody biznesowe. Poprzez analizę wpływów i wypływów w czasie pożyczkodawcy mogą oszacować powszechny dochód, jego zmienność, czy posiada bufory czy nie oraz jaka część dochodu została już przydzielona na stałe wydatki, takie jak czynsz, media i istniejące długi. W przypadku kredytobiorcy o ograniczonym dostępie do usług bankowych, ocena przepływów pieniężnych jest często bardziej wiarygodna niż tradycyjna karta wyników, która opiera się tak bardzo na przeszłych pożyczkach. Kolejną warstwę zapewniają API płacowe i zatrudnieniowe.
W sytuacjach, gdy pracodawcy są połączeni z usługami płacowymi, pożyczkodawcy są w stanie potwierdzić zatrudnienie, miesięczne zarobki, czas trwania zatrudnienia i zmiany wynagrodzenia. Dla tych z kilkoma pracami w niepełnym wymiarze godzin, ten złożony obraz będzie znacznie bardziej informacyjny niż jeden odcinek wypłaty. Wreszcie, przy właściwym użyciu, dane behawioralne i na poziomie urządzenia mogą być wykorzystywane do wspierania zarówno oszustw, jak i oceny ryzyka. Czas, przez jaki osoba korzysta z tego samego urządzenia, regularność ich lokalizacji logowania, jak korzystają z aplikacji przez miesiące, a także pora dnia, w której zwykle dokonują transakcji, mogą dostarczać wskaźników autentyczności i stabilności. Te sygnały powinny być obsługiwane ostrożnie, aby zapobiec dyskryminacji pośredniej, chociaż mogą być przydatnym wsparciem. Wszystkie te źródła są połączone tym, że opowiadają o prawdziwym życiu osoby i jak on/ona żyje, jak zarabia i płaci, nawet gdy jest jasne, że on/ona nigdy nie dotknął/a karty kredytowej w swoim życiu.
\
Te inne źródła danych są gęsto zaludnione i nieuporządkowane. Struktura logów telekomunikacyjnych, zdarzeń platformy, transakcji bankowych i telemetrii urządzenia nie jest taka jak tradycyjny raport biura. Są głośne, wymiarowe i wypełnione wzorcami idiosynkrazji. W tym momencie AI, w szczególności nowoczesne uczenie maszynowe, jest niezbędne. Powszechny cykl życia rozpoczyna się od agregacji danych. Pożyczkodawcy mają dostęp do partnerów telekomunikacyjnych, kanałów open banking, API płacowych i partnerów platformowych pod warunkiem przestrzegania przepisów o ochronie danych i bezpośredniej zgody klientów.
Absorbują surowe dane w bezpiecznych środowiskach i normalizują je. Działania związane z doładowaniem telefonu, kredytem portfela i zamówieniami e-commerce są konwertowane na szeregi czasowe o regularnych formatach. Niepotrzebne anomalie i duplikaty są eliminowane, a brakujące wartości są przetwarzane. Z tego specjaliści ds. danych konstruują cechy. Tworzą zmienne podsumowujące, zamiast po prostu wrzucać wszystkie surowe transakcje do modelu: średni miesięczny przepływ pieniężny netto; udział miesięcy, w których oszczędności są dodatnie; najdłuższy kolejny okres braku płatności dla wierzycieli; miesiące niedochodów; wzrost lub spadek zarobków platformy; zmienność godzin pracy; stałość lokalizacji tydzień po tygodniu.
Te atrybuty próbują ścisnąć życie gospodarcze jednostki w liczby, które mogą zostać przetrawione przez model. Drzewa gradient boosting, lasy losowe i sieci neuronowe są następnie algorytmami uczenia maszynowego, które są trenowane na danych historycznych, gdzie wynik jest już znany. W przypadku scoringowania kredytowego wynikiem jest zwykle niewywiązanie się kredytobiorcy z zobowiązań w określonym okresie czasu, powiedzmy sześciu lub dwunastu miesięcy. Model poznaje kombinacje cech, które wskazują na większe lub mniejsze ryzyko. Wzorce znalezione wśród ludzkich underwriterów nie zostałyby zidentyfikowane przez ludzką roztropność, takie jak drobne interakcje między zmiennościami przepływów pieniężnych a czasem korzystania z platformy. Walidacja jest krytyczna. Model jest stosowany do danych, na których nie był trenowany, tak aby jego wydajność była rzeczywista, a nie wynikiem nadmiernego dopasowania.
Miary takie jak AUC, współczynnik Giniego i statystyki Kołmogorowa-Smirnowa są wykorzystywane do mierzenia mocy dyskryminacji, podczas gdy wykresy kalibracji wskazują, czy przewidywane prawdopodobieństwa są identyczne z rzeczywistymi wskaźnikami niewypłacalności. Oprócz głównych liczb, pożyczkodawcy muszą patrzeć na wydajność w oparciu o segment: nowi kredytobiorcy w porównaniu z doświadczonymi kredytobiorcami, różne zawody, regiony i przedziały dochodowe. Po wdrożeniu model będzie następnie oceniał nowych wnioskodawców w locie, a odpowiedź zostanie udzielona w ciągu kilku sekund. Proces nie może się tam zakończyć. Statystyki zmieniają się z czasem, platformy ewoluują swoje polityki, a makroekonomia ewoluuje.
\
:::tip Ten artykuł został rozpowszechniony jako wydanie przez Sanya Kapoor w ramach HackerNoon's Business Blogging Program.
:::
\



