Les chercheurs du MIT ont utilisé une nouvelle technique d'apprentissage automatique pour réduire considérablement les faux positifs dans les technologies de détection de fraude. Crédit :Chelsea Turner
Avez-vous déjà utilisé votre carte de crédit dans un nouveau magasin ou dans un nouveau magasin pour la voir refusée ? Une vente a-t-elle déjà été bloquée parce que vous avez facturé un montant plus élevé que d'habitude ?
Les cartes de crédit des consommateurs sont étonnamment souvent refusées lors de transactions légitimes. L'une des causes est que les technologies de détection de fraude utilisées par la banque d'un consommateur ont signalé à tort la vente comme suspecte. Maintenant, les chercheurs du MIT ont utilisé une nouvelle technique d'apprentissage automatique pour réduire considérablement ces faux positifs, économiser de l'argent aux banques et atténuer la frustration des clients.
L'utilisation de l'apprentissage automatique pour détecter la fraude financière remonte au début des années 90 et a progressé au fil des ans. Les chercheurs entraînent des modèles pour extraire des modèles de comportement des transactions passées, appelé « caractéristiques, " qui signalent une fraude. Lorsque vous glissez votre carte, la carte envoie un ping au modèle et, si les caractéristiques correspondent à un comportement frauduleux, la vente est bloquée.
Dans les coulisses, cependant, les data scientists doivent imaginer ces fonctionnalités, qui se concentrent principalement sur des règles générales pour le montant et l'emplacement. Si un client donné dépense plus que, dire, 2 $, 000 sur un achat, ou effectue de nombreux achats dans la même journée, ils peuvent être signalés. Mais comme les habitudes de consommation varient, même dans les comptes individuels, ces modèles sont parfois inexacts :un rapport de 2015 de Javelin Strategy and Research estime que seule une prédiction de fraude sur cinq est correcte et que les erreurs peuvent coûter à une banque 118 milliards de dollars en pertes de revenus, car les clients refusés s'abstiennent alors d'utiliser cette carte de crédit.
Les chercheurs du MIT ont développé une approche « d'ingénierie automatisée des fonctionnalités » qui extrait plus de 200 caractéristiques détaillées pour chaque transaction individuelle, par exemple :si un utilisateur était présent lors des achats, et le montant moyen dépensé certains jours chez certains fournisseurs. En faisant cela, il peut mieux identifier quand les habitudes de dépenses d'un titulaire de carte spécifique s'écartent de la norme.
Testé sur un jeu de données de 1,8 million de transactions d'une grande banque, le modèle a réduit les prédictions faussement positives de 54 % par rapport aux modèles traditionnels, ce qui, selon les chercheurs, aurait pu sauver la banque 190, 000 euros (environ 220 $, 000) en perte de revenus.
"Le grand défi de cette industrie, ce sont les faux positifs, " dit Kalyan Veeramachaneni, chercheur principal au Laboratoire des systèmes d'information et de décision (LIDS) du MIT et co-auteur d'un article décrivant le modèle, qui a été présenté lors de la récente Conférence européenne pour l'apprentissage automatique. « Nous pouvons dire qu'il existe un lien direct entre l'ingénierie des fonctionnalités et la [réduction] des faux positifs. … C'est la chose la plus efficace pour améliorer la précision de ces modèles d'apprentissage automatique. »
Les co-auteurs de l'article sont :l'auteur principal Roy Wedge, un ancien chercheur du Data to AI Lab du LIDS; James Max Kanter '15, SM '15 ; et Santiago Moral Rubio et Sergio Iglesias Perez de Banco Bilbao Vizcaya Argentaria.
Extraire des fonctionnalités « profonds »
Il y a trois ans, Veeramachaneni et Kanter ont développé Deep Feature Synthesis (DFS), une approche automatisée qui extrait des caractéristiques très détaillées de toutes les données, et a décidé de l'appliquer aux transactions financières.
Les entreprises organisent parfois des compétitions où elles fournissent un ensemble de données limité ainsi qu'un problème de prédiction tel que la fraude. Les data scientists développent des modèles de prédiction, et un prix en argent va au modèle le plus précis. Les chercheurs ont participé à l'un de ces concours et ont obtenu les meilleurs scores avec DFS.
Cependant, ils ont réalisé que l'approche pouvait atteindre son plein potentiel si elle était formée sur plusieurs sources de données brutes. « Si vous regardez les données publiées par les entreprises, c'est un tout petit morceau de ce qu'ils ont réellement, " dit Veeramachaneni. "Notre question était, « Comment appliquons-nous cette approche aux entreprises réelles ? »"
Soutenu par le programme Data-Driven Discovery of Models de la Defense Advanced Research Projects Agency, Kanter et son équipe de FeatureLabs, une entreprise dérivée qui commercialise la technologie, ont développé une bibliothèque open source pour l'extraction automatisée de fonctionnalités, appelé Featuretools, qui a été utilisé dans cette recherche.
Les chercheurs ont obtenu un ensemble de données sur trois ans fourni par une banque internationale, qui comprenait des informations granulaires sur le montant de la transaction, fois, Emplacements, types de fournisseurs, et terminaux utilisés. Il contenait environ 900 millions de transactions provenant d'environ 7 millions de cartes individuelles. Parmi ces opérations, vers 122, 000 ont été confirmés comme fraude. Les chercheurs ont formé et testé leur modèle sur des sous-ensembles de ces données.
Dans la formation, le modèle recherche des modèles de transactions et parmi les cartes qui correspondent à des cas de fraude. Il combine ensuite automatiquement toutes les différentes variables qu'il trouve dans des fonctionnalités "profondes" qui fournissent un aperçu très détaillé de chaque transaction. À partir du jeu de données, le modèle DFS a extrait 237 caractéristiques pour chaque transaction. Ceux-ci représentent des variables hautement personnalisées pour les détenteurs de cartes, dit Veeramachaneni. "Dire, vendredi, il est courant qu'un client dépense 5 $ ou 15 $ chez Starbucks, " dit-il. " Cette variable ressemblera à, « Combien d'argent a été dépensé dans un café un vendredi matin ? »"
Il crée ensuite un arbre de décision si/alors pour ce compte de fonctionnalités qui indiquent et ne pointent pas vers la fraude. Lorsqu'une nouvelle transaction est exécutée dans l'arbre de décision, le modèle décide en temps réel si la transaction est frauduleuse ou non.
Face à un modèle traditionnel utilisé par une banque, le modèle DFS généré environ 133, 000 faux positifs contre 289, 000 faux positifs, environ 54 pour cent moins d'incidents. Cette, avec un plus petit nombre de faux négatifs détectés - une fraude réelle qui n'a pas été détectée - pourrait sauver la banque environ 190, 000 euros, estiment les chercheurs.
Empiler des primitives
L'épine dorsale du modèle se compose de « primitifs, " des fonctions simples qui prennent deux entrées et donnent une sortie. Par exemple, calculer une moyenne de deux nombres est une primitive. Cela peut être combiné avec une primitive qui regarde l'horodatage de deux transactions pour obtenir un temps moyen entre les transactions. L'empilement d'une autre primitive qui calcule la distance entre deux adresses à partir de ces transactions donne un temps moyen entre deux achats à deux emplacements spécifiques. Une autre primitive pourrait déterminer si l'achat a été effectué un jour de semaine ou un week-end, etc.
"Une fois que nous avons ces primitives, rien ne nous empêche de les empiler… et vous commencez à voir ces variables intéressantes auxquelles vous n'aviez pas pensé auparavant. Si vous creusez profondément dans l'algorithme, les primitifs sont la sauce secrète, " dit Veeramachaneni.
Une caractéristique importante que le modèle génère, Notes de Veeramachaneni, calcule la distance entre ces deux endroits et s'ils se sont produits en personne ou à distance. Si quelqu'un qui achète quelque chose à, dire, le Centre Stata en personne et, une demi-heure plus tard, achète quelque chose en personne à 200 milles de distance, alors c'est une forte probabilité de fraude. Mais si un achat a eu lieu via un téléphone mobile, la probabilité de fraude diminue.
« Il y a tellement de caractéristiques que vous pouvez extraire qui caractérisent les comportements que vous voyez dans les données passées qui se rapportent à des cas d'utilisation frauduleux ou non frauduleux, " dit Veeramachaneni.
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.