你的信用卡安全不?數據科學家怎麼破解信用卡欺詐?

 

 

 

我們現在經常用信用卡或者其他無現金的支付方式,或多或少的都會接觸到信用卡欺詐的事情。信用卡欺詐有兩大類,第一類就是持卡人故意欺詐,第二類是被壞人鑽了空子,盜用你的信用卡信息造成了損失(這個損失一般會由信用卡公司承擔)。我們這裏要討論的是第二類,就是被壞人鑽了空子的情況。

 

具體說一下財產損失的問題。至少在美國,法律非常保護消費者。法律規定,未授權的信用卡消費,持卡人最多承擔50美元。如果你丟了卡,在卡被盜用之前就及時知會信用卡公司,那麼你一點責任沒有。如果有人偷取你的信用卡號碼,而不是信用卡實體卡,你也完全不用負責。

 

信用卡欺詐的市場是巨大的,全球每年有200多億美元這樣的損失。因此給各大金融機構造成巨大的經濟負擔。

 

 

那麼這些欺詐是怎麼發生的呢? 據統計,通常是這些情況:

  • 小偷翻遍你的垃圾箱,查找包含你的帳號的廢棄收據或信用卡對帳單,然後使用該信息進行欺詐性收費。
  • 不道德的服務員(比如飯店)偷了你的卡號,然後刷卡去加勒比海度假。
  • 身份盜用者會將你引誘到一個欺詐性網站,在網站中騙你提供卡號。
  • 你可能在ATM機或加油站刷卡,但可能有人會安裝信用卡讀取器來竊取你的帳戶信息,這種方法屢試不爽。
  • 你的信用卡號可能會因爲你最喜歡網上購物商數據泄露而丟失。
  • 盜賊經常在暗網上購買被盜的信用卡號,這些暗網只能通過特殊軟件訪問。信用卡號碼對小偷來說很有價值,而且他們也不怕訪問非法的暗網市場來獲取它們。
  • 你家中的某個人(居民,訪客,或技術服務人員)可能會設法訪問你的信用卡。該人可能會欺詐性地使用你的信用卡信息。

怎麼樣,是不是覺得有些防不勝防?

幸運的是,銀行,信用卡公司,或者金融公司是不會眼睜睜看着小偷來偷錢的。每個公司背後都有一堆的數據科學家和這些欺詐分子鬥智鬥勇。

舉個例子,下圖展示了幾筆信用卡消費記錄,你能看出其中的問題嗎?

如上圖所示,你可以已經發現,最讓人懷疑的情況就是: 上午902分鐘在波士頓劃了一次實體卡,8分鐘後就去了紐約又刷了一次實體卡。二者之間隔了幾百公里!上面列的交易方式 magnetic(磁條)意味着這不是網上消費。

1.

上訴的情況給了數據科學家一個提示,就是我們可以根據歷史交易情況,用聚合的方式創造出許多特徵,用來幫助模型判斷交易是否涉嫌欺詐。

按照時間方式來聚合

•過去一週,兩週或xx周內,每筆交易的平均或最高金額

•過去一週,兩週或xx周每天的平均支出或最高支出金額
•過去一週,兩週或xx周內按商家類別劃分的平均或最高金額

按照商家類型來聚合

30天之內每天在與該交易相同的商家類型上進行的所有交易中平均每天花費的金額

•過去30天內與同一商家的交易總數

•在過去3個月中,此交易在同一商家類型上的1周內平均消費金額

按照商家地址和消費時間來聚合

•過去一週,兩週或xx周的每天消費商家數量以及兩個不同地點商家消費間隔時間,

•在過去一週,兩週或xx周內,兩個商家地點之間交易的最小分鐘數,

按照交易方式來聚合

磁條方式比芯片或者密碼方式都跟容易被欺詐。

•過去一週,兩週或xx周,每天按交易方式得出的平均金額,

•過去的一週,兩週或xx周內,每天採用交易方式進行的交易次數,

 

2.

數據科學家可以採用的另一種特徵提取方式是更加細化的方式。因爲深度學習等建模方式的引起,使得我們的模型可以處理更多的特徵變量。

總的原則是按照R-F-M:

Recency近度-自上次購買以來經過的時間

Frequency頻率-交易總數

Monetary貨幣-平均交易量

以近度爲例:可以對客戶的每一筆交易的這些維度提取特徵,包括同一個消費商家,同一個商家類別,同一個國家或者同一種貨幣。相同的方法可以用在頻率和貨幣方式上。可以想象,這樣的組合方式有多種。但是結合實當的AI模型,這種特徵提取方法也學與才能能力更加強大。

 

更多精彩文章,請關注我(gongzhonghao):

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章