近日,eBay的工作人員發布文章稱,eBay運用新技術可識別出四成的信用卡欺詐。
在美國,信用卡欺詐比你想象的更常見。2014年的1760萬起身份盜竊案件中,86%的受害者報告了與現有信用卡或銀行賬戶有關的欺詐行為。事實上,美國聯邦貿易委員會表示,信用卡欺詐是美國最常見的身份盜用形式,每年報告的案件超過130,000起。

eBay人工智能可識別出四成的信用卡欺詐
eBay的人工智能可以識別出40%的信用卡欺詐
自動檢測可疑用卡模式的方法并不是什么新鮮事,但eBay的研究人員在Arxiv.org上發表的一篇新論文(《電子商務中的信用卡欺詐檢測:異常檢測方法》)中描述了一種尖端技術。他們使用了一種經過訓練的算法來識別與交易和支付有關的 良好行為 ,并標記出異常行為。
研究人員寫道: 欺詐和垃圾郵件檢測等任務的挑戰通常在于缺乏培養合適的監督學習模型所需的所有模式。如果這些模式還隨著時間而變化,問題就會更加突出……有限的數據和不斷變化的模式使得學習變得非常困難。我們假設良好行為不隨時間變化,表示良好行為的數據點在不同分組下具有一致性。
研究人員利用聚類方法——用于識別數據集中類似對象組的方法來使用不同的參數。在每次訓練運行中將每個數據點分配給一個集群,并對該集群產生數學表示(矢量),以構成數據點的不同 指紋 ,組合成它的唯一簽名。
為了生成表示 良好行為 (即一致性)的簽名,團隊將每個數據點向量組合在一起,并根據相應集群的大小對其進行加權,得到0到1之間的一個分數。低一致性——得分接近0——就對應著異常行為。
與傳統人工智能欺詐檢測相比,這種方法有幾個優點。它不需要事先了解異常值或內點;基礎算法都是高度可擴展的并且是通用的;它幾乎可以應用于任何聚類問題,包括醫學領域的問題。
該團隊使用了數據科學平臺Kaggle公開的信用卡數據庫來測試他們的方法,這一數據集包含了2013年9月份歐洲信用卡持有人在兩天內的交易數據,總共有284,807筆交易樣本,其中有492個欺詐樣本。在運行了十次之后,該算法能夠識別出40%的欺詐案例。結果并不完美,它誤判了29筆合法交易——但是考慮到數據點的數量巨大,這是一個 巨大的收獲 。
我們的技術非常有用, 我們可以再284,807個樣本中安全地排除139,220筆交易。 研究人員表示,它在電子商務平臺識別欺詐交易方面非常成功,但是由于數據集的保密性,報告中無法列出這些結果。
如果這中最新算法能夠完善普及,人們的信用卡交易就會變得更安全。