在理解這一點之前,我們需要對機器學習算法有一些瞭解,機器學習算法可用於各種學習算法,例如監督學習、無監督學習或兩者兼有。監督學習算法使用標記數據來學習模式並進行預測,而無監督學習算法則使用沒有預先存在的標籤的數據來識別異常或聚類。可以同時訓練多個模型來捕捉可疑活動的不同方面。
幣安機器學習工程師通常使用兩種類型的管道。它們是批處理和流式處理。
批處理:用於大量數據
流式傳輸:實時收集數據。這使得需要近乎即時響應的情況成爲可能,例如在從任何賬戶提取資金之前檢測出黑客。
以上兩個管道都很重要。批處理最適合處理大量數據,而流式處理更適合提供實時響應。
假設爲了預防欺詐,它需要優先考慮實時數據以避免出現稱爲“模型陳舊”的情況。
過期的影響
如果人們不瞭解最新的信息或技術,機器學習模型也會變得不那麼準確。鑑於這種情況,我希望每個人都能隨時瞭解最新信息或技術。
賬戶接管(ATO)模型。
ATO 模型訓練識別非法用戶出於惡意目的劫持的賬戶。然後該模型測量過去一分鐘內進行的交易數量。
黑客遵循以下步驟。
1. 序列模式
2. 操作次數多(短時間內提款)
在這種情況下,幣安系統會在潛在威脅發生時儘快計算該特徵。這意味着通過該模型處理用戶操作和用戶活動數據之間的延遲最小化。
如需瞭解更多信息,請訪問
https://engineering.linkedin.com/blog/2022/near-real-time-features-for-near-real-time-personalization
批量計算角色:
特徵陳舊性的重要性取決於模型。例如,某些特徵相對穩定。在上面提到的 ATO 案例中,它還需要檢索用戶過去 30 天內的提款數據,以根據他們最近的交易計算比率。
在這種情況下,雖然等待數據到達數據倉庫以及等待批處理作業定期運行會導致更高的過期時間,但較長時間段(例如每日或每小時間隔)的批處理計算是可以接受的。
本文中的一些數據取自幣安博客,因此如果您想了解更多詳細信息,請訪問幣安博客。#azuki #pepe #crypto2023 #DYOR