Než to pochopíme, měli bychom vědět pár slov o algoritmech strojového učení. Algoritmy strojového učení lze použít v různých algoritmech učení, jako je učení pod dohledem, učení bez dozoru nebo obojí. Algoritmy učení pod dohledem používají označená data k učení vzorců a vytváření předpovědí, zatímco algoritmy učení bez dozoru identifikují anomálie nebo shluky dat bez předem existujících značek. Pro zachycení různých aspektů podezřelé aktivity lze trénovat více modelů současně.
Inženýři strojového učení Binance obvykle používají dva typy potrubí. Jsou to Batch a Streaming.
Dávka: používá se pro velké objemy dat
Streamování: Průměrná data v reálném čase, jak jsou shromažďována. To vytváří situace, které vyžadují téměř okamžitou reakci, jako je odhalení hackera před výběrem prostředků z jakéhokoli účtu.
Nad oběma potrubími velmi důležité. Dávkové jsou nejlepší pro zpracování velkého množství dat, zatímco Streaming je lepší pro poskytování odezvy v reálném čase.
Předpokládejme, že jde o prevenci podvodů, musí upřednostňovat data v reálném čase, aby se předešlo situaci zvané „zastaralost modelu“.
Dopad zatuchliny
Pokud lidé nemají aktuální informace nebo techniky, modely strojového učení mohou být také méně přesné. Vzhledem k této situaci bych byl raději, kdyby se každý neustále aktualizoval informacemi nebo technikami.
Model převzetí účtu (ATO).
ATO Model vlak k identifikaci účtů, které nelegitimní uživatel unesen se zlým cílem. Tento model pak měří počet transakcí, které jsou provedeny za poslední minutu.
Hackeři postupují podle těchto kroků.
1. Sekvenční vzor
2. Vysoký počet operací (výběry v krátkém časovém období)
V tomto stavu Binance System vypočítá tuto funkci co nejdříve v případě potenciálních hrozeb. Znamená to minimalizovat prodlevy mezi akcí uživatele a údaje o aktivitě uživatele jsou zpracovávány tímto modelem.
Pro další informace navštivte
https://engineering.linkedin.com/blog/2022/near-real-time-features-for-near-real-time-personalization
Role dávkového počítání:
Význam zastaralosti prvku může záviset na modelu. Některé funkce jsou například relativně stabilní. Ve výše uvedeném případě ATO by také potřeboval získat data o výběrech uživatele za posledních 30 dní, aby vypočítal poměr na základě jeho posledních transakcí.
V této situaci je dávkové počítání v delších časových obdobích, jako jsou denní nebo hodinové intervaly, přijatelné i přes vyšší zastaralost vyplývající z čekání na příchod dat do datových skladů a na pravidelné spouštění dávkových úloh.
V tomto článku jsou některá data získaná z Binance Blogu, takže pokud se chcete dozvědět více podrobností, navštivte Binance Blog. #azuki #pepe #crypto2023 #DYOR