Перш ніж ми це зрозуміємо, ми повинні знати кілька слів про алгоритми машинного навчання. Алгоритми машинного навчання можуть використовуватися в різних алгоритмах навчання, таких як контрольоване навчання, неконтрольоване навчання або обидва. Алгоритми контрольованого навчання використовують дані з мітками, щоб вивчати закономірності та робити прогнози, тоді як алгоритми неконтрольованого навчання визначають аномалії або кластери з даними без попередніх міток. Кілька моделей можна навчити одночасно фіксувати різні аспекти підозрілої діяльності.
Інженери машинного навчання Binance зазвичай використовують два типи конвеєрів. Вони пакетні та потокові.
Пакет: використовується для великих обсягів даних
Потокове передавання: середні дані в режимі реального часу, коли вони збираються. Це створює ситуації, які вимагають майже миттєвої реакції, як-от виявлення хакера перед зняттям коштів з будь-якого рахунку.
Вище обидва трубопроводи дуже важливі. Пакетний режим найкраще обробляє великі обсяги даних, тоді як потоковий режим краще забезпечує відповідь у реальному часі.
Припустімо, що для запобігання шахрайству потрібно визначити пріоритетність даних у реальному часі, щоб уникнути ситуації під назвою «Старість моделі».
Вплив застарілості
Якщо люди не отримають найновішу інформацію чи методи, моделі машинного навчання також можуть стати менш точними. Відповідно до цієї ситуації я б вважав за краще, щоб усі завжди тримали себе в курсі інформації чи методів.
Модель захоплення облікового запису (ATO).
Тренування моделі ATO для виявлення облікових записів, які нелегітимний користувач викрав зі зловмисною метою. Потім ця модель вимірює кількість транзакцій, здійснених за останню хвилину.
Хакери виконують такі дії.
1. Послідовний шаблон
2. Велика кількість операцій (Виведення коштів за короткий проміжок часу)
У цьому випадку система Binance розраховує цю функцію якнайшвидше на випадок потенційних загроз. Це означає, що за допомогою цієї моделі мінімізуються затримки між діями користувача та даними про діяльність користувача.
Для отримання додаткової інформації відвідайте
https://engineering.linkedin.com/blog/2022/near-real-time-features-for-near-real-time-personalization
Роль пакетного обчислення:
Важливість застарілих функцій може залежати від моделі. Деякі функції, наприклад, є відносно стабільними. У згаданому вище випадку ATO також потрібно буде отримати дані про зняття коштів користувачами за останні 30 днів, щоб розрахувати коефіцієнт на основі останніх транзакцій.
У цій ситуації пакетне обчислення протягом більш тривалих періодів часу, наприклад щоденних або щогодинних інтервалів, є прийнятним, незважаючи на більш високу застарілість через очікування надходження даних до сховищ даних і періодичного виконання пакетних завдань.
У цій статті деякі дані отримано з блогу Binance, тому, якщо ви хочете дізнатися більше, відвідайте блог Binance. #azuki #pepe #crypto2023 #DYOR