Прежде чем мы это поймем, нам нужно знать несколько слов об алгоритмах машинного обучения. Алгоритмы машинного обучения могут использоваться в различных алгоритмах обучения, таких как обучение с учителем, обучение без учителя или и то, и другое. Алгоритмы контролируемого обучения используют размеченные данные для изучения закономерностей и прогнозирования, в то время как алгоритмы неконтролируемого обучения выявляют аномалии или кластеры с данными без заранее существовавших меток. Несколько моделей могут быть обучены одновременно для выявления различных аспектов подозрительной деятельности.

Инженеры по машинному обучению Binance обычно используют два типа конвейеров. Это пакетная и потоковая передача.

Пакетная обработка: используется для больших объемов данных.

Потоковая передача: средние данные в реальном времени по мере их сбора. Это создает ситуации, требующие почти мгновенного реагирования, например, обнаружение хакера перед выводом средств с любого счета.

Над обоими трубопроводами очень важно. Пакетная обработка лучше всего подходит для обработки больших объемов данных, а потоковая передача лучше обеспечивает ответ в реальном времени.

Предположим, что для предотвращения мошенничества необходимо расставить приоритеты в отношении данных в реальном времени, чтобы избежать ситуации, называемой «устареванием модели».

Влияние устаревания

Если люди не будут в курсе новейшей информации или методов, модели машинного обучения также могут стать менее точными. В этой ситуации я бы предпочел, чтобы каждый всегда был в курсе информации и техник.

Модель захвата аккаунта (ATO).

Модель ATO обучает выявлять учетные записи, которые незаконные пользователи взломали со злонамеренными целями. Затем эта модель измеряет количество транзакций, совершенных за последнюю минуту.

Хакеры следуют этим шагам.

1.     Последовательный шаблон

2.     Большое количество операций (Вывод средств за короткий период времени)

В этом случае система Binance как можно скорее рассчитает эту функцию на случай потенциальных угроз. Это означает, что с помощью этой модели сводятся к минимуму задержки между действиями пользователя и данными об активности пользователей.

Для получения дополнительной информации посетите

https://engineering.linkedin.com/blog/2022/near-real-time-features-for-near-real-time-personalization

Роль пакетных вычислений:

Важность устаревания функций может зависеть от модели. Некоторые функции, например, относительно стабильны. В упомянутом выше случае ATO также потребуется получить данные о снятии средств пользователем за последние 30 дней, чтобы рассчитать коэффициент на основе его последних транзакций.

В этой ситуации пакетные вычисления в течение более длительных периодов времени, таких как ежедневные или ежечасные интервалы, приемлемы, несмотря на более высокую степень устаревания, возникающую из-за ожидания поступления данных в хранилища данных и периодического выполнения пакетных заданий.

В этой статье некоторые данные взяты из блога Binance, поэтому, если вы хотите узнать больше, просто посетите блог Binance. #azuki #pepe #crypto2023 #DYOR