Avant de comprendre cela, nous connaîtrions quelques mots sur les algorithmes d'apprentissage automatique. Les algorithmes d'apprentissage automatique peuvent être utilisés dans divers algorithmes d'apprentissage, tels que l'apprentissage supervisé, l'apprentissage non supervisé ou les deux. Les algorithmes d'apprentissage supervisé utilisent des données étiquetées pour apprendre des modèles et faire des prédictions, tandis que les algorithmes d'apprentissage non supervisé identifient les anomalies ou les clusters avec les données sans étiquettes préexistantes. Plusieurs modèles peuvent être entraînés simultanément pour capturer différents aspects des activités suspectes.

Les ingénieurs de Binance Machine Learning utilisent généralement deux types de pipelines. Ce sont des lots et des flux.

Batch : est utilisé pour de gros volumes de données

Streaming : données moyennes en temps réel au fur et à mesure de leur collecte. Cela crée des situations qui nécessitent une réponse quasi instantanée, comme la détection d'un pirate informatique avant de retirer des fonds d'un compte.

Au-dessus des deux pipelines, c'est très important. Les lots sont plus efficaces pour gérer de grandes quantités de données, tandis que le streaming est plus efficace pour fournir une réponse en temps réel.

Supposons que la prévention de la fraude doit donner la priorité aux données en temps réel pour éviter une situation appelée « obsolescence du modèle ».

Impact de l'obsolescence

Si les gens ne se tiennent pas au courant des dernières informations ou techniques, les modèles d’apprentissage automatique peuvent également devenir moins précis. Selon cette situation, je préférerais que chacun se tienne toujours au courant des informations ou des techniques.

Modèle de prise de contrôle de compte (ATO).

ATO Model s’entraîne pour identifier les comptes qu’un utilisateur illégitime a détournés avec un objectif malveillant. Ensuite, ce modèle mesure le nombre de transactions effectuées au cours de la dernière minute.

Les pirates suivent ces étapes.

1.     Modèle séquentiel

2.     Nombre élevé d'opérations (retraits dans un court laps de temps)

Dans cette condition, Binance System calcule cette fonctionnalité dès que possible en cas de menaces potentielles. Cela signifie que minimiser les délais entre l'action de l'utilisateur et les données d'activité de l'utilisateur est traité via ce modèle.

Pour plus d'informations, visitez

https://engineering.linkedin.com/blog/2022/near-real-time-features-for-near-real-time-personalization

Rôle du calcul par lots :

L’importance de l’obsolescence des fonctionnalités peut dépendre du modèle. Certaines fonctionnalités, par exemple, sont relativement stables. Dans le cas ATO mentionné ci-dessus, il faudrait également récupérer les données sur les retraits de l’utilisateur au cours des 30 derniers jours pour calculer un ratio basé sur ses transactions les plus récentes.

Dans cette situation, le calcul par lots sur des périodes plus longues, telles que des intervalles quotidiens ou horaires, est acceptable malgré l'obsolescence plus élevée résultant de l'attente de l'arrivée des données dans les entrepôts de données et de l'exécution périodique des tâches par lots.

Dans cet article, certaines données extraites du blog Binance, donc si vous souhaitez en savoir plus en détail, visitez simplement le blog Binance. #azuki #pepe #crypto2023 #DYOR