Les entreprises d’IA naviguent dans les zones grises juridiques pour les données de formation

En discutant du récent débat sur la manière dont Open et Google font correspondre leurs données en tant que modèle, vous remarquerez que deux termes dominent davantage le débat : open et Google. Les articles publiés récemment dans le Wall Street Journal et le NY Times illustrent que la façon dont les entreprises liées à l'IA collectent les données n'était pas à la hauteur et a créé un casse-tête quant à savoir quelles données sont vraies et quel angle éthique a été utilisé pour créer le système lié à l'IA. .
Les tactiques douteuses d’OpenAI
Cependant, à son apogée, le New York Times a souligné les résultats plus importants de l’Open AI présentés avec Whisper. Ce modèle de transcription audio-texte est avancé en complément de la technologie LP-4 du processeur de langage Open AI. En effet, la voiture autonome d'OpenAI ne se contente pas de la collecte d'informations, ce qui est une question difficile à laquelle l'entreprise s'adresse ; c’est plutôt cette dernière qui entre en jeu dans de telles conditions.
Bien que la popularité initiale des lois sur la collecte de données soit liée aux considérations de droit d’auteur d’utilisation équitable, ces dernières sont également devenues une base juridique pour ces lois. Comme l'a dit Brockman, l'un des membres fondateurs et PDG d'OpenAI a fourni certaines informations nécessaires à la transcription. Mais il ajoute que l’historien a également contribué à la transcription.
Cependant, Google Corporation occupe le devant de la scène même pour ces petits problèmes dans des entreprises plus grandes comme celle-ci, c'est-à-dire qu'une fonction de collecte de données comme OpenAI est une organisation plus petite et s'engage dans des projets orientés vers le géant de l'industrie, et l'utilisateur a seulement été averti. et on n'a pas dit qui devait être blâmé par YouTube.
Outre cette approche, Facebook a également couvert la base de conformité aux CGU et interdit les actions non autorisées, en particulier ce qu'on appelle le grattage de données. Dans le cas de John Conly (porte-parole de YouTube), il a répondu à la question de savoir si les modèles étaient utilisés pour la formation à l'IA basée sur le contenu après avoir collecté des données auprès des créateurs de contenu.
Au contraire. Ainsi que les machines d'entraînement de quel côté Meta est un problème actuel conduisant à son infaisabilité. Le groupe IA de l'entreprise, qui a réussi la rivalité OpenAI, a considéré que les deux équipes ont utilisé tous les moyens disponibles pour travailler à un meilleur résultat pour leurs entreprises, y compris une réflexion originale sans prêter attention à aucun sujet en faveur de la partie rejetée.
Meta semble avoir préparé des types de questions auxquelles ils cherchaient à obtenir une réponse sur le travail délégué qui serait effectué, qui serait chargé d'acheter des livres auprès desquels les éditeurs se spécialiseraient dans des domaines spécifiques. Bien que l’expérience utilisateur du réseau soit extrêmement étonnante, la politique gouvernementale établie a pris l’initiative de s’immiscer dans la vie privée des individus, comme l’a souligné en 2018 l’affaire Cambridge Analytica.
Le paysage plus large de la formation en IA est confronté à un dilemme pressant : d’un côté, la question de la pénurie de données est devenue plus aiguë ces dernières années, de l’autre. Bien que le lien entre les deux demeure, les chercheurs insistent toujours pour disposer de données adéquates pour une précision accrue et une augmentation des performances.
En outre, la prédiction du Wall Street Journal suscite l'enthousiasme, qui projette des élévations au-delà de tous les objectifs jusqu'à l'année 2020 antérieure et traverse la fin de l'année avec le point le plus élevé du marché. Cette méthode repose sur deux facteurs : le recours aux modèles, qui peuvent être synthétiques pour énoncer une matrice externe, et un curriculum de processus décisionnel, où les modèles apprennent de leurs décisions. Ne vous attendez pas à ce qu’ils produisent des résultats, mais permettez-leur d’être observables.
Implications juridiques et éthiques
L'absence de règle de piratage pourrait créer des problèmes car rien ne peut permettre aux utilisateurs d'accéder aux éléments protégés par le droit d'auteur, et une compréhension de la mission pourrait survenir autour de la loi, de l'éthique, etc. Les données deviennent-elles une propriété intangible et la base pour savoir et déclarer ce qui vous appartient et ce qui vous appartient ? ce n'est pas le cas, dans lequel les données et les utilisateurs sont connus pour être la source de l'activité lorsque l'utilisation de ces données est injustifiée ? Ce risque serait pour les responsables du programme de l’équipe R&D de se concentrer sur leur examen et l’élaboration de réponses.
La relation dans l’objectif des campagnes de recours collectifs impliquerait que la confidentialité et l’utilisation des données soient des réponses que l’organisation ne connaît pas suffisamment pour légitimer ses opérations. En effet, les défis (tels que les questions éthiques concernant le processus d'exploration de données utilisé pour la recherche et le développement de l'IA) se compliquent car nous devons tenir compte des restrictions réglementaires et de la confidentialité des données (puisque la nature des données s'inscrit dans le contexte de la manière dont les données sont traitées et utilisées).
La compétition la plus rude du futur en matière d’IA réside dans l’identification des meilleures données pour la formation des systèmes d’IA, et plus encore, dans la question de savoir si ces données seront soumises à des cadres réglementaires éthiques ou juridiques communs. Tout ce qui concerne l'IA, dans sa nature même, met l'accent et élargit des concepts tels que l'innovation et la mise en œuvre au moyen de filtres d'ensembles de données pour les entreprises.
Être une intelligence artificielle technologique n'est jamais statique, le principal problème sera donc toujours l'utilisation des données, et cela continuera d'être l'une des priorités des membres de la communauté qui prennent forme grâce à l'utilisation de l'intelligence artificielle, la meilleure.
Histoire originale de : https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html?smid=nytcore-ios-share&sgrp=c-cb
Découvrez-en plus sur le créateur

Dernières actualités