OpenAI cherche à améliorer l’IA avec des données de formation plus larges

AI logo

La société de recherche en intelligence artificielle OpenAI a annoncé cette semaine une nouvelle initiative visant à diversifier et à étendre les données utilisées pour former des modèles d’IA appelées Data Partnerships. Grâce à ce programme, OpenAI prévoit de collaborer avec des organisations tierces pour créer de nouveaux ensembles de données publics et privés pour la formation en IA.

Dans le but d'être plus juste et plus précis, OpenAI veut présenter de meilleures données

Selon OpenAI, l’objectif est de créer des modèles plus justes, plus précis et plus bénéfiques en les exposant à un plus large éventail de données qui reflètent mieux la diversité des langues, des cultures et des sujets. Les ensembles de données actuels sur l’IA ont tendance à souffrir de problèmes tels que le centrisme occidental, le manque de diversité et l’inclusion de contenus toxiques ou biaisés.

« Pour finalement faire [AI] qui est sûr et bénéfique pour toute l'humanité, nous aimerions que les modèles d'IA comprennent en profondeur tous les sujets, industries, cultures et langues, ce qui nécessite un ensemble de données de formation aussi large que possible », a déclaré OpenAI dans un article de blog annonçant le programme.

Les modèles et la compréhension entre les plates-formes peuvent se produire grâce à la formation

En travaillant avec des partenaires pour collecter des ensembles de données à grande échelle selon des modalités telles que le texte, les images, l'audio et la vidéo, OpenAI espère améliorer la compréhension des modèles au-delà de ce qui peut facilement être extrait d'Internet aujourd'hui. La société affirme qu'elle s'efforcera de supprimer toute information sensible ou personnelle et proposera des options permettant de préserver la confidentialité des ensembles de données.

À lire aussi :  Prise en charge d'Intel Itanium IA-64 supprimée avec le noyau Linux 6.7

OpenAI s'est déjà associé à des organisations telles que le gouvernement islandais, Free Law Project et Miðeind ehf sur les premières versions du programme. Cependant, certains experts expriment leur scepticisme quant à la capacité de ces efforts à minimiser les biais profondément enracinés qui ont jusqu’à présent eu un impact sur les modèles d’IA.

“Dans l'ensemble, nous recherchons des partenaires qui souhaitent nous aider à enseigner l'IA à comprendre notre monde afin d'être utile au maximum à tout le monde”, a déclaré OpenAI.

Diversification des données de formation de l'IA pour le GPT-4 à améliorer

Bien que la diversification des données de formation en IA soit essentielle, le programme bénéficiera également clairement aux modèles OpenAI comme GPT-4 sur le plan commercial. Cette double motivation perçue, ainsi que le manque de compensation d'OpenAI pour les partenaires de données, ont suscité certaines critiques à la lumière des accusations concernant l'utilisation des données par l'entreprise sans autorisation.

Une plus grande transparence autour de la collecte d'ensembles de données d'OpenAI, des efforts d'atténuation des biais et des intérêts commerciaux seront essentiels pour évaluer l'impact des partenariats de données sur le paysage global de l'IA. Mais le programme témoigne d’une prise de conscience selon laquelle l’amélioration de l’IA future nécessite de commencer par des données de meilleure qualité et plus représentatives.

You May Also Like

About the Author: admin

Leave a Reply

Your email address will not be published. Required fields are marked *