Maison Nouvelles Chatgpt Maker soupçonne que les modèles de l'IA profonde de terre chinoise pas cher ont été construits à l'aide de données Openai - et l'ironie n'est pas perdue sur Internet

Chatgpt Maker soupçonne que les modèles de l'IA profonde de terre chinoise pas cher ont été construits à l'aide de données Openai - et l'ironie n'est pas perdue sur Internet

by Christian Feb 23,2025

Openai soupçonne que les modèles d'IA profonde de la Chine, nettement moins chers que les homologues occidentaux, peuvent avoir été formés à l'aide des données d'Openai. Cette révélation, associée à la montée rapide de la popularité de Deepseek, a déclenché un ralentissement important du marché pour les principaux acteurs de l'IA. Nvidia, un fournisseur de GPU clé, a subi sa plus grande perte de stock en une journée, tandis que Microsoft, Meta, Alphabet et Dell ont également connu des baisses substantielles.

Le modèle R1 de Deepseek, basé sur le open-source Deepseek-V3, possède des coûts de formation nettement inférieurs (estimés à 6 millions de dollars) et des besoins de calcul par rapport aux modèles occidentaux. Bien que cette réclamation soit débattue, elle a alimenté les inquiétudes concernant les investissements massifs que les entreprises occidentales font en IA.

OpenAI et Microsoft étudient si Deepseek a violé les conditions d'utilisation d'OpenAI en utilisant une technique appelée "distillation" - extraire les données de modèles plus grands pour former des plus petits. OpenAI confirme que les entreprises chinoises et d'autres tentent continuellement de reproduire les principaux modèles d'IA américains. Ils mettent activement à mettre en œuvre des contre-mesures et à collaborer avec le gouvernement américain pour protéger leur propriété intellectuelle.

David Sacks, le tsar de l'IA du président Trump, soutient l'affirmation selon laquelle Deepseek a utilisé les modèles d'Openai, soulignant la nécessité de mesures préventives en dirigeant les sociétés d'IA.

Cette situation met en évidence l'ironie de la position d'Openai, compte tenu de ses propres accusations passées d'utilisation du matériel protégé par le droit d'auteur sans l'autorisation de former le chatppt. Openai a précédemment soutenu à la Chambre des Lords du Royaume-Uni que la formation de modèles de grande langue sans matériel protégé par le droit d'auteur est impossible. Cette position est encore compliquée par les poursuites existantes du New York Times et 17 auteurs alléguant une violation du droit d'auteur. Openai soutient que ses pratiques de formation constituent une «utilisation équitable». Les batailles juridiques entourant les données de formation de l'IA et le droit d'auteur continuent de se dérouler, avec la décision d'août 2023 que l'art généré par l'AI ne peut pas être protégé par le droit d'auteur en ajoutant une autre couche de complexité.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov/Bloomberg via Getty Images.