Operai sospecha que los modelos de IA profundos de China, significativamente más baratos que las homólogos occidentales, pueden haber sido entrenados utilizando los datos de OpenAI. Esta revelación, junto con el rápido aumento de la popularidad de Deepseek, provocó una importante desaceleración del mercado para los principales jugadores de inteligencia artificial. Nvidia, un proveedor clave de GPU, experimentó su pérdida de acciones de un solo día más grande, mientras que Microsoft, Meta, Alphabet y Dell también vieron gotas sustanciales.
El modelo R1 de Deepseek, basado en el de código abierto Deepseek-V3, cuenta con costos de capacitación significativamente más bajos (estimados en $ 6 millones) y las necesidades computacionales en comparación con los modelos occidentales. Si bien se debate este reclamo, ha impulsado las preocupaciones sobre las inversiones masivas que las empresas occidentales están haciendo en IA.
Operai y Microsoft están investigando si Deepseek violó los términos de servicio de OpenAi mediante el uso de una técnica llamada "destilación", extrayendo datos de modelos más grandes para entrenar a los más pequeños. Operai confirma que las empresas chinas y otros intentan replicar continuamente los principales modelos de IA de EE. UU. Están implementando activamente contramedidas y colaborando con el gobierno de los Estados Unidos para proteger su propiedad intelectual.
David Sacks, AI Czar del presidente Trump, apoya la afirmación de que Deepseek utilizó los modelos de OpenAI, destacando la necesidad de medidas preventivas por parte de las principales compañías de IA.
Esta situación destaca la ironía de la posición de OpenAi, dadas sus propias acusaciones pasadas de usar material con derechos de autor sin permiso para capacitar a ChatGPT. Operai previamente argumentó a la Cámara de los Lores del Reino Unido que capacitar modelos de idiomas grandes sin material con derechos de autor es imposible. Esta postura se complica aún más por las demandas existentes del New York Times y 17 autores que alegan infracción de derechos de autor. Operai sostiene que sus prácticas de capacitación constituyen "uso justo". Las batallas legales que rodean los datos de capacitación de IA y los derechos de autor continúan desarrollándose, con el fallo de agosto de 2023 de que el arte generado por IA no puede tener derechos de autor agregando otra capa de complejidad.