Openai sospetta che i modelli di AI Deepseek della Cina, significativamente più economici delle controparti occidentali, potrebbero essere stati addestrati utilizzando i dati di Openai. Questa rivelazione, unita al rapido aumento della popolarità di Deepseek, ha scatenato una significativa recessione del mercato per i principali attori dell'IA. Nvidia, un fornitore chiave della GPU, ha registrato anche la sua più grande perdita di stock di sempre, mentre anche Microsoft, Meta, Alphabet e Dell hanno visto cali sostanziali.
Il modello R1 di DeepSeek, basato sull'apertura open source DeepSeek-V3, vanta costi di allenamento significativamente più bassi (stimati a $ 6 milioni) e esigenze computazionali rispetto ai modelli occidentali. Sebbene questa affermazione sia discussa, ha alimentato le preoccupazioni per gli enormi investimenti che le aziende occidentali stanno facendo in AI.
Openai e Microsoft stanno studiando se DeepSeek abbia violato i termini di servizio di Openi utilizzando una tecnica chiamata "Distillazione", estraendo dati da modelli più grandi per addestrare quelli più piccoli. Openai conferma che le aziende cinesi e altri tentano continuamente di replicare i principali modelli AI statunitensi. Stanno implementando attivamente contromisure e collaborano con il governo degli Stati Uniti per proteggere la loro proprietà intellettuale.
David Sacks, lo zar di AI del presidente Trump, sostiene l'affermazione secondo cui Deepseek ha utilizzato i modelli di Openi, evidenziando la necessità di misure preventive da parte delle principali società di intelligenza artificiale.
Questa situazione mette in evidenza l'ironia della posizione di Openi, date le sue accuse passate di usare materiale protetto da copyright senza il permesso di addestrare il chatgpt. Openai in precedenza aveva sostenuto alla House of Lords del Regno Unito che è impossibile addestrare modelli di grandi dimensioni senza materiale protetto da copyright. Questa posizione è ulteriormente complicata dalle azioni legali esistenti del New York Times e di 17 autori che sostengono violazione del copyright. Openai sostiene che le sue pratiche di formazione costituiscono un "equo uso". Le battaglie legali che circondano i dati di addestramento dell'IA e il copyright continuano a svolgersi, con la sentenza dell'agosto 2023 che l'arte generata dall'IA non può essere protetta da copyright aggiungendo un altro livello di complessità.