Дом Новости CHATGPT Maker подозревает, что модели Diepseek AI в Китае были построены с использованием данных OpenAI - и ирония не теряется в Интернете

CHATGPT Maker подозревает, что модели Diepseek AI в Китае были построены с использованием данных OpenAI - и ирония не теряется в Интернете

by Christian Feb 23,2025

Openai подозревает, что модели AI DeepSeek в Китае, значительно дешевле, чем западные коллеги, могли быть обучены с использованием данных OpenAI. Это откровение, в сочетании с быстрым ростом популярности DeepSeek, вызвало значительный рыночный спад для крупных игроков ИИ. NVIDIA, ключевой поставщик графических процессоров, испытал крупнейшую в мире потерю акций, в то время как Microsoft, Meta, Alphabet и Dell также увидели существенные падения.

Модель DeepSeek R1, основанная на открытом исходном коде, DeepSeek-V3 может похвастаться значительно более низкими затратами на обучение (оценивается в 6 миллионов долларов) и вычислительные потребности по сравнению с западными моделями. Хотя это утверждение обсуждается, оно вызвало обеспокоенность по поводу массовых инвестиций, которые западные компании делают в ИИ.

OpenAI и Microsoft изучают, нарушает ли DeepSeek условия обслуживания Openai, используя методику, называемую «дистилляцией» - извлечение данных из более крупных моделей для обучения более мелких. OpenAI подтверждает, что китайские компании и другие постоянно пытаются повторить ведущие модели ИИ США. Они активно реализуют контрмеры и сотрудничают с правительством США для защиты своей интеллектуальной собственности.

Дэвид Сакс, президент Трамп, AI Czar, поддерживает утверждение, что Deepseek использовал модели Openai, подчеркивая необходимость профилактических мер ведущими компаниями искусственного интеллекта.

Эта ситуация подчеркивает иронию позиции Openai, учитывая его собственные прошлые обвинения в использовании защищенных авторским правом материала без разрешения на обучение CHATGPT. Ранее Openai спорил в Доме лордов Великобритании, что обучение крупных языковых моделей без защищенного авторским правом материала невозможно. Эта позиция также осложняется существующими судебными процессами от New York Times и 17 авторов, утверждающих нарушение авторских прав. Openai утверждает, что его практика обучения составляет «справедливое использование». Юридические сражения, связанные с данными обучения ИИ и авторским правом, продолжают разворачиваться, причем решение в августе 2023 года о том, что искусство, генерируемое ИИ, не может быть защищено авторским правом, добавляя еще один слой сложности.

DeepSeek обвиняется в использовании модели Openai для обучения своего конкурента с использованием дистилляции. Кредит изображения: Андрей Рудаков/Блумберг через Getty Images.