Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que as alternativas ocidentais como o ChatGPT, podem ter sido treinadas usando os dados do OpenAI. Essa revelação, juntamente com o rápido aumento da popularidade da Deepseek, desencadeou um forte declínio nos preços das ações das principais empresas de IA, com a Nvidia experimentando as perdas mais substanciais na história de Wall Street.
O modelo R1 da Deepseek, baseado no Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) e requisitos computacionais em comparação com as contrapartes ocidentais. Embora essa reivindicação seja contestada por alguns, ela alimentou as preocupações dos investidores em relação aos enormes investimentos que estão sendo feitos pelas empresas de tecnologia americanas na IA. O sucesso da Deepseek levantou questões sobre o valor desses investimentos.
O OpenAI e a Microsoft estão agora investigando se a Deepseek violou os Termos de Serviço da Openai, empregando uma técnica chamada "Destilação" - extraindo dados de modelos maiores para treinar os menores - usando a API do OpenAI. O OpenAI reconhece que as empresas chinesas estão tentando ativamente replicar os principais modelos de IA dos EUA e estão tomando contramedidas para proteger sua propriedade intelectual. Eles também estão defendendo uma colaboração mais detalhada com o governo dos EUA para proteger os modelos avançados de IA.
David Sacks, czar da AI do presidente Trump, apóia as preocupações do Openai, sugerindo que as ações de Deepseek constituem uma violação dos direitos de propriedade intelectual da Openai. Ele antecipa medidas adicionais de liderar as empresas de IA para evitar incidentes semelhantes.
A situação é ainda mais complicada pela ironia de que o próprio OpenAI enfrentou acusações de usar material protegido por direitos autorais sem permissão no desenvolvimento do ChatGPT. Essa hipocrisia foi destacada por vários comentaristas, dadas as declarações anteriores do OpenAI de que a criação de modelos de IA como ChatGPT sem material protegido por direitos autorais é impossível. A posição da Openai sobre essa questão é ainda mais destacada por sua submissão à Câmara dos Lordes do Reino Unido e suas batalhas legais em andamento, incluindo uma ação do New York Times e um processo anterior por 17 autores. O cenário legal em torno do uso de material protegido por direitos autorais no treinamento de modelos de IA permanece altamente contestado. Um escritório de direitos autorais dos EUA em 2018, descobrindo que a arte gerada pela IA não pode ser protegida por direitos autorais, acrescenta outra camada de complexidade ao debate.