A DeepSeek IA chinesa e o Qwen 2.5 são modelos de linguagem de código aberto, com custo de desenvolvimento significativamente menor. Essa novidade chamou a atenção no cenário da inteligência artificial, rivalizando com gigantes como o ChatGPT. Desenvolvida na China, a DeepSeek IA promete acessibilidade e inovação no campo da IA.
O DeepSeek-R1 se destaca por sua interface similar ao ChatGPT e disponibilidade gratuita. Diferentemente do ChatGPT, que oferece recursos completos mediante pagamento, e do Gemini, com gratuidade limitada, o DeepSeek-R1 se propõe a ser uma ferramenta gratuita e acessível.
Um dos impactos da DeepSeek IA chinesa foi a queda de mais de 16% nas ações da NVIDIA. A fabricante de chips perdeu US$ 700 bilhões em valor de mercado em menos de 24 horas após o lançamento da IA chinesa. Essa perda representa um marco na história do mercado de ações.
O baixo custo do DeepSeek se deve à otimização no processo de treinamento. A DeepSeek investiu US$ 5,57 milhões, menos de um décimo do valor investido pela OpenAI no ChatGPT. O treinamento durou 55 dias, utilizando 2.048 unidades de processamento gráfico H800 da NVIDIA, com 671 trilhões de parâmetros. Versões menores também estão acessíveis.
O código do DeepSeek-R1 está disponível no GitHub, permitindo replicação e colaboração. A empresa publicou seu modelo sob a licença MIT, garantindo acesso aberto. Além disso, um artigo técnico detalha o funcionamento do modelo, incentivando a replicação. Esta iniciativa representa um avanço para a comunidade científica e um desafio para as gigantes de tecnologia americanas. A Meta, com seu modelo LLaMA, é uma das poucas empresas com projetos similares de código aberto.
A HuggingFace, plataforma de avaliação de modelos de linguagem, atesta o desempenho do DeepSeek. A IA chinesa se tornou um dos aplicativos mais baixados na App Store dos EUA, superando o ChatGPT em número de downloads.
O lançamento da DeepSeek coincidiu com um apelo de Sam Altman, CEO da OpenAI, para repensar o contrato social no desenvolvimento de IAs. Enquanto isso, o ex-presidente Donald Trump anunciou o projeto Stargate AI, com investimento de US$ 500 bilhões. Em meio a esses debates, uma startup chinesa lança um modelo de linguagem eficiente e de código aberto.
Yann LeCun, diretor de IA da Meta, reconheceu a conquista da equipe chinesa. O DeepSeek demonstra o potencial inovador da China, muitas vezes subestimado pelas empresas americanas. Outro exemplo é o protótipo EAST, que manteve um “sol artificial” de plasma estável por 1,066 segundos, um avanço para a energia de fusão.
Via Super