DeepSeek IA: Novo modelo promete raciocínio aprimorado e menos 'alucinações'

A DeepSeek, startup chinesa de inteligência artificial, anunciou uma atualização para seu modelo R1, o R1-0528. A empresa afirma que o novo modelo apresenta melhorias significativas em relação à versão anterior, especialmente em cálculos matemáticos, programação e lógica geral. Além disso, a DeepSeek garante que o R1-0528 demonstra uma redução nas chamadas “alucinações”, que são respostas incorretas ou inventadas por modelos de IA.

Desempenho e Capacidades Aprimoradas

Segundo a DeepSeek, o R1-0528 alcança um desempenho geral que se aproxima de modelos líderes do mercado, como o o3 da OpenAI e o Gemini 2.5 Pro do Google. A empresa divulgou a atualização na plataforma Hugging Face, onde a classificação do R1-0528 no LiveCodeBench o coloca em um nível comparável aos modelos de ponta.

O modelo original R1, lançado em janeiro, já havia surpreendido o setor de IA por rivalizar com modelos de empresas maiores, como OpenAI e Meta, mesmo tendo sido desenvolvido a um custo consideravelmente menor. A atualização do R1 promete uma profundidade de raciocínio ainda maior, segundo a DeepSeek.

Veja também:

Impacto no Mercado e Reconhecimento

O avanço da DeepSeek no cenário da IA tem chamado a atenção da indústria global de tecnologia. Jensen Huang, CEO da Nvidia, reconheceu a crescente competitividade das empresas chinesas no setor, afirmando que elas estão preenchendo o espaço deixado pela saída de empresas dos EUA do mercado de IA.

O modelo DeepSeek-R1 original já havia causado impacto ao ser lançado com código aberto, permitindo que programadores, desenvolvedores e pesquisadores o explorassem. O investidor Marc Andreessen, cofundador da Andreessen Horowitz, descreveu o DeepSeek R1 como “uma das mais incríveis e impressionantes inovações” que já presenciou, destacando sua importância para o mundo.

Aplicações e Comparativos

O DeepSeek, assim como o ChatGPT, é um aplicativo de inteligência artificial “generativa”. Esses aplicativos, conhecidos como chatbots, podem ter conversas em texto com os usuários e realizar diversas tarefas, como escrever textos, criar listas e orçamentos. A startup também oferece um assistente de IA gratuito, alimentado pelo modelo DeepSeek-V3, com mais de 600 bilhões de parâmetros.

Uma técnica utilizada pela DeepSeek para reduzir as alucinações, chamada de mistura de especialistas, também foi adotada pela OpenAI no desenvolvimento do GPT-4.5. Essa estratégia envolve o treinamento do modelo com informações geradas por outras IAs generativas, o que aumenta o processamento de dados e o uso de computadores de ponta.

Desafios e Limitações

Apesar dos avanços, o modelo da DeepSeek, assim como outros chatbots, ainda apresenta limitações. Especialistas apontam que os textos gerados podem ser genéricos e previsíveis, com falta de objetividade. Além disso, o chatbot pode demonstrar cautela ao lidar com conteúdos de notícias, alertando sobre violação de direitos autorais.

Outro desafio notável é a dificuldade do chatbot em responder questões controversas para a China, como o Massacre na Praça Celestial ou a infração dos direitos humanos da população uigur.

O Futuro da DeepSeek

A DeepSeek continua a inovar e a desafiar os modelos estabelecidos no mercado de IA. Com a atualização do R1 e o desenvolvimento de novas técnicas de treinamento, a empresa busca aprimorar o raciocínio e a precisão de seus modelos, reduzindo as alucinações e aumentando a confiabilidade das respostas. A startup também está explorando a aplicação de seus modelos em produtos de consumo, como eletrodomésticos, TVs e robôs, demonstrando o impacto crescente da IA chinesa no mundo real.

Continue lendo...