1. Início
  2. / Inteligência Artificial (I.A)
  3. / Pesquisa revela que o custo do treinamento de IA da DeepSeek não é de US$ 6 milhões, mas sim um valor 216 vezes MAIOR
Tempo de leitura 3 min de leitura Comentários 0 comentários

Pesquisa revela que o custo do treinamento de IA da DeepSeek não é de US$ 6 milhões, mas sim um valor 216 vezes MAIOR

Escrito por Fabio Lucas Carvalho
Publicado em 02/02/2025 às 09:15
DeepSeek
Foto: Reprodução
Seja o primeiro a reagir!
Reagir ao artigo

Uma nova pesquisa revelou que o treinamento da IA da DeepSeek não custou US$ 6 milhões, mas sim um valor muito mais alto. Descubra!

Uma recente análise da SemiAnalysis revelou que o custo real de treinamento da inteligência artificial (IA) da DeepSeek é significativamente maior do que se pensava anteriormente.

Embora estimativas iniciais sugerissem um investimento de aproximadamente US$ 6 milhões, o relatório indica que o valor real alcança impressionantes US$ 1,3 bilhão.

Desvendando o mito dos US$ 6 milhões

A estimativa inicial de US$ 6 milhões considerava apenas as despesas de pré-treinamento com GPUs, negligenciando investimentos substanciais em pesquisa e desenvolvimento, infraestrutura e outros custos essenciais acumulados pela empresa.

Pai e filho sorrindo ao fundo de arte promocional da Shopee para o Dia dos Pais, com produtos e caixas flutuantes em cenário laranja vibrante.
Celebre o Dia dos Pais com ofertas incríveis na Shopee!
Ícone de link VEJA AS OFERTAS!

O relatório destaca que o gasto total de capital em servidores (CapEx) da DeepSeek chega a aproximadamente US$ 1,6 bilhão, com uma parte considerável desse valor direcionada à operação e manutenção de seus extensos clusters de GPUs.

Infraestrutura robusta e investimentos em hardware

A DeepSeek possui acesso a cerca de 50.000 GPUs da série Hopper, incluindo modelos como H800s, H100s e H20s, específicos para cada país, produzidos pela NVIDIA em resposta às restrições de exportação dos EUA.

Essa diversificação no inventário de hardware reflete decisões estratégicas de fornecimento e eficiência operacional da empresa.

Estrutura organizacional e eficiência operacional

Diferentemente de alguns dos maiores laboratórios de IA, a DeepSeek opera seus próprios data centers e adota um modelo simplificado que contribui para sua agilidade e eficiência. Essa capacidade de adaptação rápida é vital em um cenário de IA cada vez mais competitivo.

Em termos de desempenho, o modelo R1 da DeepSeek demonstra capacidades de raciocínio comparáveis ao o1 da OpenAI.

No entanto, não é considerado o líder indiscutível em todas as métricas de desempenho. Embora a estratégia de preços da DeepSeek tenha recebido elogios, é importante notar que o Gemini Flash 2.0 do Google, com capacidades semelhantes, mostra-se ainda mais econômico quando acessado por meio de serviços de API.

Isso coloca a DeepSeek diante do desafio de equilibrar desempenho e custo para garantir seu sucesso futuro.

Uma inovação notável destacada no relatório é a tecnologia Multi-Head Latent Attention (MLA), que reduz significativamente os custos de inferência em impressionantes 93,3% por meio da redução do uso de cache de chave-valor (KV). Essa abordagem representa um grande avanço em direção a soluções de IA mais econômicas.

Especialistas sugerem que as inovações da DeepSeek provavelmente serão rapidamente adotadas por laboratórios ocidentais de IA que buscam manter-se competitivos.

O futuro da IA chinesa

Embora haja otimismo quanto a possíveis melhorias e ganhos de eficiência, a SemiAnalysis alerta para desafios externos.

O relatório especula que os custos operacionais podem cair ainda mais, impulsionados pela capacidade da DeepSeek de se adaptar rapidamente em comparação com suas contrapartes maiores e mais burocráticas.

No entanto, a ampliação das operações em meio ao aumento dos controles de exportação dos EUA representa um obstáculo significativo que a DeepSeek deve superar com cautela.

Com informçaões de SemiAnalysis.

Inscreva-se
Notificar de
guest
0 Comentários
Mais recente
Mais antigos Mais votado
Feedbacks
Visualizar todos comentários
Fabio Lucas Carvalho

Jornalista especializado em uma ampla variedade de temas, como carros, tecnologia, política, indústria naval, geopolítica, energia renovável e economia. Atuo desde 2015 com publicações de destaque em grandes portais de notícias. Minha formação em Gestão em Tecnologia da Informação pela Faculdade de Petrolina (Facape) agrega uma perspectiva técnica única às minhas análises e reportagens. Com mais de 10 mil artigos publicados em veículos de renome, busco sempre trazer informações detalhadas e percepções relevantes para o leitor. Para sugestões de pauta ou qualquer dúvida, entre em contato pelo e-mail flclucas@hotmail.com.

Compartilhar em aplicativos
0
Adoraríamos sua opnião sobre esse assunto, comente!x