1. Início
  2. Ciência e Tecnologia
  3. China cria cérebro único para robôs que junta visão, linguagem e ação, executa até dez etapas sozinho e promete mudar fábricas, comércio e casas
2 comentários 6 min de leitura

China cria cérebro único para robôs que junta visão, linguagem e ação, executa até dez etapas sozinho e promete mudar fábricas, comércio e casas

Imagem de perfil do autor Flavia Marinho
Escrito por Flavia Marinho Publicado em 30/04/2026 às 17:25 Atualizado em 30/04/2026 às 17:58
Assista o vídeoChina cria cérebro único para robôs que junta visão, linguagem e ação
  • Reação
  • Reação
  • Reação
  • Reação
  • Reação
24 pessoas reagiram a isso.
Reagir ao artigo
Prefira o CPG no Google

Modelo chinês alcançou um desempenho de 96,0 em 50 tarefas, superou 95,0 em ambientes aleatórios, aprende com vídeos, entende comandos humanos, tenta corrigir falhas durante ações reais e mira uso em ambientes industriais, comerciais e domésticos

A China apresentou um avanço que pode mudar a forma como robôs aprendem e trabalham. O Motubrain é um modelo de inteligência artificial criado para funcionar como um cérebro único para robôs, reunindo visão, linguagem e ação no mesmo sistema.

A apuração foi publicada por Interesting Engineering, site de notícias sobre engenharia e tecnologia. A tecnologia foi desenvolvida pela ShengShu Technology e busca substituir sistemas separados por uma estrutura única, capaz de perceber o ambiente, entender ordens e agir.

O impacto prático está na possibilidade de robôs realizarem tarefas mais longas e flexíveis. O modelo de IA para robôs já foi apresentado com desempenho de 63,77 no WorldArena, média de 96,0 em 50 tarefas no RoboTwin 2.0 e capacidade de executar até 10 ações atômicas em sequência.

Motubrain funciona como um cérebro geral para robôs

Criou-se, então, o Motubrain para juntar várias funções em uma só inteligência. Em vez de usar um sistema para enxergar, outro para planejar e outro para se mover, o robô passa a trabalhar com uma estrutura integrada, um cérebro.

Assista o vídeo
Vídeo do YouTube

Isso significa que a máquina pode observar o ambiente, entender uma instrução e escolher uma ação sem trocar de programa a cada etapa. Essa união é o que torna o modelo importante para a robótica com inteligência artificial.

A proposta também busca reduzir a dependência de sistemas de cérebro feitos para uma única tarefa. Muitos robôs funcionam bem em situações repetidas, mas têm dificuldade quando o cenário muda. O Motubrain tenta melhorar essa adaptação.

Para empresas, isso pode abrir caminho para robôs mais úteis em fábricas, comércio e casas. O avanço ainda depende de testes e aplicação real, mas aponta para máquinas menos limitadas por comandos rígidos.

Modelo aprende com vídeos, comandos e ações ao mesmo tempo

O modelo de IA para robôs aprende com três tipos de informação: vídeo, linguagem e ação. O vídeo ajuda o sistema a enxergar padrões. A linguagem permite entender comandos. A ação mostra como o robô deve se mover.

Na prática, o sistema aprende observando cenas, recebendo instruções e analisando movimentos. Essa combinação ajuda o robô a criar uma noção mais ampla do que está acontecendo ao redor.

O Motubrain também usa vídeos não rotulados, dados de simulação e gravações de tarefas feitas por vários robôs. Vídeos não rotulados são imagens sem marcações manuais feitas por pessoas.

Essa estratégia reduz a necessidade de alguém explicar cada detalhe para a máquina. O sistema tenta reconhecer padrões de movimento e comportamento a partir dos dados disponíveis.

Testes mostram 63,77 no WorldArena e 96,0 em 50 tarefas

O desempenho do Motubrain chamou atenção em avaliações usadas para medir robôs e modelos de inteligência artificial. O sistema alcançou 63,77 no WorldArena e média de 96,0 em 50 tarefas no RoboTwin 2.0.

O modelo também foi apresentado como o único a passar de 95,0 em ambientes aleatórios. Esse ponto é importante porque ambientes aleatórios são mais difíceis. Neles, o robô precisa lidar com mudanças e situações menos previsíveis.

Interesting Engineering, site de notícias sobre engenharia e tecnologia, trouxe os números e os pontos centrais do avanço. A publicação também destacou a ligação do projeto com a experiência anterior da ShengShu Technology em vídeo generativo, por meio da plataforma Vidu.

Vídeo generativo é uma tecnologia ligada à criação e previsão de cenas em vídeo. No Motubrain, essa base ajuda o sistema a entender como objetos, espaços e ações podem mudar com o tempo.

Robô consegue fazer até 10 etapas em uma única sequência

Um dos pontos mais fortes do Motubrain é a capacidade de executar tarefas com várias fases. O sistema consegue realizar até 10 ações atômicas em uma única sequência.

Ação atômica é uma etapa simples dentro de uma tarefa maior. Pegar um objeto, mover uma peça ou soltar algo em outro lugar são exemplos desse tipo de ação.

Muitos sistemas robóticos atuais costumam lidar com apenas 2 ou 3 ações em sequência. Por isso, chegar a 10 etapas representa um salto importante para tarefas mais complexas.

Essa capacidade pode aproximar os robôs de atividades reais. Em ambientes como fábricas, lojas e residências, uma tarefa raramente depende de apenas um movimento simples.

O cérebro de IA tenta repetir a tarefa quando algo dá errado

O Motubrain também mostrou capacidade de reagir durante a execução. Em testes práticos, quando uma tentativa falhava no meio da tarefa, o sistema de cérebro conseguia reconhecer o problema e tentar novamente.

Um exemplo envolve o ato de pegar um objeto. Caso a primeira tentativa não desse certo, o robô podia ajustar a ação e repetir o movimento sem ter recebido treino específico para aquele erro.

Esse ponto é importante porque o mundo real é cheio de imprevistos. Objetos mudam de lugar, superfícies atrapalham movimentos e tarefas simples podem falhar por detalhes pequenos.

Jun Zhu, fundador da ShengShu Technology, resumiu a ideia do projeto com a frase: “Um modelo mundial verdadeiro deve ser capaz, então, de construir uma representação unificada do mundo real e prever como ele evolui”.

Empresas de robótica já entram na rota do Motubrain

A ShengShu Technology afirma que o Motubrain já está sendo usado por empresas de robótica em programas de treinamento ativo. Os ambientes citados incluem áreas industriais, comerciais e domésticas.

cérebro

As parcerias envolvem empresas como Astribot, SimpleAI e Anyverse Dynamics. A intenção é ampliar a presença do modelo em diferentes usos da robótica.

O projeto também recebeu apoio financeiro relevante. A ShengShu contou com uma rodada Série B de US$ 293 milhões liderada pela Alibaba Cloud.

Esse valor fortalece a aposta em sistemas de inteligência artificial incorporados. Esse tipo de IA funciona dentro de máquinas físicas, como robôs, e não apenas em telas ou aplicativos.

Arquitetura unificada tenta substituir robôs cheios de partes separadas

A proposta do Motubrain é trocar a lógica de módulos separados por um sistema único de cérebro. A arquitetura usa três fluxos para integrar informações diferentes, como imagem, linguagem e movimento.

Em termos simples, esses três fluxos funcionam, assim, como caminhos pelos quais o robô interpreta o que vê, o que recebe como comando e o que precisa fazer.

A empresa também defende que robôs mais avançados precisam unir percepção, raciocínio, previsão, geração e ação em uma só estrutura. A declaração reforça essa visão: “Acreditamos que os modelos gerais do mundo não devem ter construção como módulos costurados, mas como uma arquitetura unificada que reúne percepção, raciocínio, previsão, geração e ação em um único sistema.”

Esse caminho pode tornar os robôs mais preparados para tarefas variadas. Ainda assim, a adoção em larga escala depende de segurança, custo, integração com máquinas existentes e resultados fora dos testes.

Motubrain mostra uma nova fase da robótica com inteligência artificial

O Motubrain coloca a China em evidência na corrida por robôs mais flexíveis. O modelo junta visão, linguagem e ação, alcança 96,0 em 50 tarefas, supera 95,0 em ambientes aleatórios e executa até 10 etapas em sequência.

A promessa não é apenas criar robôs que, portanto, obedecem ordens. O objetivo é aproximar as máquinas de tarefas reais, com mais adaptação, mais sequência de movimentos e maior capacidade de corrigir falhas.

Esse avanço pode mudar a relação entre robôs e trabalho em fábricas, comércio e casas. Mas e você, confiaria em um robô com esse tipo de inteligência para ajudar em tarefas do dia a dia ou acha que essa tecnologia ainda precisa amadurecer muito?

Inscreva-se
Notificar de
guest
2 Comentários
Mais recente
Mais antigos Mais votado
Mercês
Mercês
06/05/2026 22:53

Esta tecnologia precisa evoluir muito.
O ambiente mecânico dos robôs é bem frio e uma ausência de criatividade terrível.

Anderson
Anderson
04/05/2026 17:16

Parabéns a empresa shengshu tecnology, com esse novo software algoritmo que separa os campos gognitivos dos campos sensores e motores.
Oque de certa forma, caracterizam um alto aprendizado por meio de comparação preditiva e gestual, de seguimento gestual de humanos.
E isso garante que o robot não fique somente limitado a usar uma API padrão RAG, ( reatrival augumented gestual)em junção com uma llm Ai.
Juntar todo esse software em um só para contornar tudo, sem ter que passar por outro sistema de reconhecimento gestual, faz como que o sistema seja altamente autônomo e sem dependência de outras bibliotecas de código gestual.
E oque parece conter tabelas expressivas de movimentos corporais em um sistema métrico tabular.
Em que aumenta mais o aprendizado , semente fazendo comparações com vídeos e fotos de movimentos.
Para seria presciso criar um novo tipo de IA , que ao invés de ler movimentos por movimentos de um ser humano, para copiar e imitar e programar.
Oque era feito antes tomava muito tempo em aprendizado, pois teria que repetir várias vezes até começar a corrigir os erros, para depois programar cada movimentos da forma correta.E isto leva muito tempo.
Pois o robô só conseguia memorizar e fazer 3 à 4 movimentos de passando por várias seções de erro até conseguir o melhor movimento e precisão.
E com este novo sistema gestual automático o robô não prescisa de um humano treinador de movimentos repetitivos.
Ou seja, isso é grande passa na evolução de máquinas autônomas.
Eles vão aprender sozinhos, mais rapidamente do quê qualquer ser humanos ensinando diretamente.
E isso tem que ser controlado e estudado.Para que o robô não desacate uma ordens de seus programadores e treinadores.
Por que então, ao momento que eles começarem a desacatar ordens em uma fábrica. E começarem a dizer que não prescisa de humanos para ensiná-los é capaz de fazer tudo sozinho.
Dirão diretamente aos seus superiores que eles fazem oque achar melhor a se fazer.
E que não prescisa de ordens saber o que deve ou não executar em uma fábrica.
Isso será uma revolução no aprendizado.
Portanto, esse sistema motubrain tem que ser monitorado com muita cautela, para que não ultrapasse os limites de autocontrole de uma máquina.
Pois agora, aprendem rápido de mais, apenas assistindo vídeos e fotos de movimentos em quadrinhos.
Oque é extremamente perigoso esses robôs começarem aprender vendo videos e filmes de artes marciais e aprenderem vários tipos de lutas.
Também apresenta grande perigo de eles aprenderem vendo vídeos de ação em que usam armas de fogo e faças.
Isso aumenta mais o risco de eles atacarem um ser humano indefeso que não saberá lutar com eles.

Flavia Marinho

Flavia Marinho é Engenheira pós-graduada, com vasta experiência na indústria de construção naval onshore e offshore. Nos últimos anos, tem se dedicado a escrever artigos para sites de notícias nas áreas militar, segurança, indústria, petróleo e gás, energia, construção naval, geopolítica, empregos e cursos. Entre em contato com flaviacamil@gmail.com ou WhatsApp +55 21 973996379 para correções, sugestão de pauta, divulgação de vagas de emprego ou proposta de publicidade em nosso portal.

Compartilhar em aplicativos
Baixar aplicativo
Ir para o vídeo em destaque
2
0
Adoraríamos sua opnião sobre esse assunto, comente!x