Modelo chinês alcançou um desempenho de 96,0 em 50 tarefas, superou 95,0 em ambientes aleatórios, aprende com vídeos, entende comandos humanos, tenta corrigir falhas durante ações reais e mira uso em ambientes industriais, comerciais e domésticos
A China apresentou um avanço que pode mudar a forma como robôs aprendem e trabalham. O Motubrain é um modelo de inteligência artificial criado para funcionar como um cérebro único para robôs, reunindo visão, linguagem e ação no mesmo sistema.
A apuração foi publicada por Interesting Engineering, site de notícias sobre engenharia e tecnologia. A tecnologia foi desenvolvida pela ShengShu Technology e busca substituir sistemas separados por uma estrutura única, capaz de perceber o ambiente, entender ordens e agir.
O impacto prático está na possibilidade de robôs realizarem tarefas mais longas e flexíveis. O modelo de IA para robôs já foi apresentado com desempenho de 63,77 no WorldArena, média de 96,0 em 50 tarefas no RoboTwin 2.0 e capacidade de executar até 10 ações atômicas em sequência.
-
Cientistas calcularam a data de validade da Terra e o resultado assusta: 1,8 bilhão de anos na zona habitável até os oceanos evaporarem e o Sol expulsar o planeta da faixa da vida
-
Adeus JBL: LG lança caixa de som portátil com até 25 horas de bateria, karaokê com IA que remove vozes em tempo real, som refinado por will.i.am, alto-falantes Peerless e preço de R$ 2.599 no Brasil. Bateria para 25 horas e karaokê: LG lança caixa XBOOM Stage 501 no Brasil
-
Duas vezes mais rápido que o Concorde: Brasil avança com o projeto hipersônico 14-X da FAB para dominar voos acima de Mach 5, após mais de duas décadas de pesquisas em uma das tecnologias aeroespaciais mais desafiadoras do mundo
-
Tudo parecia ser apenas um antigo vaso enterrado na Arábia Saudita, até que arqueólogos revelaram um tesouro de ouro de 1.200 anos que ainda desafia explicações sobre seu verdadeiro dono
Motubrain funciona como um cérebro geral para robôs
Criou-se, então, o Motubrain para juntar várias funções em uma só inteligência. Em vez de usar um sistema para enxergar, outro para planejar e outro para se mover, o robô passa a trabalhar com uma estrutura integrada, um cérebro.
Isso significa que a máquina pode observar o ambiente, entender uma instrução e escolher uma ação sem trocar de programa a cada etapa. Essa união é o que torna o modelo importante para a robótica com inteligência artificial.
A proposta também busca reduzir a dependência de sistemas de cérebro feitos para uma única tarefa. Muitos robôs funcionam bem em situações repetidas, mas têm dificuldade quando o cenário muda. O Motubrain tenta melhorar essa adaptação.
Para empresas, isso pode abrir caminho para robôs mais úteis em fábricas, comércio e casas. O avanço ainda depende de testes e aplicação real, mas aponta para máquinas menos limitadas por comandos rígidos.
Modelo aprende com vídeos, comandos e ações ao mesmo tempo
O modelo de IA para robôs aprende com três tipos de informação: vídeo, linguagem e ação. O vídeo ajuda o sistema a enxergar padrões. A linguagem permite entender comandos. A ação mostra como o robô deve se mover.
Na prática, o sistema aprende observando cenas, recebendo instruções e analisando movimentos. Essa combinação ajuda o robô a criar uma noção mais ampla do que está acontecendo ao redor.
O Motubrain também usa vídeos não rotulados, dados de simulação e gravações de tarefas feitas por vários robôs. Vídeos não rotulados são imagens sem marcações manuais feitas por pessoas.
Essa estratégia reduz a necessidade de alguém explicar cada detalhe para a máquina. O sistema tenta reconhecer padrões de movimento e comportamento a partir dos dados disponíveis.
Testes mostram 63,77 no WorldArena e 96,0 em 50 tarefas
O desempenho do Motubrain chamou atenção em avaliações usadas para medir robôs e modelos de inteligência artificial. O sistema alcançou 63,77 no WorldArena e média de 96,0 em 50 tarefas no RoboTwin 2.0.
O modelo também foi apresentado como o único a passar de 95,0 em ambientes aleatórios. Esse ponto é importante porque ambientes aleatórios são mais difíceis. Neles, o robô precisa lidar com mudanças e situações menos previsíveis.
Interesting Engineering, site de notícias sobre engenharia e tecnologia, trouxe os números e os pontos centrais do avanço. A publicação também destacou a ligação do projeto com a experiência anterior da ShengShu Technology em vídeo generativo, por meio da plataforma Vidu.
Vídeo generativo é uma tecnologia ligada à criação e previsão de cenas em vídeo. No Motubrain, essa base ajuda o sistema a entender como objetos, espaços e ações podem mudar com o tempo.
Robô consegue fazer até 10 etapas em uma única sequência
Um dos pontos mais fortes do Motubrain é a capacidade de executar tarefas com várias fases. O sistema consegue realizar até 10 ações atômicas em uma única sequência.
Ação atômica é uma etapa simples dentro de uma tarefa maior. Pegar um objeto, mover uma peça ou soltar algo em outro lugar são exemplos desse tipo de ação.
Muitos sistemas robóticos atuais costumam lidar com apenas 2 ou 3 ações em sequência. Por isso, chegar a 10 etapas representa um salto importante para tarefas mais complexas.
Essa capacidade pode aproximar os robôs de atividades reais. Em ambientes como fábricas, lojas e residências, uma tarefa raramente depende de apenas um movimento simples.
O cérebro de IA tenta repetir a tarefa quando algo dá errado
O Motubrain também mostrou capacidade de reagir durante a execução. Em testes práticos, quando uma tentativa falhava no meio da tarefa, o sistema de cérebro conseguia reconhecer o problema e tentar novamente.
Um exemplo envolve o ato de pegar um objeto. Caso a primeira tentativa não desse certo, o robô podia ajustar a ação e repetir o movimento sem ter recebido treino específico para aquele erro.
Esse ponto é importante porque o mundo real é cheio de imprevistos. Objetos mudam de lugar, superfícies atrapalham movimentos e tarefas simples podem falhar por detalhes pequenos.
Jun Zhu, fundador da ShengShu Technology, resumiu a ideia do projeto com a frase: “Um modelo mundial verdadeiro deve ser capaz, então, de construir uma representação unificada do mundo real e prever como ele evolui”.
Empresas de robótica já entram na rota do Motubrain
A ShengShu Technology afirma que o Motubrain já está sendo usado por empresas de robótica em programas de treinamento ativo. Os ambientes citados incluem áreas industriais, comerciais e domésticas.

As parcerias envolvem empresas como Astribot, SimpleAI e Anyverse Dynamics. A intenção é ampliar a presença do modelo em diferentes usos da robótica.
O projeto também recebeu apoio financeiro relevante. A ShengShu contou com uma rodada Série B de US$ 293 milhões liderada pela Alibaba Cloud.
Esse valor fortalece a aposta em sistemas de inteligência artificial incorporados. Esse tipo de IA funciona dentro de máquinas físicas, como robôs, e não apenas em telas ou aplicativos.
Arquitetura unificada tenta substituir robôs cheios de partes separadas
A proposta do Motubrain é trocar a lógica de módulos separados por um sistema único de cérebro. A arquitetura usa três fluxos para integrar informações diferentes, como imagem, linguagem e movimento.
Em termos simples, esses três fluxos funcionam, assim, como caminhos pelos quais o robô interpreta o que vê, o que recebe como comando e o que precisa fazer.
A empresa também defende que robôs mais avançados precisam unir percepção, raciocínio, previsão, geração e ação em uma só estrutura. A declaração reforça essa visão: “Acreditamos que os modelos gerais do mundo não devem ter construção como módulos costurados, mas como uma arquitetura unificada que reúne percepção, raciocínio, previsão, geração e ação em um único sistema.”
Esse caminho pode tornar os robôs mais preparados para tarefas variadas. Ainda assim, a adoção em larga escala depende de segurança, custo, integração com máquinas existentes e resultados fora dos testes.
Motubrain mostra uma nova fase da robótica com inteligência artificial
O Motubrain coloca a China em evidência na corrida por robôs mais flexíveis. O modelo junta visão, linguagem e ação, alcança 96,0 em 50 tarefas, supera 95,0 em ambientes aleatórios e executa até 10 etapas em sequência.
A promessa não é apenas criar robôs que, portanto, obedecem ordens. O objetivo é aproximar as máquinas de tarefas reais, com mais adaptação, mais sequência de movimentos e maior capacidade de corrigir falhas.
Esse avanço pode mudar a relação entre robôs e trabalho em fábricas, comércio e casas. Mas e você, confiaria em um robô com esse tipo de inteligência para ajudar em tarefas do dia a dia ou acha que essa tecnologia ainda precisa amadurecer muito?


Esta tecnologia precisa evoluir muito.
O ambiente mecânico dos robôs é bem frio e uma ausência de criatividade terrível.
Parabéns a empresa shengshu tecnology, com esse novo software algoritmo que separa os campos gognitivos dos campos sensores e motores.
Oque de certa forma, caracterizam um alto aprendizado por meio de comparação preditiva e gestual, de seguimento gestual de humanos.
E isso garante que o robot não fique somente limitado a usar uma API padrão RAG, ( reatrival augumented gestual)em junção com uma llm Ai.
Juntar todo esse software em um só para contornar tudo, sem ter que passar por outro sistema de reconhecimento gestual, faz como que o sistema seja altamente autônomo e sem dependência de outras bibliotecas de código gestual.
E oque parece conter tabelas expressivas de movimentos corporais em um sistema métrico tabular.
Em que aumenta mais o aprendizado , semente fazendo comparações com vídeos e fotos de movimentos.
Para seria presciso criar um novo tipo de IA , que ao invés de ler movimentos por movimentos de um ser humano, para copiar e imitar e programar.
Oque era feito antes tomava muito tempo em aprendizado, pois teria que repetir várias vezes até começar a corrigir os erros, para depois programar cada movimentos da forma correta.E isto leva muito tempo.
Pois o robô só conseguia memorizar e fazer 3 à 4 movimentos de passando por várias seções de erro até conseguir o melhor movimento e precisão.
E com este novo sistema gestual automático o robô não prescisa de um humano treinador de movimentos repetitivos.
Ou seja, isso é grande passa na evolução de máquinas autônomas.
Eles vão aprender sozinhos, mais rapidamente do quê qualquer ser humanos ensinando diretamente.
E isso tem que ser controlado e estudado.Para que o robô não desacate uma ordens de seus programadores e treinadores.
Por que então, ao momento que eles começarem a desacatar ordens em uma fábrica. E começarem a dizer que não prescisa de humanos para ensiná-los é capaz de fazer tudo sozinho.
Dirão diretamente aos seus superiores que eles fazem oque achar melhor a se fazer.
E que não prescisa de ordens saber o que deve ou não executar em uma fábrica.
Isso será uma revolução no aprendizado.
Portanto, esse sistema motubrain tem que ser monitorado com muita cautela, para que não ultrapasse os limites de autocontrole de uma máquina.
Pois agora, aprendem rápido de mais, apenas assistindo vídeos e fotos de movimentos em quadrinhos.
Oque é extremamente perigoso esses robôs começarem aprender vendo videos e filmes de artes marciais e aprenderem vários tipos de lutas.
Também apresenta grande perigo de eles aprenderem vendo vídeos de ação em que usam armas de fogo e faças.
Isso aumenta mais o risco de eles atacarem um ser humano indefeso que não saberá lutar com eles.