China cria cérebro único para robôs que junta visão, linguagem e ação, executa até dez etapas sozinho e promete mudar fábricas, comércio e casas

Modelo chinês alcançou um desempenho de 96,0 em 50 tarefas, superou 95,0 em ambientes aleatórios, aprende com vídeos, entende comandos humanos, tenta corrigir falhas durante ações reais e mira uso em ambientes industriais, comerciais e domésticos

A China apresentou um avanço que pode mudar a forma como robôs aprendem e trabalham. O Motubrain é um modelo de inteligência artificial criado para funcionar como um cérebro único para robôs, reunindo visão, linguagem e ação no mesmo sistema.

A apuração foi publicada por Interesting Engineering, site de notícias sobre engenharia e tecnologia. A tecnologia foi desenvolvida pela ShengShu Technology e busca substituir sistemas separados por uma estrutura única, capaz de perceber o ambiente, entender ordens e agir.

O impacto prático está na possibilidade de robôs realizarem tarefas mais longas e flexíveis. O modelo de IA para robôs já foi apresentado com desempenho de 63,77 no WorldArena, média de 96,0 em 50 tarefas no RoboTwin 2.0 e capacidade de executar até 10 ações atômicas em sequência.

ARTIGO CONTINUA ABAIXO

Veja também

Motubrain funciona como um cérebro geral para robôs

Criou-se, então, o Motubrain para juntar várias funções em uma só inteligência. Em vez de usar um sistema para enxergar, outro para planejar e outro para se mover, o robô passa a trabalhar com uma estrutura integrada, um cérebro.

Assista o vídeo

Isso significa que a máquina pode observar o ambiente, entender uma instrução e escolher uma ação sem trocar de programa a cada etapa. Essa união é o que torna o modelo importante para a robótica com inteligência artificial.

A proposta também busca reduzir a dependência de sistemas de cérebro feitos para uma única tarefa. Muitos robôs funcionam bem em situações repetidas, mas têm dificuldade quando o cenário muda. O Motubrain tenta melhorar essa adaptação.

Para empresas, isso pode abrir caminho para robôs mais úteis em fábricas, comércio e casas. O avanço ainda depende de testes e aplicação real, mas aponta para máquinas menos limitadas por comandos rígidos.

Modelo aprende com vídeos, comandos e ações ao mesmo tempo

O modelo de IA para robôs aprende com três tipos de informação: vídeo, linguagem e ação. O vídeo ajuda o sistema a enxergar padrões. A linguagem permite entender comandos. A ação mostra como o robô deve se mover.

Na prática, o sistema aprende observando cenas, recebendo instruções e analisando movimentos. Essa combinação ajuda o robô a criar uma noção mais ampla do que está acontecendo ao redor.

O Motubrain também usa vídeos não rotulados, dados de simulação e gravações de tarefas feitas por vários robôs. Vídeos não rotulados são imagens sem marcações manuais feitas por pessoas.

Essa estratégia reduz a necessidade de alguém explicar cada detalhe para a máquina. O sistema tenta reconhecer padrões de movimento e comportamento a partir dos dados disponíveis.

Testes mostram 63,77 no WorldArena e 96,0 em 50 tarefas

O desempenho do Motubrain chamou atenção em avaliações usadas para medir robôs e modelos de inteligência artificial. O sistema alcançou 63,77 no WorldArena e média de 96,0 em 50 tarefas no RoboTwin 2.0.

O modelo também foi apresentado como o único a passar de 95,0 em ambientes aleatórios. Esse ponto é importante porque ambientes aleatórios são mais difíceis. Neles, o robô precisa lidar com mudanças e situações menos previsíveis.

Interesting Engineering, site de notícias sobre engenharia e tecnologia, trouxe os números e os pontos centrais do avanço. A publicação também destacou a ligação do projeto com a experiência anterior da ShengShu Technology em vídeo generativo, por meio da plataforma Vidu.

Vídeo generativo é uma tecnologia ligada à criação e previsão de cenas em vídeo. No Motubrain, essa base ajuda o sistema a entender como objetos, espaços e ações podem mudar com o tempo.

Robô consegue fazer até 10 etapas em uma única sequência

Um dos pontos mais fortes do Motubrain é a capacidade de executar tarefas com várias fases. O sistema consegue realizar até 10 ações atômicas em uma única sequência.

Ação atômica é uma etapa simples dentro de uma tarefa maior. Pegar um objeto, mover uma peça ou soltar algo em outro lugar são exemplos desse tipo de ação.

Muitos sistemas robóticos atuais costumam lidar com apenas 2 ou 3 ações em sequência. Por isso, chegar a 10 etapas representa um salto importante para tarefas mais complexas.

Essa capacidade pode aproximar os robôs de atividades reais. Em ambientes como fábricas, lojas e residências, uma tarefa raramente depende de apenas um movimento simples.

O cérebro de IA tenta repetir a tarefa quando algo dá errado

O Motubrain também mostrou capacidade de reagir durante a execução. Em testes práticos, quando uma tentativa falhava no meio da tarefa, o sistema de cérebro conseguia reconhecer o problema e tentar novamente.

Um exemplo envolve o ato de pegar um objeto. Caso a primeira tentativa não desse certo, o robô podia ajustar a ação e repetir o movimento sem ter recebido treino específico para aquele erro.

Esse ponto é importante porque o mundo real é cheio de imprevistos. Objetos mudam de lugar, superfícies atrapalham movimentos e tarefas simples podem falhar por detalhes pequenos.

Jun Zhu, fundador da ShengShu Technology, resumiu a ideia do projeto com a frase: “Um modelo mundial verdadeiro deve ser capaz, então, de construir uma representação unificada do mundo real e prever como ele evolui”.

Empresas de robótica já entram na rota do Motubrain

A ShengShu Technology afirma que o Motubrain já está sendo usado por empresas de robótica em programas de treinamento ativo. Os ambientes citados incluem áreas industriais, comerciais e domésticas.

As parcerias envolvem empresas como Astribot, SimpleAI e Anyverse Dynamics. A intenção é ampliar a presença do modelo em diferentes usos da robótica.

O projeto também recebeu apoio financeiro relevante. A ShengShu contou com uma rodada Série B de US$ 293 milhões liderada pela Alibaba Cloud.

Esse valor fortalece a aposta em sistemas de inteligência artificial incorporados. Esse tipo de IA funciona dentro de máquinas físicas, como robôs, e não apenas em telas ou aplicativos.

Arquitetura unificada tenta substituir robôs cheios de partes separadas

A proposta do Motubrain é trocar a lógica de módulos separados por um sistema único de cérebro. A arquitetura usa três fluxos para integrar informações diferentes, como imagem, linguagem e movimento.

Em termos simples, esses três fluxos funcionam, assim, como caminhos pelos quais o robô interpreta o que vê, o que recebe como comando e o que precisa fazer.

A empresa também defende que robôs mais avançados precisam unir percepção, raciocínio, previsão, geração e ação em uma só estrutura. A declaração reforça essa visão: “Acreditamos que os modelos gerais do mundo não devem ter construção como módulos costurados, mas como uma arquitetura unificada que reúne percepção, raciocínio, previsão, geração e ação em um único sistema.”

Esse caminho pode tornar os robôs mais preparados para tarefas variadas. Ainda assim, a adoção em larga escala depende de segurança, custo, integração com máquinas existentes e resultados fora dos testes.

Motubrain mostra uma nova fase da robótica com inteligência artificial

O Motubrain coloca a China em evidência na corrida por robôs mais flexíveis. O modelo junta visão, linguagem e ação, alcança 96,0 em 50 tarefas, supera 95,0 em ambientes aleatórios e executa até 10 etapas em sequência.

A promessa não é apenas criar robôs que, portanto, obedecem ordens. O objetivo é aproximar as máquinas de tarefas reais, com mais adaptação, mais sequência de movimentos e maior capacidade de corrigir falhas.

Esse avanço pode mudar a relação entre robôs e trabalho em fábricas, comércio e casas. Mas e você, confiaria em um robô com esse tipo de inteligência para ajudar em tarefas do dia a dia ou acha que essa tecnologia ainda precisa amadurecer muito?

2 Comentários

Mais recente

Mais antigos Mais votado

Mercês

06/05/2026 22:53

Esta tecnologia precisa evoluir muito.
O ambiente mecânico dos robôs é bem frio e uma ausência de criatividade terrível.

Responder

Anderson

04/05/2026 17:16

Parabéns a empresa shengshu tecnology, com esse novo software algoritmo que separa os campos gognitivos dos campos sensores e motores.
Oque de certa forma, caracterizam um alto aprendizado por meio de comparação preditiva e gestual, de seguimento gestual de humanos.
E isso garante que o robot não fique somente limitado a usar uma API padrão RAG, ( reatrival augumented gestual)em junção com uma llm Ai.
Juntar todo esse software em um só para contornar tudo, sem ter que passar por outro sistema de reconhecimento gestual, faz como que o sistema seja altamente autônomo e sem dependência de outras bibliotecas de código gestual.
E oque parece conter tabelas expressivas de movimentos corporais em um sistema métrico tabular.
Em que aumenta mais o aprendizado , semente fazendo comparações com vídeos e fotos de movimentos.
Para seria presciso criar um novo tipo de IA , que ao invés de ler movimentos por movimentos de um ser humano, para copiar e imitar e programar.
Oque era feito antes tomava muito tempo em aprendizado, pois teria que repetir várias vezes até começar a corrigir os erros, para depois programar cada movimentos da forma correta.E isto leva muito tempo.
Pois o robô só conseguia memorizar e fazer 3 à 4 movimentos de passando por várias seções de erro até conseguir o melhor movimento e precisão.
E com este novo sistema gestual automático o robô não prescisa de um humano treinador de movimentos repetitivos.
Ou seja, isso é grande passa na evolução de máquinas autônomas.
Eles vão aprender sozinhos, mais rapidamente do quê qualquer ser humanos ensinando diretamente.
E isso tem que ser controlado e estudado.Para que o robô não desacate uma ordens de seus programadores e treinadores.
Por que então, ao momento que eles começarem a desacatar ordens em uma fábrica. E começarem a dizer que não prescisa de humanos para ensiná-los é capaz de fazer tudo sozinho.
Dirão diretamente aos seus superiores que eles fazem oque achar melhor a se fazer.
E que não prescisa de ordens saber o que deve ou não executar em uma fábrica.
Isso será uma revolução no aprendizado.
Portanto, esse sistema motubrain tem que ser monitorado com muita cautela, para que não ultrapasse os limites de autocontrole de uma máquina.
Pois agora, aprendem rápido de mais, apenas assistindo vídeos e fotos de movimentos em quadrinhos.
Oque é extremamente perigoso esses robôs começarem aprender vendo videos e filmes de artes marciais e aprenderem vários tipos de lutas.
Também apresenta grande perigo de eles aprenderem vendo vídeos de ação em que usam armas de fogo e faças.
Isso aumenta mais o risco de eles atacarem um ser humano indefeso que não saberá lutar com eles.

Responder

China cria cérebro único para robôs que junta visão, linguagem e ação, executa até dez etapas sozinho e promete mudar fábricas, comércio e casas

Modelo chinês alcançou um desempenho de 96,0 em 50 tarefas, superou 95,0 em ambientes aleatórios, aprende com vídeos, entende comandos humanos, tenta corrigir falhas durante ações reais e mira uso em ambientes industriais, comerciais e domésticos

Motubrain funciona como um cérebro geral para robôs

Modelo aprende com vídeos, comandos e ações ao mesmo tempo

Testes mostram 63,77 no WorldArena e 96,0 em 50 tarefas

Robô consegue fazer até 10 etapas em uma única sequência

O cérebro de IA tenta repetir a tarefa quando algo dá errado

Empresas de robótica já entram na rota do Motubrain

Arquitetura unificada tenta substituir robôs cheios de partes separadas

Motubrain mostra uma nova fase da robótica com inteligência artificial

Estudante de Bangladesh juntou baterias velhas de laptop, placas de circuito quebradas e peças de uma TV de tubo antiga para criar um purificador de água movido por energia solar, uma máquina feita de lixo eletrônico que limpa água contaminada em regiões alagadas e sem eletricidade

Enquanto recolhia lixo nas ruas de Goiânia, gari encontrava livros descartados que ajudaram a esposa a passar em concurso público e se tornar capitã da PMGO

Com aluguel e preço das casas expulsando moradores para as ruas, estudante de 18 anos cria microcasa modular com fibra de vidro e PET, promete viver 12 meses no protótipo e quer provar que abrigo para sem-teto pode ser montado em apenas um dia

Aos 20 anos, Filipe trancou Artes Visuais na Ufes para restaurar bonecas e hoje transforma Barbies em obras de arte com mais de 400 peças e 1,2 milhão de seguidores

Duas estudantes de escola pública de Pedra Branca (CE) transformaram carvão de jurema-preta num filtro de água feito com 50 centavos de fibra que deixa a água potável e conquistaram 5 mil dólares na maior feira de ciências do mundo

Chuva de peixe cai do céu em cidades brasileiras durante tempestades e intriga moradores; entenda como trombas-d’água conseguem transportar animais por quilômetros

Lã ficou tão barata que não pagava nem a tosquia, então criadores da Espanha buscaram outro negócio: transformar 160 quilos do material em guarda-sóis térmicos para piscina, criando uma saída curiosa para valorizar um produto rural que virou problema no campo

Navio brasileiro recebe 400 toneladas de combustível com 30% renovável em Roterdã: Transpetro testa B30 pela primeira vez na frota, mira emissões menores no transporte marítimo e mostra como petroleiros podem virar vitrine de uma transição silenciosa nos portos mais estratégicos do mundo

Mais de 60 tratores tomaram as ruas de Lopera quando parques solares passaram a disputar espaço com olivais e o número de árvores afetadas foi de 13 mil a até 100 mil nas contas rivais

Fileiras de “bolas de pedra” aparecem só na maré baixa em praia da Califórnia, com concreções de até 1,5 metro alinhadas como se alguém tivesse montado uma pista de boliche no Pacífico

Homem faz gambiarra genial e transforma airfryer em caixa de som funcional com rádio, alto-falantes e usa botões de temperatura como controle de volume

China cria cérebro único para robôs que junta visão, linguagem e ação, executa até dez etapas sozinho e promete mudar fábricas, comércio e casas

Modelo chinês alcançou um desempenho de 96,0 em 50 tarefas, superou 95,0 em ambientes aleatórios, aprende com vídeos, entende comandos humanos, tenta corrigir falhas durante ações reais e mira uso em ambientes industriais, comerciais e domésticos

Motubrain funciona como um cérebro geral para robôs

Modelo aprende com vídeos, comandos e ações ao mesmo tempo

Testes mostram 63,77 no WorldArena e 96,0 em 50 tarefas

Robô consegue fazer até 10 etapas em uma única sequência

O cérebro de IA tenta repetir a tarefa quando algo dá errado

Empresas de robótica já entram na rota do Motubrain

Arquitetura unificada tenta substituir robôs cheios de partes separadas

Motubrain mostra uma nova fase da robótica com inteligência artificial

Estudante de Bangladesh juntou baterias velhas de laptop, placas de circuito quebradas e peças de uma TV de tubo antiga para criar um purificador de água movido por energia solar, uma máquina feita de lixo eletrônico que limpa água contaminada em regiões alagadas e sem eletricidade

Enquanto recolhia lixo nas ruas de Goiânia, gari encontrava livros descartados que ajudaram a esposa a passar em concurso público e se tornar capitã da PMGO

Com aluguel e preço das casas expulsando moradores para as ruas, estudante de 18 anos cria microcasa modular com fibra de vidro e PET, promete viver 12 meses no protótipo e quer provar que abrigo para sem-teto pode ser montado em apenas um dia

Aos 20 anos, Filipe trancou Artes Visuais na Ufes para restaurar bonecas e hoje transforma Barbies em obras de arte com mais de 400 peças e 1,2 milhão de seguidores

Duas estudantes de escola pública de Pedra Branca (CE) transformaram carvão de jurema-preta num filtro de água feito com 50 centavos de fibra que deixa a água potável e conquistaram 5 mil dólares na maior feira de ciências do mundo

Chuva de peixe cai do céu em cidades brasileiras durante tempestades e intriga moradores; entenda como trombas-d’água conseguem transportar animais por quilômetros

Parecia impossível que apenas cinco bovinos sobrevivessem isolados por mais de 130 anos em uma ilha deserta; quando o DNA foi analisado, a explicação finalmente veio à tona

Nave privada intercepta outra pela primeira vez na história em missão da Força Espacial dos EUA concluída 11 horas antes do prazo e com foguete lançado em tempo recorde de 16 horas

Cientistas calcularam a data de validade da Terra e o resultado assusta: 1,8 bilhão de anos na zona habitável até os oceanos evaporarem e o Sol expulsar o planeta da faixa da vida

Adeus JBL: LG lança caixa de som portátil com até 25 horas de bateria, karaokê com IA que remove vozes em tempo real, som refinado por will.i.am, alto-falantes Peerless e preço de R$ 2.599 no Brasil. Bateria para 25 horas e karaokê: LG lança caixa XBOOM Stage 501 no Brasil

Duas vezes mais rápido que o Concorde: Brasil avança com o projeto hipersônico 14-X da FAB para dominar voos acima de Mach 5, após mais de duas décadas de pesquisas em uma das tecnologias aeroespaciais mais desafiadoras do mundo

Lã ficou tão barata que não pagava nem a tosquia, então criadores da Espanha buscaram outro negócio: transformar 160 quilos do material em guarda-sóis térmicos para piscina, criando uma saída curiosa para valorizar um produto rural que virou problema no campo

Navio brasileiro recebe 400 toneladas de combustível com 30% renovável em Roterdã: Transpetro testa B30 pela primeira vez na frota, mira emissões menores no transporte marítimo e mostra como petroleiros podem virar vitrine de uma transição silenciosa nos portos mais estratégicos do mundo

Mais de 60 tratores tomaram as ruas de Lopera quando parques solares passaram a disputar espaço com olivais e o número de árvores afetadas foi de 13 mil a até 100 mil nas contas rivais

Fileiras de “bolas de pedra” aparecem só na maré baixa em praia da Califórnia, com concreções de até 1,5 metro alinhadas como se alguém tivesse montado uma pista de boliche no Pacífico

Homem faz gambiarra genial e transforma airfryer em caixa de som funcional com rádio, alto-falantes e usa botões de temperatura como controle de volume