Pantera Partners: A Era dos Bots de AI impulsionada por encriptação

Autor: Paul Veradittakit, parceiro da Pantera Capital; tradução: 金色财经xiaozou

Resumo:

VLA* A inovação e a economia de escala estão impulsionando o surgimento de robôs humanoides acessíveis, eficientes e versáteis.

À medida que os robôs de armazenamento se expandem para o mercado de robôs de consumo, a segurança dos robôs, o financiamento e os mecanismos de avaliação merecem uma exploração mais aprofundada.

A tecnologia de criptografia impulsionará o desenvolvimento da indústria robótica ao fornecer garantias econômicas para a segurança dos robôs e otimizar sua infraestrutura de integração, latência e processos de coleta de dados.

O ChatGPT reescreveu completamente as expectativas humanas sobre a inteligência artificial. Quando os grandes modelos de linguagem começaram a interagir com o mundo do software externo, muitas pessoas pensaram que os agentes de IA eram a forma final. Mas se olharmos para clássicos do cinema de ficção científica como "Star Wars", "Blade Runner" ou "RoboCop", perceberemos que o verdadeiro sonho da humanidade é que a inteligência artificial possa interagir com o mundo físico na forma de robôs.

Na opinião da Pantera Capital, o "momento ChatGPT" no campo da robótica está prestes a chegar. Primeiro, analisaremos como os avanços em inteligência artificial nos últimos anos mudaram o panorama da indústria, e depois discutiremos como a tecnologia de baterias, a otimização de latência e as melhorias na coleta de dados moldarão o futuro, assim como o papel da tecnologia cripto nesse contexto. Por fim, explicaremos por que acreditamos que segurança robótica, financiamento, avaliação e educação são áreas verticais que merecem atenção especial.

1**, Elementos de Transformação**

1)Avanços em Inteligência Artificial

Os avanços no campo dos modelos de linguagem multimodal estão a fornecer aos robôs o "cérebro" necessário para executar tarefas complexas. Os robôs percebem o ambiente principalmente através de duas sensibilidades: visão e audição.

Modelos tradicionais de visão computacional (como redes neurais convolucionais) são bons em tarefas de detecção ou classificação de objetos, mas têm dificuldade em transformar informações visuais em instruções de ação com propósito. Embora os grandes modelos de linguagem se destaquem na compreensão e geração de texto, eles são limitados pela sua capacidade de percepção do mundo físico.hYuXnSz1oEEqlhs536Ftw1tGJg7N74gPPK7GYn96.png

Através do modelo de Visão-Linguagem-Ação (VLA), os robôs são capazes de integrar percepção visual, compreensão da linguagem e ação física em uma estrutura computacional unificada. Em fevereiro de 2025, a Figure AI lançou o modelo de controle de robô humanoide genérico Helix, que estabelece um novo padrão para a indústria com sua capacidade de generalização em zero amostras e a arquitetura de sistema 1/sistema 2. A característica de generalização em zero amostras permite que os robôs se adaptem instantaneamente a novos cenários, novos objetos e novas instruções sem a necessidade de treinamento repetido para cada tarefa. A arquitetura sistema 1/sistema 2 separa o raciocínio de alto nível do raciocínio leve, alcançando um robô humanoide comercial que combina pensamento semelhante ao humano com precisão em tempo real.

2)Os robôs econômicos tornaram-se uma realidade

As tecnologias que mudam o mundo têm uma característica comum - a sua acessibilidade. Os smartphones, os computadores pessoais e a tecnologia de impressão 3D tornaram-se acessíveis a preços que a classe média pode suportar. Quando robôs como o Unitree G1 têm preços inferiores ao de um Honda Accord ou ao rendimento anual mínimo de 34.000 dólares nos EUA, não é surpreendente imaginar um mundo em que o trabalho físico e as tarefas diárias sejam principalmente realizados por robôs.

Tn1tv6S36bdGnnOOpqRRqjdc8pnTqJ1EKRERmKtZ.png

3)do armazenamento para o mercado de consumo

A robótica está a expandir-se do setor de armazém para o setor de consumo. Este mundo foi projetado para os humanos - os humanos podem realizar todo o trabalho que os robôs especializados fazem, enquanto os robôs especializados não conseguem realizar todo o trabalho que os humanos fazem. As empresas de robótica já não estão limitadas à fabricação de robôs especializados para fábricas, mas sim a desenvolver robôs humanoides mais versáteis. Assim, a vanguarda da robótica já não se encontra apenas nos armazéns, mas irá infiltrar-se na vida quotidiana.

O custo é um dos principais gargalos da escalabilidade. O indicador que mais nos preocupa é o custo total por hora, que é calculado como a soma do custo de oportunidade do tempo de treinamento e carregamento, do custo de execução da tarefa e do custo de aquisição do robô, dividido pelo total de horas de operação do robô. Esse custo precisa ser inferior ao nível médio de salários da indústria relevante para ser competitivo.

rQCyavIaHdxhfr10i808m9Rj3UhR0JpqVvv1s4kq.png

Para penetrar completamente no setor de armazenamento, o custo total dos robôs por hora deve ser inferior a 31,39 dólares. E no maior mercado de consumo - o setor de educação privada e serviços de saúde - esse custo deve ser mantido abaixo de 35,18 dólares. Atualmente, os robôs estão se desenvolvendo em direção a mais baratos, mais eficientes e mais universais.

2**, O próximo grande avanço na robótica**

1)Otimização da Bateria

A tecnologia de baterias sempre foi um gargalo para robôs amigáveis ao usuário. Veículos elétricos iniciais, como o BMW i3, enfrentaram dificuldades para se popularizar devido às limitações da tecnologia de baterias, que resultavam em autonomia curta, altos custos e baixa praticidade; os robôs estão enfrentando o mesmo dilema. O robô Spot da Boston Dynamics tem uma autonomia de apenas 90 minutos, enquanto a bateria do Unitree G1 tem uma autonomia de cerca de 2 horas**. Os usuários claramente não estão dispostos a recarregar manualmente a cada duas horas**, por isso a recarga autônoma e a infraestrutura de conexão tornaram-se direções de desenvolvimento prioritárias. Atualmente, existem principalmente duas modalidades de recarga para robôs: substituição de baterias ou recarga direta.

O modo de substituição de baterias permite a operação contínua através da substituição rápida de grupos de baterias esgotados, minimizando o tempo de inatividade, sendo adequado para cenários de campo ou de fábrica. Este processo pode ser realizado manualmente ou de forma automatizada.

A carga por indução utiliza um método de fornecimento de energia sem fios. Embora o tempo total de carregamento seja longo, é possível realizar um processo totalmente automatizado com facilidade.

2)otimização de atraso

Operações de baixa latência podem ser divididas em duas categorias: percepção ambiental e controlo remoto. Percepção refere-se à capacidade do robô de reconhecer o espaço do ambiente, enquanto controlo remoto refere-se especificamente ao controle em tempo real por um operador humano.

De acordo com a pesquisa da Cintrini, os sistemas de percepção robótica começaram com sensores baratos, mas a barreira tecnológica reside na fusão de software, computação de baixo consumo e circuitos de controle de milissegundos. Quando o robô conclui a localização espacial, redes neurais leves marcam elementos como obstáculos, paletes ou humanos. Após a entrada do rótulo da cena no sistema de planejamento, são gerados imediatamente comandos de motor enviados para os pés, grupos de rodas ou braços mecânicos. Um atraso de percepção abaixo de 50** milissegundos equivale à velocidade de reflexo humano****——**qualquer atraso que exceda esse limite resultará em movimentos desajeitados do robô. Portanto, 90% das decisões devem ser concluídas localmente através de uma única rede de visão-linguagem-ação.

Robôs totalmente autônomos devem garantir que a latência do modelo VLA de alto desempenho seja inferior a 50 milissegundos; robôs controlados remotamente exigem que a latência do sinal entre a estação de operação e o robô não exceda 50 milissegundos. A importância do modelo VLA se destaca aqui - se a entrada visual e textual for processada por diferentes modelos antes de ser inserida em um grande modelo de linguagem, a latência total ultrapassará amplamente o limite de 50 milissegundos.

3)Otimização da coleta de dados

A coleta de dados tem principalmente três vias: dados de vídeo do mundo real, dados sintéticos e dados de controle remoto. O principal gargalo entre dados reais e dados sintéticos está em fechar a lacuna entre o comportamento físico dos robôs e os modelos de simulação de vídeo**/****.** Os dados de vídeo do mundo real carecem de detalhes físicos como feedback de força, erro de movimento das articulações e deformação dos materiais; os dados de simulação, por outro lado, carecem de variáveis imprevisíveis como falhas de sensores e coeficientes de atrito.

A forma de coleta de dados com maior potencial é o controle remoto — operado por um humano controlando remotamente um robô para executar tarefas. Mas o custo da mão de obra é o principal fator limitante da coleta de dados por controle remoto.

O desenvolvimento de hardware personalizado está também a fornecer novas soluções para a coleta de dados de alta qualidade. A empresa Mecka, através da combinação de métodos convencionais com hardware personalizado, coleta dados de movimento humano em múltiplas dimensões, que após processamento são transformados em conjuntos de dados adequados para o treinamento de redes neurais de robôs, oferecendo uma enorme quantidade de dados de alta qualidade para o treinamento de robôs de IA, em conjunto com ciclos de iteração rápida. Esses canais tecnológicos encurtam coletivamente o caminho de conversão desde os dados brutos até os robôs implantáveis.

3**, Áreas de Exploração Focadas**

1)Fusão de tecnologia de criptografia e robótica

A tecnologia de criptografia pode incentivar as partes não confiáveis a melhorar a eficiência das redes de robôs. Com base nas áreas-chave mencionadas anteriormente, acreditamos que a tecnologia de criptografia pode aumentar a eficiência em três aspectos: integração de infraestrutura, otimização de latência e coleta de dados.

A Rede de Infraestrutura Física Descentralizada (DePIN) promete revolucionar a infraestrutura de carregamento. Quando robôs humanoides começarem a operar globalmente como carros, as estações de carregamento precisarão ser tão acessíveis quanto os postos de gasolina. Redes centralizadas exigem um enorme investimento inicial, enquanto a DePIN distribui os custos entre os operadores de nós, permitindo que as instalações de carregamento se expandam rapidamente para mais áreas.

O DePIN também pode utilizar infraestrutura distribuída para otimizar a latência de controle remoto. Ao agregar recursos de computação de nós de borda geograficamente dispersos, os comandos de controle remoto podem ser processados por nós locais ou os mais próximos disponíveis, minimizando a distância de transmissão de dados e reduzindo significativamente a latência de comunicação. No entanto, os projetos atuais do DePIN concentram-se principalmente em armazenamento descentralizado, distribuição de conteúdo e compartilhamento de largura de banda. Embora haja projetos que demonstrem as vantagens da computação de borda em streaming ou Internet das Coisas, ainda não se estenderam ao campo de robótica ou controle remoto.

O controle remoto é a forma de coleta de dados com mais potencial, mas o custo de contratar profissionais por entidades centralizadas para coletar dados é extremamente alto. O DePIN resolve esse problema incentivando terceiros a fornecer dados de controle remoto através de tokens criptografados. O projeto Reborn constrói uma rede global de operadores remotos, convertendo suas contribuições em ativos digitais tokenizados, formando um sistema descentralizado sem permissão - os participantes podem obter lucros, participar da governança e ajudar no treinamento de robôs AGI.

(2) A segurança é sempre uma preocupação central

O objetivo final da robótica é alcançar a total autonomia, mas como os filmes da série "O Exterminador do Futuro" alertam, o que a humanidade menos deseja é que a autonomia transforme robôs em armas agressivas. As questões de segurança dos grandes modelos de linguagem já suscitaram preocupações, e quando esses modelos possuem capacidade de ação física, a segurança dos robôs torna-se uma condição chave para a aceitação social.

A segurança econômica é um dos pilares da prosperidade do ecossistema robótico. A empresa OpenMind neste campo está a construir o FABRIC — uma camada de coordenação de máquinas descentralizada, que realiza a autenticação de identidade de dispositivos, verificação de presença física e acesso a recursos através de provas criptográficas. Diferentemente da simples gestão de mercados de tarefas, o FABRIC permite que os robôs provem de forma independente a informação de identidade, a localização geográfica e os registros de comportamento, sem depender de intermediários centralizados.

As restrições comportamentais e a autenticação de identidade são executadas através de mecanismos na blockchain, garantindo que qualquer pessoa possa auditar a conformidade. Robôs que atendem aos padrões de segurança, requisitos de qualidade e normas regionais receberão recompensas, enquanto os infratores enfrentarão penalidades ou desqualificação, estabelecendo assim um mecanismo de responsabilidade e confiança na rede de máquinas autônomas.

A rede de re-staking de terceiros (como a Symbiotic) também pode fornecer garantias de segurança equivalentes. Embora o sistema de parâmetros de penalização ainda precise de melhorias, a tecnologia relacionada já entrou na fase prática. Esperamos que as diretrizes de segurança do setor estejam prestes a ser formadas e, nesse momento, os parâmetros de penalização serão modelados de acordo com essas diretrizes.

Exemplo de plano de implementação:

A empresa de robôs juntou-se à rede Symbiotic.

Definir parâmetros de confisco verificáveis (como "aplicar uma força de contacto humano superior a 2500 newtons");

Os apostadores fornecem garantias para garantir que o robô siga os parâmetros;

Se ocorrer uma violação, o depósito será utilizado como compensação para a vítima.

Este modelo não só incentiva as empresas a priorizarem a segurança, como também promove a aceitação por parte dos consumidores através do mecanismo de seguro do pool de fundos em staking.

A visão da equipe Symbiotic sobre o campo da robótica é:

Symbiotic* O quadro de staking universal visa expandir o conceito de staking para todos os campos que necessitam de garantias de segurança econômica, seja por meio de um modelo compartilhado ou independente. Os cenários de aplicação variam de seguros a robótica, exigindo um design específico para cada caso. Por exemplo, uma rede de robôs pode ser totalmente construída com base no quadro Symbiotic, permitindo que as partes interessadas forneçam garantias econômicas para a integridade da rede.*

4**, preencher as lacunas na pilha de tecnologia de robôs**

A OpenAI impulsionou a popularização da IA, mas a base do ChatGPT já havia sido estabelecida. O serviço em nuvem quebrou a dependência dos modelos em relação ao poder computacional local, a Huggingface tornou os modelos de código aberto, e o Kaggle forneceu uma plataforma de experimentação para engenheiros de IA. Esses avanços progressivos contribuíram coletivamente para a democratização da IA.

**Ao contrário da IA, é difícil entrar no campo da robótica quando os recursos são limitados. Para que a robótica se torne mais acessível, as barreiras de entrada no seu desenvolvimento precisam ser reduzidas ao mesmo nível de conveniência que o desenvolvimento de aplicações de IA. Nós **acreditamos que existem áreas para melhorias em três níveis: mecanismos de financiamento, sistemas de avaliação e ecossistemas educacionais.

O financiamento é um ponto crítico no campo da robótica. Desenvolver programas de computador requer apenas um computador e recursos de computação em nuvem, enquanto construir um robô completamente funcional exige a compra de motores, sensores, baterias e outros hardwares, com custos que facilmente ultrapassam 100 mil dólares. Essa natureza do hardware torna o desenvolvimento de robôs menos flexível e mais caro em comparação com a IA.

As infraestruturas de avaliação de robôs em cenários reais ainda estão em fase inicial. No domínio da IA, já foi estabelecido um sistema de funções de perda claro, e os testes podem ser totalmente virtualizados. Mas estratégias virtuais excelentes não podem ser diretamente convertidas em soluções eficazes no mundo real. Os robôs precisam de infraestruturas de avaliação para testar estratégias autónomas em ambientes reais diversificados, a fim de realizar otimizações iterativas.

Quando essa infraestrutura estiver madura, os talentos irão afluir em grande quantidade, e os robôs humanoides irão repetir a curva de explosão da Web2. A empresa de robôs de criptomoeda OpenMind está avançando nessa direção - seu projeto de código aberto OM1 ("sistema Android para robôs") transforma hardware bruto em agentes inteligentes atualizáveis com consciência econômica. Os módulos de visão, linguagem e planejamento de movimento podem ser plug-and-play como aplicativos de telefone, e todos os passos de raciocínio são apresentados em inglês simples, permitindo que o operador audite ou ajuste o comportamento sem precisar lidar com o firmware. Essa capacidade de raciocínio em linguagem natural permite que uma nova geração de talentos entre sem problemas no campo da robótica, dando um passo crucial para desencadear uma revolução robótica em uma plataforma aberta, assim como o movimento de código aberto acelerou a IA.

9w4FeDFrQpSzIOVnqjQL1iz3LrIaGlrRUCz29CRB.png

A densidade de talentos determina a trajetória da indústria. Um sistema educacional estruturado e acessível é crucial para o fornecimento de talentos na área de robótica. A listagem da OpenMind na Nasdaq marca o início de uma nova era em que máquinas inteligentes participam simultaneamente da inovação financeira e da educação prática. A OpenMind** e a Robostore anunciaram em conjunto que lançarão o primeiro currículo educacional universal baseado no robô humanoide Unitree G1 em escolas públicas K-12 nos Estados Unidos. **O design deste currículo possui independência de plataforma, podendo ser adaptado a diversas formas de robôs, proporcionando aos alunos oportunidades de prática. Este sinal positivo reforça nosso julgamento: nos próximos anos, a riqueza dos recursos educacionais em robótica será equivalente à do campo da IA.

5**, Perspectivas Futuras**

A inovação e os efeitos de economia de escala do modelo de Visão-Linguagem-Ação (VLA) deram origem a robôs humanoides acessíveis, eficientes e universais. Com a expansão dos robôs de armazém para o mercado de consumo, a segurança, os modelos de financiamento e os sistemas de avaliação tornaram-se direções-chave de exploração. Acreditamos firmemente que a tecnologia de criptografia impulsionará o desenvolvimento de robôs através de três caminhos: fornecendo garantias econômicas para a segurança, otimizando a infraestrutura de carregamento e melhorando o desempenho de latência e os canais de coleta de dados.

Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)