Autor: Paul Veradittakit, socio de Pantera Capital; Traducción: Jinse Caijing xiaozou
Resumen:
VLA* La innovación y los efectos de escala están impulsando el nacimiento de robots humanoides económicos, eficientes y versátiles.*
A medida que los robots de almacenamiento se expanden al mercado de robots de consumo, la seguridad de los robots, la financiación y los mecanismos de evaluación merecen una exploración profunda.
La tecnología blockchain impulsará el desarrollo de la industria robótica al proporcionar garantías económicas para la seguridad de los robots y optimizar su infraestructura de conexión, latencia y procesos de recopilación de datos.
ChatGPT ha transformado por completo las expectativas humanas sobre la inteligencia artificial. Cuando los modelos de lenguaje comenzaron a interactuar con el mundo del software externo, muchas personas pensaron que los agentes de IA eran la forma definitiva. Sin embargo, al revisar clásicos del cine de ciencia ficción como "Star Wars", "Blade Runner" o "RoboCop", uno se da cuenta de que el verdadero sueño de la humanidad es que la inteligencia artificial pueda interactuar con el mundo físico en forma de robots.
Según Pantera Capital, el "momento ChatGPT" en el ámbito de la robótica está a punto de llegar. Primero, analizaremos cómo los avances en inteligencia artificial de los últimos años han cambiado el panorama de la industria, y luego exploraremos cómo la tecnología de baterías, la optimización de retrasos y la mejora en la recopilación de datos darán forma al futuro, así como el papel que desempeñará la tecnología criptográfica en todo esto. Por último, explicaremos por qué creemos que la seguridad robótica, la financiación, la evaluación y la educación son verticales que merecen atención prioritaria.
1**, Elementos de transformación**
(1)Ruptura de la inteligencia artificial
Los avances en el campo de los modelos de lenguaje multimodal están dando a los robots el "cerebro" necesario para realizar tareas complejas. Los robots perciben el entorno principalmente a través de dos sentidos: la visión y la audición.
Los modelos de visión por computadora tradicionales (como las redes neuronales convolucionales) son excelentes en tareas de detección o clasificación de objetos, pero les resulta difícil convertir la información visual en instrucciones de acción con un propósito. Aunque los grandes modelos de lenguaje destacan en la comprensión y generación de texto, están limitados en su capacidad de percepción del mundo físico.
A través del modelo de visión-lenguaje-acción (VLA), los robots pueden integrar la percepción visual, la comprensión del lenguaje y la acción física dentro de un marco computacional unificado. En febrero de 2025, Figure AI lanzó el modelo de control de robots humanoides universal Helix, el cual establece un nuevo estándar en la industria gracias a su capacidad de generalización de cero ejemplos y su arquitectura de sistema 1/sistema 2. La característica de generalización de cero ejemplos permite que los robots se adapten instantáneamente a nuevos escenarios, objetos e instrucciones sin necesidad de entrenamiento repetido para cada tarea. La arquitectura de sistema 1/sistema 2 separa el razonamiento de alto nivel del razonamiento ligero, logrando un robot humanoide comercial que combina el pensamiento humano con precisión en tiempo real.
(2)Los robots económicos se convierten en realidad
Las tecnologías que cambian el mundo tienen una característica común: la capacidad de ser accesibles. Los teléfonos inteligentes, las computadoras personales y la tecnología de impresión 3D se han popularizado a precios asequibles para la clase media. Cuando el precio de robots como el Unitree G1 es inferior al de un Honda Accord o al ingreso mínimo anual en EE. UU. de 34,000 dólares, no es sorprendente imaginar un mundo donde el trabajo físico y las tareas diarias son principalmente realizadas por robots.
(3)de almacenamiento a mercado de consumo
La robótica está expandiéndose de soluciones de almacenamiento al campo del consumo. Este mundo está diseñado para los humanos: los humanos pueden realizar todas las tareas de los robots especializados, mientras que los robots especializados no pueden realizar todas las tareas humanas. Las empresas de robótica ya no se limitan a fabricar robots para fábricas, sino que están desarrollando robots humanoides más versátiles. Por lo tanto, la vanguardia de la robótica no solo existe en los almacenes, sino que también penetrará en la vida cotidiana.
El costo es uno de los principales cuellos de botella de la escalabilidad. El indicador que más nos interesa es el costo total por hora, que se calcula como la suma del costo de oportunidad del tiempo de entrenamiento y carga, el costo de ejecución de tareas y el costo de adquisición de robots, dividido por el total de horas de operación de los robots. Este costo debe ser inferior al nivel salarial promedio de la industria para ser competitivo.
Para lograr una penetración completa en el campo del almacenamiento, el costo integral de los robots debe ser inferior a 31.39 dólares por hora. En el mayor mercado de consumo: el sector de educación privada y servicios de salud, este costo debe mantenerse por debajo de 35.18 dólares. Actualmente, los robots están evolucionando hacia más económicos, más eficientes y más versátiles.
2**, El próximo gran avance en la tecnología robótica**
(1)Optimización de batería
La tecnología de baterías ha sido siempre un cuello de botella para los robots amigables con el usuario. Los primeros vehículos eléctricos, como el BMW i3, enfrentaron limitaciones en la tecnología de baterías que resultaron en una corta autonomía, altos costos y baja practicidad, lo que dificultó su difusión; los robots enfrentan la misma dificultad. El robot Spot de Boston Dynamics tiene una autonomía de solo 90 minutos, mientras que la batería del Unitree G1 tiene una autonomía de aproximadamente 2 horas**. Los usuarios claramente no quieren cargar manualmente cada dos horas**, por lo que la carga autónoma y la infraestructura de acoplamiento se han convertido en direcciones clave de desarrollo. Actualmente, hay dos modos principales de carga para robots: reemplazo de batería o carga directa.
El modo de reemplazo de batería permite la operación continua mediante el reemplazo rápido de un conjunto de baterías agotadas, minimizando el tiempo de inactividad, y es adecuado para escenarios en el campo o en fábricas. Este proceso puede ser operado manualmente o completado de forma automatizada.
La carga por inducción utiliza un método de suministro de energía inalámbrico. Aunque el tiempo de carga completa es largo, puede lograr fácilmente un proceso completamente automatizado.
(2)Optimización de retraso
Las operaciones de baja latencia se pueden dividir en dos categorías: percepción ambiental y control remoto. La percepción se refiere a la capacidad de los robots para reconocer el espacio del entorno, mientras que el control remoto se refiere específicamente al control en tiempo real por parte de los operadores humanos.
Según la investigación de Cintrini, los sistemas de percepción robótica comienzan con sensores baratos, pero la ventaja tecnológica radica en el software de fusión, la computación de bajo consumo y los circuitos de control de milisegundos. Una vez que el robot completa la localización espacial, una red neuronal ligera etiqueta elementos como obstáculos, paletas o humanos. Después de que las etiquetas de escena se introducen en el sistema de planificación, se generan inmediatamente instrucciones de motor que se envían a los pies, al grupo de ruedas o al brazo mecánico. Un retraso de percepción de menos de 50 milisegundos es equivalente a la velocidad de reflejo humano**——**cualquier retraso que supere este umbral hará que los movimientos del robot sean torpes. Por lo tanto, el 90% de las decisiones deben realizarse localmente a través de una única red de visión-lenguaje-acción.
Los robots totalmente autónomos deben asegurar que la latencia del modelo VLA de alto rendimiento sea inferior a 50 milisegundos; los robots controlados a distancia requieren que la latencia de la señal entre el terminal de operación y el robot no supere los 50 milisegundos. Aquí se destaca la importancia del modelo VLA: si la entrada visual y de texto se procesan por diferentes modelos antes de ingresar al modelo de lenguaje grande, la latencia total superará con creces el umbral de 50 milisegundos.
(3)Optimización de la recolección de datos
La recopilación de datos tiene principalmente tres vías: datos de video del mundo real, datos sintéticos y datos de control remoto. El principal obstáculo entre los datos reales y los datos sintéticos radica en cerrar la brecha entre el comportamiento físico del robot y el modelo de simulación de video. Los datos de video del mundo real carecen de detalles físicos como la retroalimentación de fuerza, errores en el movimiento de las articulaciones y deformaciones de materiales; los datos de simulación, por otro lado, carecen de variables impredecibles como fallas en los sensores y coeficientes de fricción.
La forma de recopilación de datos más prometedora es el control remoto — un operador humano controla a distancia un robot para ejecutar tareas. Pero el costo laboral es el principal factor limitante de la recopilación de datos mediante control remoto.
El desarrollo de hardware personalizado también está proporcionando nuevas soluciones para la recopilación de datos de alta calidad. La empresa Mecka combina métodos convencionales con hardware personalizado para recopilar datos de movimiento humano en múltiples dimensiones, que, tras su procesamiento, se convierten en conjuntos de datos aptos para el entrenamiento de redes neuronales de robots, proporcionando una gran cantidad de datos de alta calidad para el entrenamiento de robots AI con un ciclo de iteración rápido. Estos canales tecnológicos acortan conjuntamente el camino de conversión de datos en bruto a robots desplegables.
3**, Áreas clave de exploración**
(1)Fusión de tecnología criptográfica y robótica
La tecnología de criptografía puede incentivar a las partes no confiables a mejorar la eficiencia de la red de robots. Basándonos en los campos clave mencionados anteriormente, creemos que la tecnología de criptografía puede mejorar la eficiencia en tres aspectos: la integración de infraestructura, la optimización de la latencia y la recolección de datos.
La red de infraestructura física descentralizada (DePIN) promete revolucionar la infraestructura de carga. Cuando los robots humanoides operen globalmente como automóviles, las estaciones de carga deberán ser tan accesibles como las estaciones de servicio. Las redes centralizadas requieren una inversión inicial enorme, mientras que DePIN distribuye los costos entre los operadores de nodos, lo que permite una rápida expansión de las instalaciones de carga a más áreas.
DePIN también puede utilizar infraestructura distribuida para optimizar la latencia del control remoto. Al agregar los recursos de computación de nodos de borde geográficamente dispersos, las instrucciones de control remoto pueden ser procesadas por nodos locales o los más cercanos disponibles, minimizando la distancia de transmisión de datos y reduciendo significativamente la latencia de comunicación. Sin embargo, los proyectos actuales de DePIN se centran principalmente en el almacenamiento descentralizado, la distribución de contenido y el intercambio de ancho de banda; aunque hay proyectos que muestran las ventajas de la computación en el borde en el streaming o en el Internet de las Cosas, aún no se ha extendido al ámbito de la robótica o el control remoto.
El control remoto es el método de recolección de datos más prometedor, pero el costo de contratar profesionales para la recolección de datos por entidades centralizadas es extremadamente alto. DePIN aborda este problema mediante la incentivación de terceros con tokens criptográficos para proporcionar datos de control remoto. El proyecto Reborn construye una red global de operadores remotos, transformando sus contribuciones en activos digitales tokenizados, creando un sistema descentralizado sin permisos: los participantes pueden obtener ganancias, participar en la gobernanza y ayudar en el entrenamiento de robots AGI.
(2) La seguridad siempre es una preocupación central
El objetivo final de la robótica es lograr una autonomía completa, pero como advierte la serie de películas "Terminator", lo que menos desea la humanidad es que la autonomía convierta a los robots en armas agresivas. Los problemas de seguridad de los modelos de lenguaje han generado preocupación, y cuando estos modelos tienen la capacidad de actuar físicamente, la seguridad de los robots se convierte en un requisito clave para la aceptación social.
La seguridad económica es uno de los pilares de la prosperidad del ecosistema robótico. La empresa OpenMind en este campo está construyendo FABRIC: una capa de coordinación de máquinas descentralizada que permite la autenticación de la identidad de los dispositivos, la verificación de la presencia física y la obtención de recursos a través de pruebas criptográficas. A diferencia de la simple gestión del mercado de tareas, FABRIC permite a los robots demostrar de manera autónoma su información de identidad, ubicación geográfica y registros de comportamiento sin depender de intermediarios centralizados.
Las restricciones de comportamiento y la autenticación de identidad se ejecutan a través de mecanismos en la cadena, asegurando que cualquier persona pueda auditar la conformidad. Los robots que cumplan con los estándares de seguridad, los requisitos de calidad y las normativas regionales recibirán recompensas, mientras que los infractores enfrentarán sanciones o descalificación, estableciendo así un mecanismo de responsabilidad y confianza en la red de máquinas autónomas.
Las redes de rehipoteca de terceros (como Symbiotic) también pueden proporcionar garantías de seguridad equivalentes. Aunque el sistema de parámetros de penalización aún necesita ser perfeccionado, la tecnología relacionada ha entrado en una fase práctica. Esperamos que se establezcan pronto las normas de seguridad de la industria, y en ese momento, los parámetros de penalización se modelarán según estas normas.
Ejemplo de plan de implementación:
La empresa de robots se une a la red Symbiotic.
Establecer parámetros de confiscación verificables (como "aplicar una fuerza de contacto humano de más de 2500 newtons");
Los apostadores proporcionan un margen para garantizar que el robot cumpla con los parámetros;
Si se producen infracciones, el depósito se utilizará como indemnización para la víctima.
Este modelo no solo incentiva a las empresas a priorizar la seguridad, sino que también fomenta la aceptación por parte de los consumidores a través del mecanismo de seguro del fondo de staking.
La perspectiva del equipo de Symbiotic sobre el campo de los robots es:
Symbiotic* El marco de staking universal tiene como objetivo extender el concepto de staking a todos los campos que necesitan un respaldo de seguridad económica, ya sea a través de un modelo compartido o independiente. Sus escenarios de aplicación, desde seguros hasta robótica, requieren un diseño específico para cada caso. Por ejemplo, una red de robots se puede construir completamente sobre el marco de Symbiotic, permitiendo que las partes interesadas proporcionen garantías económicas para la integridad de la red.*
4**, llenar los vacíos en la pila de tecnología de robots**
OpenAI ha impulsado la popularización de la IA, pero la piedra angular de ChatGPT ya se había establecido. Los servicios en la nube han roto la dependencia de los modelos en la potencia de cálculo local, Huggingface ha logrado la apertura del código de los modelos, y Kaggle proporciona una plataforma de experimentación para ingenieros de IA. Estos avances progresivos han contribuido conjuntamente a la democratización de la IA.
**A diferencia deAI, el campo de la robótica es difícil de acceder con fondos limitados. Para lograr la popularización de la robótica, el umbral de desarrollo debe reducirse a un nivel de facilidad comparable al desarrollo de aplicaciones de AI. Creemos que hay espacio para mejorar en tres áreas: mecanismos de financiación, sistemas de evaluación y ecosistemas educativos.
El financiamiento es un punto crítico en el campo de los robots. Desarrollar un programa informático solo requiere una computadora y recursos de computación en la nube, mientras que construir un robot completamente funcional requiere la compra de motores, sensores, baterías y otro hardware, con costos que fácilmente superan los 100,000 dólares. Esta naturaleza del hardware hace que el desarrollo de robots sea menos flexible y más costoso en comparación con la IA.
Las infraestructuras de evaluación de robots en escenarios reales aún se encuentran en una etapa inicial. En el campo de la IA se ha establecido un sistema claro de funciones de pérdida, y las pruebas pueden ser completamente virtualizadas. Sin embargo, las excelentes estrategias virtuales no se pueden traducir directamente en soluciones efectivas en el mundo real. Los robots necesitan instalaciones de evaluación de estrategias autónomas probadas en entornos reales diversos para lograr una optimización iterativa.
Cuando esta infraestructura esté madura, los talentos fluirán en grandes cantidades y los robots humanoides repetirán la curva de explosión de Web2. La empresa de robots criptográficos OpenMind está avanzando en esta dirección: su proyecto de código abierto OM1 ("sistema operativo Android para robots") convierte el hardware original en agentes inteligentes escalables con conciencia económica. Los módulos de visión, lenguaje y planificación de movimiento pueden ser plug-and-play como aplicaciones móviles, y todos los pasos de inferencia se presentan en un inglés claro, lo que permite a los operadores auditar o ajustar el comportamiento sin necesidad de interactuar con el firmware. Esta capacidad de razonamiento en lenguaje natural permite que la nueva generación de talentos ingrese sin problemas al campo de la robótica, dando un paso clave hacia una plataforma abierta que detone la revolución robótica, al igual que el movimiento de código abierto ha acelerado la IA.
La densidad de talento determina la trayectoria de la industria. Un sistema educativo inclusivo y estructurado es crucial para la provisión de talento en el campo de la robótica. La llegada de OpenMind a Nasdaq marca el inicio de una nueva era en la que las máquinas inteligentes participan simultáneamente en la innovación financiera y la educación formal. OpenMind** y Robostore anunciaron conjuntamente que lanzarán el primer curso de educación general basado en el robot humanoide Unitree G1 en las escuelas públicas K-12 de EE. UU. **El diseño del curso es independiente de la plataforma, lo que lo hace adaptable a diversas formas de robots, ofreciendo a los estudiantes oportunidades de práctica. Esta señal positiva refuerza nuestro juicio: **en los próximos años, la riqueza de los recursos educativos en robótica igualará la del campo de la IA.
5**, Perspectivas Futuras**
La innovación y los efectos de economías de escala del modelo de visualización-lenguaje-acción (VLA) han dado lugar a robots humanoides económicos, eficientes y universales. A medida que los robots de almacenamiento se expanden al mercado de consumo, la seguridad, los modelos de financiamiento y los sistemas de evaluación se convierten en direcciones clave de exploración. Estamos convencidos de que la tecnología de criptografía impulsará el desarrollo de los robots a través de tres caminos: proporcionando garantías económicas para la seguridad, optimizando la infraestructura de carga y mejorando el rendimiento de latencia y los canales de recopilación de datos.
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
Socios de Pantera: Era de Bots impulsados por encriptación
Autor: Paul Veradittakit, socio de Pantera Capital; Traducción: Jinse Caijing xiaozou
Resumen:
VLA* La innovación y los efectos de escala están impulsando el nacimiento de robots humanoides económicos, eficientes y versátiles.*
A medida que los robots de almacenamiento se expanden al mercado de robots de consumo, la seguridad de los robots, la financiación y los mecanismos de evaluación merecen una exploración profunda.
La tecnología blockchain impulsará el desarrollo de la industria robótica al proporcionar garantías económicas para la seguridad de los robots y optimizar su infraestructura de conexión, latencia y procesos de recopilación de datos.
ChatGPT ha transformado por completo las expectativas humanas sobre la inteligencia artificial. Cuando los modelos de lenguaje comenzaron a interactuar con el mundo del software externo, muchas personas pensaron que los agentes de IA eran la forma definitiva. Sin embargo, al revisar clásicos del cine de ciencia ficción como "Star Wars", "Blade Runner" o "RoboCop", uno se da cuenta de que el verdadero sueño de la humanidad es que la inteligencia artificial pueda interactuar con el mundo físico en forma de robots.
Según Pantera Capital, el "momento ChatGPT" en el ámbito de la robótica está a punto de llegar. Primero, analizaremos cómo los avances en inteligencia artificial de los últimos años han cambiado el panorama de la industria, y luego exploraremos cómo la tecnología de baterías, la optimización de retrasos y la mejora en la recopilación de datos darán forma al futuro, así como el papel que desempeñará la tecnología criptográfica en todo esto. Por último, explicaremos por qué creemos que la seguridad robótica, la financiación, la evaluación y la educación son verticales que merecen atención prioritaria.
1**, Elementos de transformación**
(1)Ruptura de la inteligencia artificial
Los avances en el campo de los modelos de lenguaje multimodal están dando a los robots el "cerebro" necesario para realizar tareas complejas. Los robots perciben el entorno principalmente a través de dos sentidos: la visión y la audición.
Los modelos de visión por computadora tradicionales (como las redes neuronales convolucionales) son excelentes en tareas de detección o clasificación de objetos, pero les resulta difícil convertir la información visual en instrucciones de acción con un propósito. Aunque los grandes modelos de lenguaje destacan en la comprensión y generación de texto, están limitados en su capacidad de percepción del mundo físico.
A través del modelo de visión-lenguaje-acción (VLA), los robots pueden integrar la percepción visual, la comprensión del lenguaje y la acción física dentro de un marco computacional unificado. En febrero de 2025, Figure AI lanzó el modelo de control de robots humanoides universal Helix, el cual establece un nuevo estándar en la industria gracias a su capacidad de generalización de cero ejemplos y su arquitectura de sistema 1/sistema 2. La característica de generalización de cero ejemplos permite que los robots se adapten instantáneamente a nuevos escenarios, objetos e instrucciones sin necesidad de entrenamiento repetido para cada tarea. La arquitectura de sistema 1/sistema 2 separa el razonamiento de alto nivel del razonamiento ligero, logrando un robot humanoide comercial que combina el pensamiento humano con precisión en tiempo real.
(2)Los robots económicos se convierten en realidad
Las tecnologías que cambian el mundo tienen una característica común: la capacidad de ser accesibles. Los teléfonos inteligentes, las computadoras personales y la tecnología de impresión 3D se han popularizado a precios asequibles para la clase media. Cuando el precio de robots como el Unitree G1 es inferior al de un Honda Accord o al ingreso mínimo anual en EE. UU. de 34,000 dólares, no es sorprendente imaginar un mundo donde el trabajo físico y las tareas diarias son principalmente realizadas por robots.
(3)de almacenamiento a mercado de consumo
La robótica está expandiéndose de soluciones de almacenamiento al campo del consumo. Este mundo está diseñado para los humanos: los humanos pueden realizar todas las tareas de los robots especializados, mientras que los robots especializados no pueden realizar todas las tareas humanas. Las empresas de robótica ya no se limitan a fabricar robots para fábricas, sino que están desarrollando robots humanoides más versátiles. Por lo tanto, la vanguardia de la robótica no solo existe en los almacenes, sino que también penetrará en la vida cotidiana.
El costo es uno de los principales cuellos de botella de la escalabilidad. El indicador que más nos interesa es el costo total por hora, que se calcula como la suma del costo de oportunidad del tiempo de entrenamiento y carga, el costo de ejecución de tareas y el costo de adquisición de robots, dividido por el total de horas de operación de los robots. Este costo debe ser inferior al nivel salarial promedio de la industria para ser competitivo.
Para lograr una penetración completa en el campo del almacenamiento, el costo integral de los robots debe ser inferior a 31.39 dólares por hora. En el mayor mercado de consumo: el sector de educación privada y servicios de salud, este costo debe mantenerse por debajo de 35.18 dólares. Actualmente, los robots están evolucionando hacia más económicos, más eficientes y más versátiles.
2**, El próximo gran avance en la tecnología robótica**
(1)Optimización de batería
La tecnología de baterías ha sido siempre un cuello de botella para los robots amigables con el usuario. Los primeros vehículos eléctricos, como el BMW i3, enfrentaron limitaciones en la tecnología de baterías que resultaron en una corta autonomía, altos costos y baja practicidad, lo que dificultó su difusión; los robots enfrentan la misma dificultad. El robot Spot de Boston Dynamics tiene una autonomía de solo 90 minutos, mientras que la batería del Unitree G1 tiene una autonomía de aproximadamente 2 horas**. Los usuarios claramente no quieren cargar manualmente cada dos horas**, por lo que la carga autónoma y la infraestructura de acoplamiento se han convertido en direcciones clave de desarrollo. Actualmente, hay dos modos principales de carga para robots: reemplazo de batería o carga directa.
El modo de reemplazo de batería permite la operación continua mediante el reemplazo rápido de un conjunto de baterías agotadas, minimizando el tiempo de inactividad, y es adecuado para escenarios en el campo o en fábricas. Este proceso puede ser operado manualmente o completado de forma automatizada.
La carga por inducción utiliza un método de suministro de energía inalámbrico. Aunque el tiempo de carga completa es largo, puede lograr fácilmente un proceso completamente automatizado.
(2)Optimización de retraso
Las operaciones de baja latencia se pueden dividir en dos categorías: percepción ambiental y control remoto. La percepción se refiere a la capacidad de los robots para reconocer el espacio del entorno, mientras que el control remoto se refiere específicamente al control en tiempo real por parte de los operadores humanos.
Según la investigación de Cintrini, los sistemas de percepción robótica comienzan con sensores baratos, pero la ventaja tecnológica radica en el software de fusión, la computación de bajo consumo y los circuitos de control de milisegundos. Una vez que el robot completa la localización espacial, una red neuronal ligera etiqueta elementos como obstáculos, paletas o humanos. Después de que las etiquetas de escena se introducen en el sistema de planificación, se generan inmediatamente instrucciones de motor que se envían a los pies, al grupo de ruedas o al brazo mecánico. Un retraso de percepción de menos de 50 milisegundos es equivalente a la velocidad de reflejo humano**——**cualquier retraso que supere este umbral hará que los movimientos del robot sean torpes. Por lo tanto, el 90% de las decisiones deben realizarse localmente a través de una única red de visión-lenguaje-acción.
Los robots totalmente autónomos deben asegurar que la latencia del modelo VLA de alto rendimiento sea inferior a 50 milisegundos; los robots controlados a distancia requieren que la latencia de la señal entre el terminal de operación y el robot no supere los 50 milisegundos. Aquí se destaca la importancia del modelo VLA: si la entrada visual y de texto se procesan por diferentes modelos antes de ingresar al modelo de lenguaje grande, la latencia total superará con creces el umbral de 50 milisegundos.
(3)Optimización de la recolección de datos
La recopilación de datos tiene principalmente tres vías: datos de video del mundo real, datos sintéticos y datos de control remoto. El principal obstáculo entre los datos reales y los datos sintéticos radica en cerrar la brecha entre el comportamiento físico del robot y el modelo de simulación de video. Los datos de video del mundo real carecen de detalles físicos como la retroalimentación de fuerza, errores en el movimiento de las articulaciones y deformaciones de materiales; los datos de simulación, por otro lado, carecen de variables impredecibles como fallas en los sensores y coeficientes de fricción.
La forma de recopilación de datos más prometedora es el control remoto — un operador humano controla a distancia un robot para ejecutar tareas. Pero el costo laboral es el principal factor limitante de la recopilación de datos mediante control remoto.
El desarrollo de hardware personalizado también está proporcionando nuevas soluciones para la recopilación de datos de alta calidad. La empresa Mecka combina métodos convencionales con hardware personalizado para recopilar datos de movimiento humano en múltiples dimensiones, que, tras su procesamiento, se convierten en conjuntos de datos aptos para el entrenamiento de redes neuronales de robots, proporcionando una gran cantidad de datos de alta calidad para el entrenamiento de robots AI con un ciclo de iteración rápido. Estos canales tecnológicos acortan conjuntamente el camino de conversión de datos en bruto a robots desplegables.
3**, Áreas clave de exploración**
(1)Fusión de tecnología criptográfica y robótica
La tecnología de criptografía puede incentivar a las partes no confiables a mejorar la eficiencia de la red de robots. Basándonos en los campos clave mencionados anteriormente, creemos que la tecnología de criptografía puede mejorar la eficiencia en tres aspectos: la integración de infraestructura, la optimización de la latencia y la recolección de datos.
La red de infraestructura física descentralizada (DePIN) promete revolucionar la infraestructura de carga. Cuando los robots humanoides operen globalmente como automóviles, las estaciones de carga deberán ser tan accesibles como las estaciones de servicio. Las redes centralizadas requieren una inversión inicial enorme, mientras que DePIN distribuye los costos entre los operadores de nodos, lo que permite una rápida expansión de las instalaciones de carga a más áreas.
DePIN también puede utilizar infraestructura distribuida para optimizar la latencia del control remoto. Al agregar los recursos de computación de nodos de borde geográficamente dispersos, las instrucciones de control remoto pueden ser procesadas por nodos locales o los más cercanos disponibles, minimizando la distancia de transmisión de datos y reduciendo significativamente la latencia de comunicación. Sin embargo, los proyectos actuales de DePIN se centran principalmente en el almacenamiento descentralizado, la distribución de contenido y el intercambio de ancho de banda; aunque hay proyectos que muestran las ventajas de la computación en el borde en el streaming o en el Internet de las Cosas, aún no se ha extendido al ámbito de la robótica o el control remoto.
El control remoto es el método de recolección de datos más prometedor, pero el costo de contratar profesionales para la recolección de datos por entidades centralizadas es extremadamente alto. DePIN aborda este problema mediante la incentivación de terceros con tokens criptográficos para proporcionar datos de control remoto. El proyecto Reborn construye una red global de operadores remotos, transformando sus contribuciones en activos digitales tokenizados, creando un sistema descentralizado sin permisos: los participantes pueden obtener ganancias, participar en la gobernanza y ayudar en el entrenamiento de robots AGI.
(2) La seguridad siempre es una preocupación central
El objetivo final de la robótica es lograr una autonomía completa, pero como advierte la serie de películas "Terminator", lo que menos desea la humanidad es que la autonomía convierta a los robots en armas agresivas. Los problemas de seguridad de los modelos de lenguaje han generado preocupación, y cuando estos modelos tienen la capacidad de actuar físicamente, la seguridad de los robots se convierte en un requisito clave para la aceptación social.
La seguridad económica es uno de los pilares de la prosperidad del ecosistema robótico. La empresa OpenMind en este campo está construyendo FABRIC: una capa de coordinación de máquinas descentralizada que permite la autenticación de la identidad de los dispositivos, la verificación de la presencia física y la obtención de recursos a través de pruebas criptográficas. A diferencia de la simple gestión del mercado de tareas, FABRIC permite a los robots demostrar de manera autónoma su información de identidad, ubicación geográfica y registros de comportamiento sin depender de intermediarios centralizados.
Las restricciones de comportamiento y la autenticación de identidad se ejecutan a través de mecanismos en la cadena, asegurando que cualquier persona pueda auditar la conformidad. Los robots que cumplan con los estándares de seguridad, los requisitos de calidad y las normativas regionales recibirán recompensas, mientras que los infractores enfrentarán sanciones o descalificación, estableciendo así un mecanismo de responsabilidad y confianza en la red de máquinas autónomas.
Las redes de rehipoteca de terceros (como Symbiotic) también pueden proporcionar garantías de seguridad equivalentes. Aunque el sistema de parámetros de penalización aún necesita ser perfeccionado, la tecnología relacionada ha entrado en una fase práctica. Esperamos que se establezcan pronto las normas de seguridad de la industria, y en ese momento, los parámetros de penalización se modelarán según estas normas.
Ejemplo de plan de implementación:
La empresa de robots se une a la red Symbiotic.
Establecer parámetros de confiscación verificables (como "aplicar una fuerza de contacto humano de más de 2500 newtons");
Los apostadores proporcionan un margen para garantizar que el robot cumpla con los parámetros;
Si se producen infracciones, el depósito se utilizará como indemnización para la víctima.
Este modelo no solo incentiva a las empresas a priorizar la seguridad, sino que también fomenta la aceptación por parte de los consumidores a través del mecanismo de seguro del fondo de staking.
La perspectiva del equipo de Symbiotic sobre el campo de los robots es:
Symbiotic* El marco de staking universal tiene como objetivo extender el concepto de staking a todos los campos que necesitan un respaldo de seguridad económica, ya sea a través de un modelo compartido o independiente. Sus escenarios de aplicación, desde seguros hasta robótica, requieren un diseño específico para cada caso. Por ejemplo, una red de robots se puede construir completamente sobre el marco de Symbiotic, permitiendo que las partes interesadas proporcionen garantías económicas para la integridad de la red.*
4**, llenar los vacíos en la pila de tecnología de robots**
OpenAI ha impulsado la popularización de la IA, pero la piedra angular de ChatGPT ya se había establecido. Los servicios en la nube han roto la dependencia de los modelos en la potencia de cálculo local, Huggingface ha logrado la apertura del código de los modelos, y Kaggle proporciona una plataforma de experimentación para ingenieros de IA. Estos avances progresivos han contribuido conjuntamente a la democratización de la IA.
**A diferencia deAI, el campo de la robótica es difícil de acceder con fondos limitados. Para lograr la popularización de la robótica, el umbral de desarrollo debe reducirse a un nivel de facilidad comparable al desarrollo de aplicaciones de AI. Creemos que hay espacio para mejorar en tres áreas: mecanismos de financiación, sistemas de evaluación y ecosistemas educativos.
El financiamiento es un punto crítico en el campo de los robots. Desarrollar un programa informático solo requiere una computadora y recursos de computación en la nube, mientras que construir un robot completamente funcional requiere la compra de motores, sensores, baterías y otro hardware, con costos que fácilmente superan los 100,000 dólares. Esta naturaleza del hardware hace que el desarrollo de robots sea menos flexible y más costoso en comparación con la IA.
Las infraestructuras de evaluación de robots en escenarios reales aún se encuentran en una etapa inicial. En el campo de la IA se ha establecido un sistema claro de funciones de pérdida, y las pruebas pueden ser completamente virtualizadas. Sin embargo, las excelentes estrategias virtuales no se pueden traducir directamente en soluciones efectivas en el mundo real. Los robots necesitan instalaciones de evaluación de estrategias autónomas probadas en entornos reales diversos para lograr una optimización iterativa.
Cuando esta infraestructura esté madura, los talentos fluirán en grandes cantidades y los robots humanoides repetirán la curva de explosión de Web2. La empresa de robots criptográficos OpenMind está avanzando en esta dirección: su proyecto de código abierto OM1 ("sistema operativo Android para robots") convierte el hardware original en agentes inteligentes escalables con conciencia económica. Los módulos de visión, lenguaje y planificación de movimiento pueden ser plug-and-play como aplicaciones móviles, y todos los pasos de inferencia se presentan en un inglés claro, lo que permite a los operadores auditar o ajustar el comportamiento sin necesidad de interactuar con el firmware. Esta capacidad de razonamiento en lenguaje natural permite que la nueva generación de talentos ingrese sin problemas al campo de la robótica, dando un paso clave hacia una plataforma abierta que detone la revolución robótica, al igual que el movimiento de código abierto ha acelerado la IA.
La densidad de talento determina la trayectoria de la industria. Un sistema educativo inclusivo y estructurado es crucial para la provisión de talento en el campo de la robótica. La llegada de OpenMind a Nasdaq marca el inicio de una nueva era en la que las máquinas inteligentes participan simultáneamente en la innovación financiera y la educación formal. OpenMind** y Robostore anunciaron conjuntamente que lanzarán el primer curso de educación general basado en el robot humanoide Unitree G1 en las escuelas públicas K-12 de EE. UU. **El diseño del curso es independiente de la plataforma, lo que lo hace adaptable a diversas formas de robots, ofreciendo a los estudiantes oportunidades de práctica. Esta señal positiva refuerza nuestro juicio: **en los próximos años, la riqueza de los recursos educativos en robótica igualará la del campo de la IA.
5**, Perspectivas Futuras**
La innovación y los efectos de economías de escala del modelo de visualización-lenguaje-acción (VLA) han dado lugar a robots humanoides económicos, eficientes y universales. A medida que los robots de almacenamiento se expanden al mercado de consumo, la seguridad, los modelos de financiamiento y los sistemas de evaluación se convierten en direcciones clave de exploración. Estamos convencidos de que la tecnología de criptografía impulsará el desarrollo de los robots a través de tres caminos: proporcionando garantías económicas para la seguridad, optimizando la infraestructura de carga y mejorando el rendimiento de latencia y los canales de recopilación de datos.