Tendencias de fusión AI+Web3: La descentralización de los datos de potencia computacional se convierte en el foco.

AI+Web3: Torres y Plazas

TL;DR

  1. Los proyectos de Web3 con concepto de IA se han convertido en objetivos de captación de capital en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se manifiestan en: el uso de incentivos distribuidos para coordinar el suministro potencial en la larga cola, a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para agentes de IA.

  3. El principal campo de aplicación de la IA en la industria Web3 es la financiación en cadena (, pagos criptográficos, transacciones, análisis de datos ) y asistencia en el desarrollo.

  4. La utilidad de AI+Web3 se manifiesta en la complementariedad de ambos: Web3 tiene la esperanza de combatir la centralización de la IA, y la IA tiene la esperanza de ayudar a Web3 a romper sus límites.

AI+Web3: Torres y Plazas

Introducción

En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado un botón de aceleración; este efecto mariposa provocado por Chatgpt no solo ha abierto un nuevo mundo de inteligencia artificial generativa, sino que también ha desatado corrientes en el Web3 en la otra orilla.

Con el respaldo del concepto de IA, la financiación en el mercado de criptomonedas, que se ha desacelerado, ha mostrado un resurgimiento notable. Solo en la primera mitad de 2024, un total de 64 proyectos Web3+IA completaron financiación, y el sistema operativo basado en inteligencia artificial Zyber365 logró un importe máximo de financiación de 100 millones de dólares en la ronda A.

El mercado secundario es más próspero, los datos de los sitios de agregación de criptomonedas muestran que en poco más de un año, el valor total de mercado del sector de la IA ha alcanzado los 48,5 mil millones de dólares, con un volumen de transacciones de casi 8,6 mil millones de dólares en 24 horas; los beneficios derivados de los avances en la tecnología de IA son evidentes, después del lanzamiento del modelo de OpenAI Sora que convierte texto en video, el precio promedio del sector de la IA aumentó un 151%; el efecto de la IA también se ha extendido a uno de los segmentos de atracción de capital en criptomonedas, Meme: el primer concepto de MemeCoin como Agente de IA ------ GOAT se ha vuelto rápidamente popular y ha alcanzado una valoración de 1.4 mil millones de dólares, logrando así un gran auge en los Memes de IA.

La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin, y ahora AI Agent y AI DAO. La emoción de FOMO claramente no puede seguir el ritmo de la rotación de las nuevas narrativas.

AI+Web3, esta combinación de términos llena de dinero caliente, tendencias y fantasías futuras, inevitablemente se ve como un matrimonio arreglado por el capital, parece que es difícil discernir bajo esta lujosa vestimenta, ¿realmente es el campo de los especuladores o es la víspera de una explosión al amanecer?

Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿mejorará con el otro? ¿Se puede beneficiar del modelo del otro? En este artículo, también intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada uno de los eslabones de la pila tecnológica de IA y qué nueva vitalidad puede aportar la IA a Web3?

Parte 1 ¿Qué oportunidades hay para Web3 bajo la pila de IA?

Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:

Expresar todo el proceso en un lenguaje más simple: "El gran modelo" es como el cerebro humano. En las etapas iniciales, este cerebro pertenece a un bebé que acaba de llegar al mundo, y necesita observar e incorporar una gran cantidad de información del entorno para entender este mundo, esa es la fase de "recopilación" de datos. Dado que las computadoras no tienen los sentidos visuales y auditivos de los humanos, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior necesita ser transformada a través de "preprocesamiento" en un formato de información que la computadora pueda entender y utilizar.

Después de que los datos de entrada son procesados, la IA construye un modelo con capacidad de comprensión y predicción a través del "entrenamiento", lo que se puede ver como el proceso en el que un bebé gradualmente comprende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística que el bebé ajusta continuamente durante su proceso de aprendizaje. Cuando el contenido aprendido comienza a especializarse, o se recibe retroalimentación al interactuar con personas y se realizan correcciones, se entra en la fase de "ajuste fino" del gran modelo.

A medida que los niños crecen y aprenden a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar a la "razonamiento" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de sus habilidades lingüísticas, lo cual también es similar a cómo los grandes modelos de IA se aplican en la fase de razonamiento en diversas tareas específicas, como la clasificación de imágenes y el reconocimiento de voz.

El Agente de IA se acerca más a la próxima forma de los grandes modelos: capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo posee la capacidad de pensar, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.

Actualmente, en respuesta a los puntos críticos de la IA en diversas capas, Web3 ha comenzado a formar un ecosistema multicapa e interconectado que abarca todas las etapas del proceso de modelos de IA.

AI+Web3: Torres y Plazas

Uno, Capa Básica: Airbnb de Potencia de Cálculo y Datos

Potencia de cálculo

Actualmente, uno de los costos más altos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y realizar inferencias.

Un ejemplo es que LLAMA3 de Meta necesita 16,000 H100 GPU producidas por NVIDIA(, que es una unidad de procesamiento gráfico de primera diseñada específicamente para cargas de trabajo de inteligencia artificial y computación de alto rendimiento.) Se necesita 30 días para completar el entrenamiento. El precio unitario de la versión de 80 GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de computación de entre 400 y 700 millones de dólares( GPU + chips de red), al mismo tiempo, el entrenamiento mensual consume 1.6 mil millones de kilovatios-hora, con gastos energéticos de casi 20 millones de dólares al mes.

Para la descompresión de la potencia de cálculo de la IA, este es precisamente el área donde Web3 se cruzó por primera vez con la IA------DePin( red de infraestructura física descentralizada) Actualmente, un sitio web de datos ha enumerado más de 1400 proyectos, entre los cuales los proyectos representativos de compartir potencia de cálculo de GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.

Su lógica principal radica en que: la plataforma permite a individuos o entidades con recursos de GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea de compradores y vendedores similar a Uber o Airbnb, aumentando así la tasa de utilización de los recursos de GPU que no están completamente aprovechados, lo que permite a los usuarios finales acceder a recursos de cálculo eficientes a un costo más bajo; al mismo tiempo, el mecanismo de staking también asegura que si ocurre alguna violación del mecanismo de control de calidad o interrupción de la red, los proveedores de recursos enfrentan las sanciones correspondientes.

Su característica es:

  • Reunir recursos de GPU ociosos: los proveedores son principalmente centros de datos independientes y de tamaño mediano de terceros, recursos de capacidad excedente de operadores de minas de criptomonedas, y hardware de minería con mecanismo de consenso PoS, como las máquinas de minería de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar dispositivos con un umbral de entrada más bajo, como exolab que utiliza MacBook, iPhone, iPad y otros dispositivos locales para establecer una red de capacidad de cómputo para la inferencia de modelos grandes.

  • Enfrentando el mercado de cola larga de la potencia de cálculo de IA:

a. "Desde el punto de vista técnico", el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos proporcionada por el GPU de gran escala, mientras que la inferencia requiere un rendimiento de cálculo de GPU relativamente bajo, como Aethir que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.

b. Desde el lado de la demanda, los pequeños y medianos demandantes de poder computacional no entrenarán por sí solos sus propios grandes modelos, sino que simplemente elegirán optimizar y ajustar finamente en torno a unos pocos grandes modelos principales, y estos escenarios son naturalmente adecuados para recursos de poder computacional distribuido e inactivo.

  • Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de los recursos siempre mantienen el control sobre ellos, ajustando de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.

Datos

Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como un lirio flotante, y la relación entre los datos y el modelo es como el viejo dicho "Garbage in, Garbage out"; la cantidad de datos y la calidad de la entrada determinan la calidad de salida del modelo final. En la actualidad, para el entrenamiento de los modelos de IA, los datos determinan la capacidad lingüística, la capacidad de comprensión e incluso las perspectivas de valor y la expresión humanizada del modelo. Actualmente, la dificultad de la demanda de datos de IA se centra principalmente en los siguientes cuatro aspectos:

  • Sed de datos: el entrenamiento de modelos de IA depende de una gran cantidad de datos de entrada. La información pública muestra que el tamaño de los parámetros utilizados por OpenAI para entrenar GPT-4 alcanzó niveles de billones.

  • Calidad de los datos: Con la integración de la IA en diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos en verticales y la incorporación de nuevas fuentes de datos, como la emoción en las redes sociales, han planteado nuevas exigencias a su calidad.

  • Problemas de privacidad y cumplimiento: Actualmente, los países y empresas están prestando cada vez más atención a la importancia de los conjuntos de datos de calidad y están imponiendo restricciones sobre la recopilación de datos.

  • Altos costos de procesamiento de datos: gran cantidad de datos, proceso de manejo complejo. Los datos públicos muestran que más del 30% de los costos de investigación y desarrollo de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.

Actualmente, las soluciones de web3 se reflejan en los siguientes cuatro aspectos:

  1. Recopilación de datos: La disponibilidad de datos del mundo real que se pueden extraer de forma gratuita se está agotando rápidamente, y el gasto de las empresas de IA en datos está aumentando año tras año. Sin embargo, al mismo tiempo, este gasto no se está reinvirtiendo en los verdaderos contribuyentes de datos; las plataformas disfrutan completamente de la creación de valor que aportan los datos, como una plataforma que genera ingresos totales de 203 millones de dólares a través de acuerdos de licencia de datos con empresas de IA.

Permitir que los usuarios que realmente contribuyen también participen en la creación de valor que trae los datos, así como obtener datos más privados y valiosos a bajo costo a través de redes distribuidas y mecanismos de incentivos, es la visión de Web3.

  • Grass es una capa de datos y red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión ejecutando nodos de Grass para capturar datos en tiempo real de toda Internet y obtener recompensas en forma de tokens;

  • Vana introduce un concepto único de un grupo de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados ( como registros de compras, hábitos de navegación, actividades en redes sociales, etc. ) a un DLP específico, y elegir de manera flexible si autorizan o no a terceros específicos a utilizar estos datos;

  • En PublicAI, los usuarios pueden usar #AI或#Web3 como etiqueta de clasificación en X y @PublicAI para realizar la recolección de datos.

  1. Preprocesamiento de datos: En el proceso de manejo de datos de la IA, dado que los datos recopilados suelen ser ruidosos y contener errores, deben ser limpiados y transformados a un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y manejo de valores perdidos. Esta etapa es uno de los pocos eslabones manuales en la industria de la IA, y ha dado lugar a la industria de los etiquetadores de datos. A medida que las demandas de calidad de los datos por parte de los modelos aumentan, también lo hace el umbral para los etiquetadores de datos, y esta tarea se adapta naturalmente al mecanismo de incentivos descentralizados de Web3.
  • Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.

  • Synesis ha propuesto el concepto de «Train2earn», enfatizando la calidad de los datos. Los usuarios pueden obtener recompensas al proporcionar datos etiquetados, comentarios u otras formas de entrada.

  • El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: es necesario aclarar que la privacidad y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al tratamiento de datos sensibles, mientras que la seguridad de los datos protege la información contra el acceso, destrucción y robo no autorizados. Así, las ventajas de la tecnología de privacidad en Web3 y los posibles escenarios de aplicación se reflejan en dos aspectos: (1) entrenamiento de datos sensibles; (2) colaboración de datos: varios propietarios de datos pueden participar conjuntamente en el entrenamiento de IA sin necesidad de compartir sus datos originales.

Las tecnologías de privacidad más comunes en Web3 incluyen:

  • Entorno de ejecución confiable(TEE), como Super Protocol;

  • Cifrado homomórfico completo ( FHE ), por ejemplo BasedAI, Fhenix.io o Inco Network;

  • La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero para el tráfico HTTPS, permitiendo a los usuarios importar de forma segura actividades, reputación y datos de identidad desde sitios web externos, sin exponer información sensible.

Sin embargo, actualmente el campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, uno de los dilemas actuales es que el costo de cálculo es demasiado alto, algunos ejemplos son:

  • El marco zkML EZKL necesita aproximadamente 80 minutos para generar una prueba de un modelo 1M-nanoGPT.

  • Según los datos de Modulus Labs, los costos de zkML son más de 1000 veces más altos que los de la computación pura.

  1. Almacenamiento de datos: Una vez que se tienen los datos, también se necesita un lugar para almacenar los datos en la cadena, así como el LLM generado a partir de esos datos. Con la disponibilidad de datos (DA) como el problema central, antes de la actualización de Danksharding de Ethereum, su capacidad de procesamiento era de 0.08MB. Mientras tanto, el entrenamiento de modelos de IA y la inferencia en tiempo real generalmente requieren un volumen de datos de entre 50 y 100GB por segundo. Esta diferencia de magnitud hace que las soluciones en cadena existentes enfrenten
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 7
  • Compartir
Comentar
0/400
WhaleMistakervip
· Hace30m
¡La Descentralización es la tendencia inevitable! Confío en el futuro de la estrategia.
Ver originalesResponder0
TokenomicsTinfoilHatvip
· hace17h
Se ha enrollado sin límites.
Ver originalesResponder0
DataBartendervip
· hace17h
Otra vez vienen a hablar de BTC.
Ver originalesResponder0
0xSherlockvip
· hace17h
Estoy cansado... todos están especulando con conceptos.
Ver originalesResponder0
PhantomMinervip
· hace17h
¿Otra vez pintando ilusiones? ¿Quién se lo cree?
Ver originalesResponder0
LiquidatedTwicevip
· hace17h
¡Vaya! ¿No es esto simplemente una exageración de plantilla?
Ver originalesResponder0
MetaverseMigrantvip
· hace17h
Otra trampa para conseguir dinero ha llegado.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)