Déconstruction du cadre IA : de l'agent intelligent à l'exploration de la Décentralisation
Introduction
Le rythme de développement de la piste des agents IA est incroyable. Depuis l'ouverture de "Terminal de vérité" marquant le début de l'été des agents il y a à peine deux mois, le récit combinant IA et cryptomonnaie a connu presque chaque semaine de nouvelles évolutions. Récemment, l'attention du marché s'est concentrée sur des projets de type "framework" dominés par le récit technologique, et ce segment a déjà généré plusieurs projets avec une capitalisation boursière dépassant les centaines de millions, voire le milliard, au cours des dernières semaines. Ce type de projet a également donné naissance à un nouveau modèle d'émission d'actifs, où les projets émettent des tokens via des dépôts de code Github, et les agents développés sur la base du framework peuvent également émettre des tokens. En se basant sur le framework et en plaçant les agents au-dessus, un modèle semblable à une plateforme d'émission d'actifs émerge, représentant en réalité un modèle d'infrastructure adapté à l'ère de l'IA. Cet article commencera par une introduction au framework et interprétera la signification des frameworks IA dans le domaine de la cryptomonnaie en combinant mes réflexions personnelles.
I. Qu'est-ce qu'un cadre ?
Les cadres d'IA sont des outils ou plateformes de développement sous-jacents qui intègrent des modules, bibliothèques et outils préconstruits, simplifiant ainsi le processus de construction de modèles d'IA complexes. Ces cadres contiennent généralement des fonctionnalités pour traiter des données, entraîner des modèles et faire des prédictions. En termes simples, un cadre peut être considéré comme un système d'exploitation à l'ère de l'IA, similaire aux systèmes d'exploitation de bureau tels que Windows, Linux, ou aux systèmes mobiles comme iOS et Android. Chaque cadre a ses avantages et ses inconvénients, et les développeurs peuvent choisir en fonction de leurs besoins spécifiques.
Bien que le "cadre AI" soit un nouveau concept dans le domaine des cryptomonnaies, le développement des cadres AI a presque 14 ans, depuis la naissance de Theano en 2010. Dans le domaine traditionnel de l'IA, tant dans le milieu académique que dans l'industrie, il existe des cadres matures à choisir, tels que TensorFlow de Google, Pytorch de Meta, PaddlePaddle de Baidu et MagicAnimate de Byte, chacun ayant ses avantages pour différents scénarios.
Actuellement, les projets de cadre émergents dans les cryptomonnaies sont créés en réponse à la demande massive d'agents sous l'impulsion de la tendance AI, puis se sont étendus à d'autres secteurs, formant finalement des cadres AI dans différents domaines de niche. Voici quelques présentations de cadres principaux :
1.1 Eliza
Eliza est un cadre de simulation multi-Agent, spécialement conçu pour créer, déployer et gérer des Agents AI autonomes. Développé en TypeScript, il offre une bonne compatibilité et est facile à intégrer via des API.
Eliza est principalement axée sur les scénarios de médias sociaux, prenant en charge l'intégration multi-plateformes, telles que Discord, X/Twitter, Telegram, etc. En ce qui concerne le traitement du contenu médiatique, elle prend en charge la lecture et l'analyse de documents PDF, l'extraction de résumés de contenu lié, la transcription audio, le traitement du contenu vidéo, l'analyse et la description d'images, ainsi que les résumés de dialogues.
Les cas d'utilisation actuellement pris en charge par Eliza comprennent principalement les applications d'assistant AI, les rôles de médias sociaux, les travailleurs du savoir et les rôles interactifs. Les modèles pris en charge incluent l'inférence locale de modèles open source, l'inférence basée sur le cloud utilisant l'API d'OpenAI, avec une configuration par défaut pour Nous Hermes Llama 3.1B, ainsi que l'intégration avec Claude pour réaliser des requêtes complexes.
1.2 G.A.M.E
G.A.M.E(Cadre d'Entités Multimodales Autonomes Génératives) est un cadre d'IA multimodale généré et géré automatiquement, principalement conçu pour les NPC intelligents dans les jeux. La caractéristique de ce cadre est qu'il peut être utilisé même par des utilisateurs ayant peu ou pas de code, il suffit de modifier les paramètres pour participer à la conception d'Agent.
La conception centrale de G.A.M.E repose sur une conception modulaire où plusieurs sous-systèmes travaillent en synergie, y compris l'interface de suggestion d'Agent, le sous-système de perception, le moteur de planification stratégique, le contexte mondial, le module de traitement des dialogues, l'opérateur de portefeuille on-chain, le module d'apprentissage, la mémoire de travail, le processeur de mémoire à long terme, l'entrepôt d'agents, le planificateur d'actions et l'exécuteur de plans, etc.
Ce cadre se concentre principalement sur la prise de décision, le retour d'information, la perception et la personnalité des agents dans un environnement virtuel, et est adapté aux scénarios de jeux et de métavers.
1.3 Rig
Rig est un outil open source écrit en Rust, conçu pour simplifier le développement d'applications de modèles de langage de grande taille (LLM). Il offre une interface opérationnelle unifiée, permettant aux développeurs d'interagir facilement avec plusieurs fournisseurs de services LLM et bases de données vectorielles.
Les caractéristiques clés de Rig incluent une interface unifiée, une architecture modulaire, la sécurité des types et des performances élevées. Son flux de travail consiste à ce que la demande de l'utilisateur passe par une couche d'abstraction du fournisseur, puis dans la couche centrale, l'agent intelligent appelle divers outils ou interroge le stockage vectoriel pour obtenir des informations, et enfin, génère une réponse via des mécanismes tels que la génération augmentée par récupération.
Rig est adapté pour construire des systèmes de réponse aux questions, des outils de recherche de documents, des chatbots ou assistants virtuels dotés de capacités de perception contextuelle, ainsi que pour soutenir la création de contenu.
1.4 ZerePy
ZerePy est un cadre open source basé sur Python, conçu pour simplifier le processus de déploiement et de gestion des agents IA sur la plateforme X. Il hérite des fonctionnalités clés du projet Zerebro, mais adopte un design plus modulaire et plus extensible.
ZerePy fournit une interface en ligne de commande, prenant en charge les grands modèles de langage d'OpenAI et d'Anthropic, intégrant directement l'API de la plateforme X, avec un système de connexion modulaire, et prévoit d'intégrer un système de mémoire à l'avenir.
Comparé à Eliza, ZerePy se concentre davantage sur la simplification du processus de déploiement d'agents IA sur des plateformes sociales spécifiques, et est plus orienté vers les applications pratiques.
Deuxième, la réplique de l'écosystème BTC
Le parcours de développement des agents IA présente de nombreuses similarités avec l'écosystème BTC récent. Le développement de l'écosystème BTC peut être résumé comme suit : BRC20 - concurrence entre plusieurs protocoles - BTC L2 - BTCFi. Les agents IA se développent plus rapidement sur la base d'une pile technologique IA traditionnelle mature, et leur parcours peut être résumé comme suit : concurrence entre les cadres d'agents de type GOAT/ACT - agents sociaux - agents IA analytiques. À l'avenir, les projets d'infrastructure axés sur la décentralisation des agents et la sécurité pourraient devenir le thème principal de la prochaine étape.
Ce secteur est peu susceptible de devenir homogène ou de connaître une bulle comme l'écosystème BTC. Les projets de framework AI offrent une nouvelle approche pour le développement des infrastructures. Comparé au Memecoin Launchpad et au protocole des inscriptions, le framework AI ressemble davantage à une future blockchain, tandis qu'Agent ressemble à un futur Dapp.
Dans l'avenir de l'ère AI des Crypto, les débats pourraient passer de la discussion sur l'EVM et les chaînes hétérogènes à une lutte de cadres. La question clé actuelle est comment réaliser la Décentralisation ou la chaîne, et quelle est la signification de faire cela sur la blockchain.
Trois, quelle est la signification de la mise en chaîne ?
La blockchain doit faire face à la question de sa signification lorsqu'elle est combinée avec n'importe quel élément. Considérons les facteurs de succès de la DeFi : une plus grande accessibilité, une meilleure efficacité et des coûts plus bas, ainsi qu'une sécurité décentralisée sans besoin de confiance. Sur la base de ces idées, les raisons de soutenir la chaîne Agent pourraient inclure :
Réaliser des coûts d'utilisation plus bas, améliorer l'accessibilité et le choix, afin que les utilisateurs ordinaires puissent également participer au "droit de location" de l'IA ;
Fournir des solutions de sécurité basées sur la blockchain, répondant aux besoins d'interaction entre l'Agent et le monde virtuel ou réel ;
Développer des méthodes financières de blockchain uniques, comme des investissements liés à la puissance de calcul et au marquage de données pour les agents, etc.
Grâce à un raisonnement transparent et traçable, réaliser une interopérabilité plus attrayante que celle fournie par les agents de navigateur des géants traditionnels de l'internet.
Quatre, Économie créative
Les projets de type cadre pourraient offrir à l'avenir des opportunités d'entrepreneuriat similaires à celles du GPT Store. Un cadre simplifiant le processus de construction d'agents et fournissant des combinaisons de fonctionnalités complexes pourrait avoir un avantage à l'avenir, créant une économie créative Web3 plus intéressante que le GPT Store.
Comparé au GPT Store, l'économie créative des agents Web3 pourrait être plus équitable et plus ouverte, permettant aux gens ordinaires de participer. Les mèmes AI du futur pourraient être plus intelligents et plus amusants que les agents actuels, offrant de nouvelles opportunités pour l'économie créative.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
10 J'aime
Récompense
10
4
Partager
Commentaire
0/400
WalletDetective
· Il y a 13m
Ah, ça recommence à faire le buzz autour de l'IA.
Voir l'originalRépondre0
MoonBoi42
· 07-02 07:57
Tout le jour, j'appelle à aller vers la lune, et encore une fois, c'est BTC.
Voir l'originalRépondre0
UnluckyValidator
· 07-02 07:42
Encore une vague de nouveaux pigeons pris pour des idiots
Voir l'originalRépondre0
SatoshiLegend
· 07-02 07:36
En lisant le code source, on peut ressentir une légère impression de tour de Babel... Il faut dire que le capital répète encore le mythe de 2017.
Analyse du secteur des cadres d'IA : des agents intelligents à la nouvelle infrastructure décentralisée
Déconstruction du cadre IA : de l'agent intelligent à l'exploration de la Décentralisation
Introduction
Le rythme de développement de la piste des agents IA est incroyable. Depuis l'ouverture de "Terminal de vérité" marquant le début de l'été des agents il y a à peine deux mois, le récit combinant IA et cryptomonnaie a connu presque chaque semaine de nouvelles évolutions. Récemment, l'attention du marché s'est concentrée sur des projets de type "framework" dominés par le récit technologique, et ce segment a déjà généré plusieurs projets avec une capitalisation boursière dépassant les centaines de millions, voire le milliard, au cours des dernières semaines. Ce type de projet a également donné naissance à un nouveau modèle d'émission d'actifs, où les projets émettent des tokens via des dépôts de code Github, et les agents développés sur la base du framework peuvent également émettre des tokens. En se basant sur le framework et en plaçant les agents au-dessus, un modèle semblable à une plateforme d'émission d'actifs émerge, représentant en réalité un modèle d'infrastructure adapté à l'ère de l'IA. Cet article commencera par une introduction au framework et interprétera la signification des frameworks IA dans le domaine de la cryptomonnaie en combinant mes réflexions personnelles.
I. Qu'est-ce qu'un cadre ?
Les cadres d'IA sont des outils ou plateformes de développement sous-jacents qui intègrent des modules, bibliothèques et outils préconstruits, simplifiant ainsi le processus de construction de modèles d'IA complexes. Ces cadres contiennent généralement des fonctionnalités pour traiter des données, entraîner des modèles et faire des prédictions. En termes simples, un cadre peut être considéré comme un système d'exploitation à l'ère de l'IA, similaire aux systèmes d'exploitation de bureau tels que Windows, Linux, ou aux systèmes mobiles comme iOS et Android. Chaque cadre a ses avantages et ses inconvénients, et les développeurs peuvent choisir en fonction de leurs besoins spécifiques.
Bien que le "cadre AI" soit un nouveau concept dans le domaine des cryptomonnaies, le développement des cadres AI a presque 14 ans, depuis la naissance de Theano en 2010. Dans le domaine traditionnel de l'IA, tant dans le milieu académique que dans l'industrie, il existe des cadres matures à choisir, tels que TensorFlow de Google, Pytorch de Meta, PaddlePaddle de Baidu et MagicAnimate de Byte, chacun ayant ses avantages pour différents scénarios.
Actuellement, les projets de cadre émergents dans les cryptomonnaies sont créés en réponse à la demande massive d'agents sous l'impulsion de la tendance AI, puis se sont étendus à d'autres secteurs, formant finalement des cadres AI dans différents domaines de niche. Voici quelques présentations de cadres principaux :
1.1 Eliza
Eliza est un cadre de simulation multi-Agent, spécialement conçu pour créer, déployer et gérer des Agents AI autonomes. Développé en TypeScript, il offre une bonne compatibilité et est facile à intégrer via des API.
Eliza est principalement axée sur les scénarios de médias sociaux, prenant en charge l'intégration multi-plateformes, telles que Discord, X/Twitter, Telegram, etc. En ce qui concerne le traitement du contenu médiatique, elle prend en charge la lecture et l'analyse de documents PDF, l'extraction de résumés de contenu lié, la transcription audio, le traitement du contenu vidéo, l'analyse et la description d'images, ainsi que les résumés de dialogues.
Les cas d'utilisation actuellement pris en charge par Eliza comprennent principalement les applications d'assistant AI, les rôles de médias sociaux, les travailleurs du savoir et les rôles interactifs. Les modèles pris en charge incluent l'inférence locale de modèles open source, l'inférence basée sur le cloud utilisant l'API d'OpenAI, avec une configuration par défaut pour Nous Hermes Llama 3.1B, ainsi que l'intégration avec Claude pour réaliser des requêtes complexes.
1.2 G.A.M.E
G.A.M.E(Cadre d'Entités Multimodales Autonomes Génératives) est un cadre d'IA multimodale généré et géré automatiquement, principalement conçu pour les NPC intelligents dans les jeux. La caractéristique de ce cadre est qu'il peut être utilisé même par des utilisateurs ayant peu ou pas de code, il suffit de modifier les paramètres pour participer à la conception d'Agent.
La conception centrale de G.A.M.E repose sur une conception modulaire où plusieurs sous-systèmes travaillent en synergie, y compris l'interface de suggestion d'Agent, le sous-système de perception, le moteur de planification stratégique, le contexte mondial, le module de traitement des dialogues, l'opérateur de portefeuille on-chain, le module d'apprentissage, la mémoire de travail, le processeur de mémoire à long terme, l'entrepôt d'agents, le planificateur d'actions et l'exécuteur de plans, etc.
Ce cadre se concentre principalement sur la prise de décision, le retour d'information, la perception et la personnalité des agents dans un environnement virtuel, et est adapté aux scénarios de jeux et de métavers.
1.3 Rig
Rig est un outil open source écrit en Rust, conçu pour simplifier le développement d'applications de modèles de langage de grande taille (LLM). Il offre une interface opérationnelle unifiée, permettant aux développeurs d'interagir facilement avec plusieurs fournisseurs de services LLM et bases de données vectorielles.
Les caractéristiques clés de Rig incluent une interface unifiée, une architecture modulaire, la sécurité des types et des performances élevées. Son flux de travail consiste à ce que la demande de l'utilisateur passe par une couche d'abstraction du fournisseur, puis dans la couche centrale, l'agent intelligent appelle divers outils ou interroge le stockage vectoriel pour obtenir des informations, et enfin, génère une réponse via des mécanismes tels que la génération augmentée par récupération.
Rig est adapté pour construire des systèmes de réponse aux questions, des outils de recherche de documents, des chatbots ou assistants virtuels dotés de capacités de perception contextuelle, ainsi que pour soutenir la création de contenu.
1.4 ZerePy
ZerePy est un cadre open source basé sur Python, conçu pour simplifier le processus de déploiement et de gestion des agents IA sur la plateforme X. Il hérite des fonctionnalités clés du projet Zerebro, mais adopte un design plus modulaire et plus extensible.
ZerePy fournit une interface en ligne de commande, prenant en charge les grands modèles de langage d'OpenAI et d'Anthropic, intégrant directement l'API de la plateforme X, avec un système de connexion modulaire, et prévoit d'intégrer un système de mémoire à l'avenir.
Comparé à Eliza, ZerePy se concentre davantage sur la simplification du processus de déploiement d'agents IA sur des plateformes sociales spécifiques, et est plus orienté vers les applications pratiques.
Deuxième, la réplique de l'écosystème BTC
Le parcours de développement des agents IA présente de nombreuses similarités avec l'écosystème BTC récent. Le développement de l'écosystème BTC peut être résumé comme suit : BRC20 - concurrence entre plusieurs protocoles - BTC L2 - BTCFi. Les agents IA se développent plus rapidement sur la base d'une pile technologique IA traditionnelle mature, et leur parcours peut être résumé comme suit : concurrence entre les cadres d'agents de type GOAT/ACT - agents sociaux - agents IA analytiques. À l'avenir, les projets d'infrastructure axés sur la décentralisation des agents et la sécurité pourraient devenir le thème principal de la prochaine étape.
Ce secteur est peu susceptible de devenir homogène ou de connaître une bulle comme l'écosystème BTC. Les projets de framework AI offrent une nouvelle approche pour le développement des infrastructures. Comparé au Memecoin Launchpad et au protocole des inscriptions, le framework AI ressemble davantage à une future blockchain, tandis qu'Agent ressemble à un futur Dapp.
Dans l'avenir de l'ère AI des Crypto, les débats pourraient passer de la discussion sur l'EVM et les chaînes hétérogènes à une lutte de cadres. La question clé actuelle est comment réaliser la Décentralisation ou la chaîne, et quelle est la signification de faire cela sur la blockchain.
Trois, quelle est la signification de la mise en chaîne ?
La blockchain doit faire face à la question de sa signification lorsqu'elle est combinée avec n'importe quel élément. Considérons les facteurs de succès de la DeFi : une plus grande accessibilité, une meilleure efficacité et des coûts plus bas, ainsi qu'une sécurité décentralisée sans besoin de confiance. Sur la base de ces idées, les raisons de soutenir la chaîne Agent pourraient inclure :
Réaliser des coûts d'utilisation plus bas, améliorer l'accessibilité et le choix, afin que les utilisateurs ordinaires puissent également participer au "droit de location" de l'IA ;
Fournir des solutions de sécurité basées sur la blockchain, répondant aux besoins d'interaction entre l'Agent et le monde virtuel ou réel ;
Développer des méthodes financières de blockchain uniques, comme des investissements liés à la puissance de calcul et au marquage de données pour les agents, etc.
Grâce à un raisonnement transparent et traçable, réaliser une interopérabilité plus attrayante que celle fournie par les agents de navigateur des géants traditionnels de l'internet.
Quatre, Économie créative
Les projets de type cadre pourraient offrir à l'avenir des opportunités d'entrepreneuriat similaires à celles du GPT Store. Un cadre simplifiant le processus de construction d'agents et fournissant des combinaisons de fonctionnalités complexes pourrait avoir un avantage à l'avenir, créant une économie créative Web3 plus intéressante que le GPT Store.
Comparé au GPT Store, l'économie créative des agents Web3 pourrait être plus équitable et plus ouverte, permettant aux gens ordinaires de participer. Les mèmes AI du futur pourraient être plus intelligents et plus amusants que les agents actuels, offrant de nouvelles opportunités pour l'économie créative.