شريك بانtera: عصر بوتات الذكاء الاصطناعي المدفوعة بالتشفير

المؤلف: بول فيراديتاكي، شريك في بانtera كابيتال؛ الترجمة: 金色财经xiaozou

ملخص:

VLA**الابتكار وتأثير الحجم يدفعان نحو ولادة الروبوتات البشرية الاقتصادية والفعالة والعامة.

مع توسع الروبوتات التخزينية إلى سوق الروبوتات الاستهلاكية، فإن أمان الروبوتات وآليات التمويل والتقييم تستحق استكشافًا متعمقًا.

ستعمل تقنية التشفير على دفع تطوير صناعة الروبوتات من خلال توفير ضمانات اقتصادية للأمان للروبوتات، وتحسين بنيتها التحتية للتكامل، والتأخير، وعمليات جمع البيانات.

لقد أعادت ChatGPT صياغة توقعات البشر حول الذكاء الاصطناعي بشكل جذري. عندما بدأت نماذج اللغة الكبيرة في التفاعل مع عالم البرمجيات الخارجي، اعتقد كثيرون أن وكلاء الذكاء الاصطناعي هم الشكل النهائي. ولكن عند استرجاع أفلام الخيال العلمي الكلاسيكية مثل "حرب النجوم" و"بليد رانر" و"الشرطي الآلي"، نجد أن الحلم الحقيقي للبشر هو أن يتمكن الذكاء الاصطناعي من تحقيق التفاعل مع العالم المادي في شكل روبوت.

ترى بانtera كابيتال أن "لحظة ChatGPT" في مجال الروبوتات قادمة قريباً. سنبدأ بتحليل كيف غيرت الاختراقات في الذكاء الاصطناعي على مدار السنوات القليلة الماضية مشهد الصناعة، ثم نستكشف كيف ستشكل تقنيات البطاريات، وتحسينات التأخير، وتحسين جمع البيانات المشهد المستقبلي، والدور الذي تلعبه تقنية التشفير في ذلك. أخيرًا، سنوضح لماذا نعتقد أن أمان الروبوتات، والتمويل، والتقييم، والتعليم هي مجالات رأسية تحتاج إلى التركيز عليها.

1**، عناصر التغيير**

1)اختراق الذكاء الاصطناعي

تقدم مجال نماذج اللغة الكبيرة متعددة الوسائط زود الروبوتات بـ "الدماغ" اللازم لأداء المهام المعقدة. تدرك الروبوتات البيئة بشكل أساسي من خلال حاستي البصر والسمع.

تتميز النماذج التقليدية للرؤية الحاسوبية (مثل الشبكات العصبية التلافيفية) بمهاراتها في مهام كشف أو تصنيف الكائنات، لكنها تواجه صعوبة في تحويل المعلومات البصرية إلى تعليمات فعلية ذات هدف. وعلى الرغم من أن نماذج اللغة الكبيرة تبرز في فهم النصوص وتوليدها، إلا أنها مقيدة بقدرتها على إدراك العالم الفيزيائي.hYuXnSz1oEEqlhs536Ftw1tGJg7N74gPPK7GYn96.png

من خلال نموذج الرؤية-اللغة-الإجراء (VLA)، تتمكن الروبوتات من دمج الإدراك البصري وفهم اللغة والعمل المادي ضمن إطار حسابي موحد. في فبراير 2025، أصدرت شركة Figure AI نموذج التحكم في الروبوتات البشرية العامة Helix، الذي يضع معيارًا جديدًا في الصناعة بفضل قدرته على التعميم بدون أمثلة وهندسته المعمارية المزدوجة للنظام 1/النظام 2. تتيح خاصية التعميم بدون أمثلة للروبوتات التكيف الفوري مع مشاهد جديدة وأشياء جديدة وتعليمات جديدة دون الحاجة إلى التدريب المتكرر لكل مهمة. تفصل هندسة النظام 1/النظام 2 الاستدلال العالي المستوى عن الاستدلال الخفيف، مما يحقق روبوتات بشرية تجارية تتمتع بتفكير شبيه بالإنسان ودقة في الوقت الحقيقي.

2)أصبحت الروبوتات الاقتصادية واقعًا

التقنيات التي تغير العالم تشترك في سمة واحدة مشتركة - قابلية الانتشار. تم تحقيق انتشار الهواتف الذكية وأجهزة الكمبيوتر الشخصية وتقنية الطباعة ثلاثية الأبعاد من خلال الأسعار التي يمكن للطبقة الوسطى تحملها. عندما ينخفض سعر الروبوتات مثل Unitree G1 إلى ما دون سعر سيارة هوندا أكورد أو الحد الأدنى للدخل السنوي في الولايات المتحدة البالغ 34,000 دولار، فلا عجب أن نتخيل عالمًا يتم فيه تنفيذ العمل البدني والمهام اليومية بشكل رئيسي بواسطة الروبوتات.

! Tn1tv6S36bdGnnOOpqRRqjdc8pnTqJ1EKRERmKtZ.png

3)من التخزين إلى سوق المستهلكين

تتوسع تكنولوجيا الروبوتات من حلول التخزين إلى مجالات الاستهلاك. هذا العالم مصمم للبشر - يمكن للبشر القيام بكل الأعمال التي تقوم بها الروبوتات المتخصصة، بينما لا تستطيع الروبوتات المتخصصة القيام بجميع أعمال البشر. لم تعد شركات الروبوتات مقتصرة على تصنيع الروبوتات المخصصة للمصانع، بل بدأت في تطوير روبوتات بشرية أكثر تنوعًا. لذلك، فإن جبهة تكنولوجيا الروبوتات لا توجد فقط في المخازن، بل ستتخلل الحياة اليومية.

تكلفة هي واحدة من العقبات الرئيسية القابلة للتوسع. المؤشر الذي نهتم به أكثر هو التكلفة الشاملة لكل ساعة، والتي يتم حسابها على أنها: تكلفة الفرصة البديلة لوقت التدريب والشحن، تكلفة تنفيذ المهام وتكلفة شراء الروبوت، مقسومة على إجمالي وقت تشغيل الروبوت. يجب أن تكون هذه التكلفة أقل من متوسط مستوى الأجور في الصناعة ذات الصلة لتكون تنافسية.

! rQCyavIaHdxhfr10i808m9Rj3UhR0JpqVvv1s4kq.png

لتحقيق اختراق شامل في مجال التخزين، يجب أن تكون التكلفة الشاملة للروبوتات أقل من 31.39 دولار في الساعة. وفي أكبر سوق استهلاكي - مجال التعليم الخاص وخدمات الصحة، يجب أن يتم التحكم في هذه التكلفة لتكون أقل من 35.18 دولار. الروبوتات تتطور حالياً نحو أرخص، وأكثر كفاءة، وأكثر عمومية.

2**، الخطوة التالية في تقدم تكنولوجيا الروبوتات**

1)تحسين البطارية

تظل تقنية البطارية عائقًا أمام الروبوتات الصديقة للمستخدمين. في البداية، كانت السيارات الكهربائية مثل بي إم دبليو i3 تعاني من قيود تقنية البطارية، مما أدى إلى قصر مدى القيادة وارتفاع التكاليف وانخفاض الجدوى، مما جعل من الصعب انتشارها، ويواجه الروبوت نفس المصاعب. روبوت سبوت من بوسطن ديناميكس لديه مدى تشغيل يصل إلى 90 دقيقة فقط، بينما مدى تشغيل بطارية Unitree G1 حوالي ساعتين**. من الواضح أن المستخدمين لا يرغبون في شحن البطارية يدويًا كل ساعتين**، لذا أصبح الشحن الذاتي والبنية التحتية للتوصيل محور التطوير الرئيسي. حاليًا، هناك نوعان رئيسيان من أنماط شحن الروبوتات: استبدال البطارية أو الشحن المباشر.

تعمل وضعية استبدال البطارية على تحقيق التشغيل المستمر من خلال استبدال سريع لمجموعة البطاريات المستنفدة، مما يقلل من وقت التوقف إلى الحد الأدنى، وهي مناسبة للبيئات الخارجية أو الصناعية. يمكن تنفيذ هذه العملية يدويًا أو تلقائيًا.

تستخدم الشحن الاستقرائي طريقة الطاقة اللاسلكية، على الرغم من أن وقت الشحن الكامل يستغرق وقتًا طويلاً، إلا أنه يمكن تحقيق عملية تلقائية بالكامل بسهولة.

2)تحسين التأخير

يمكن تقسيم العمليات منخفضة التأخير إلى فئتين: الإدراك البيئي والتحكم عن بُعد. يشير الإدراك إلى قدرة الروبوت على فهم الفضاء المحيط به، بينما يشير التحكم عن بُعد تحديدًا إلى السيطرة في الوقت الفعلي من قبل المشغل البشري.

وفقًا لدراسة Cintrini، يبدأ نظام إدراك الروبوتات بمستشعرات رخيصة، لكن الحاجز التكنولوجي يكمن في دمج البرمجيات، الحوسبة منخفضة الطاقة، والدورات الدقيقة في المللي ثانية. عند إكمال الروبوت لتحديد الموقع، ستقوم شبكة عصبية خفيفة بتمييز عناصر مثل العوائق، والأرفف، أو البشر. بعد إدخال علامات المشهد إلى نظام التخطيط، يتم على الفور توليد تعليمات المحرك المرسلة إلى القدم، أو مجموعة العجلات، أو الذراع الميكانيكية. تأخير الإدراك أقل من 50 مللي ثانية يعادل سرعة رد الفعل البشرية**——**** أي تأخير يتجاوز هذا العتبة سيؤدي إلى حركات الروبوت بشكل غير رشيق.** لذلك، يجب أن يتم 90% من القرارات من خلال شبكة بصرية-لغوية-حركية واحدة محليًا.

يجب على الروبوتات المستقلة بالكامل ضمان أن يكون تأخير نموذج VLA عالي الأداء أقل من 50 مللي ثانية؛ بينما تتطلب الروبوتات التي يتم التحكم فيها عن بعد ألا يتجاوز تأخير الإشارة بين طرف التحكم والروبوت 50 مللي ثانية. هنا تبرز أهمية نموذج VLA بشكل خاص - إذا تمت معالجة الإدخال البصري والنصي بواسطة نماذج مختلفة ثم تم إدخالها في نموذج لغة كبير، فإن التأخير الكلي سيتجاوز بشكل كبير عتبة 50 مللي ثانية.

3)تحسين جمع البيانات

توجد ثلاثة طرق رئيسية لجمع البيانات: **بيانات الفيديو من العالم الحقيقي، البيانات الاصطناعية، وبيانات التحكم عن بُعد. تكمن العقبة الرئيسية بين البيانات الواقعية والبيانات الاصطناعية في سد الفجوة بين السلوك الفيزيائي للروبوت ونموذج المحاكاة / للفيديو. ** تفتقر بيانات الفيديو الواقعية إلى تفاصيل فيزيائية مثل ردود الفعل اللمسية، أخطاء حركة المفاصل، وتشوه المواد؛ بينما تفتقر البيانات المحاكاة إلى متغيرات غير قابلة للتوقع مثل أعطال المستشعر، ومعامل الاحتكاك.

أكثر طرق جمع البيانات الواعدة هي التحكم عن بُعد - حيث يقوم مشغل بشري بالتحكم عن بُعد في الروبوت لأداء المهام. ولكن تكلفة العمالة هي العامل الرئيسي المحدد لجمع البيانات عن بُعد.

تقدم تطوير الأجهزة المخصصة أيضًا حلولًا جديدة لجمع البيانات عالية الجودة. تجمع شركة Mecka بين الأساليب السائدة والأجهزة المخصصة لجمع بيانات الحركة البشرية متعددة الأبعاد، والتي يتم تحويلها بعد المعالجة إلى مجموعة بيانات مناسبة لتدريب الشبكات العصبية للروبوتات، مما يوفر بيانات عالية الجودة بكميات هائلة لتدريب الروبوتات الذكية بالتعاون مع دورات تكرارية سريعة. تعمل هذه القنوات التكنولوجية معًا على تقصير المسار من البيانات الأولية إلى الروبوتات القابلة للتنفيذ.

3**، المجالات الرئيسية للاستكشاف**

(1) دمج تقنية التشفير مع الروبوتات

يمكن أن تشجع تقنية التشفير الأطراف غير الموثوقة على تعزيز كفاءة شبكة الروبوتات. بناءً على المجالات الرئيسية المذكورة أعلاه، نعتقد أن تقنية التشفير يمكن أن تعزز الكفاءة في ثلاثة مجالات: ربط البنية التحتية، تحسين التأخير، وجمع البيانات.

من المتوقع أن يحدث الشبكة اللامركزية للبنية التحتية الفيزيائية (DePIN) ثورة في بنية الشحن التحتية. عندما تعمل الروبوتات البشرية على مستوى عالمي مثل السيارات، يجب أن تكون محطات الشحن في متناول اليد مثل محطات الوقود. تتطلب الشبكة المركزية استثمارات ضخمة في البداية، بينما ستقوم DePIN بتوزيع التكلفة على مشغلي العقد، مما يسمح بتوسع سريع لمرافق الشحن إلى مناطق أكثر.

يمكن لـ DePIN أيضًا استخدام البنية التحتية الموزعة لتحسين تأخير التحكم عن بعد. من خلال تجميع موارد الحوسبة من العقد الطرفية الموزعة جغرافياً، يمكن معالجة أوامر التحكم عن بعد بواسطة العقدة المحلية أو الأقرب المتاحة، مما يقلل من مسافة نقل البيانات إلى الحد الأدنى ويقلل بشكل ملحوظ من تأخير الاتصالات. لكن المشاريع الحالية لـ DePIN تركز بشكل أساسي على التخزين اللامركزي وتوزيع المحتوى ومشاركة النطاق الترددي، على الرغم من وجود مشاريع تظهر مزايا الحوسبة الطرفية في تدفقات الوسائط أو إنترنت الأشياء، إلا أنها لم تمتد بعد إلى مجال الروبوتات أو التحكم عن بعد.

التحكم عن بُعد هو أكثر طرق جمع البيانات الواعدة، لكن تكلفة توظيف الكيانات المركزية للمهنيين لجمع البيانات مرتفعة للغاية. يقوم DePIN بتحفيز الأطراف الثالثة من خلال رموز التشفير لتوفير بيانات التحكم عن بُعد لحل هذه المشكلة. يقوم مشروع Reborn ببناء شبكة مشغلين عن بُعد عالمية، ويحول مساهماتهم إلى أصول رقمية موثقة، مما يشكل نظامًا لامركزيًا لا يتطلب إذنًا - حيث يمكن للمشاركين تحقيق الأرباح والمشاركة في الحوكمة والمساعدة في تدريب روبوتات AGI.

(2) الأمان دائمًا هو الشاغل الرئيسي

الهدف النهائي لتكنولوجيا الروبوتات هو تحقيق الاستقلالية التامة، ولكن كما حذرت سلسلة أفلام "المُنهِي"، فإن أكثر ما لا يرغب فيه البشر هو أن تؤدي الاستقلالية إلى تحويل الروبوتات إلى أسلحة عدوانية. لقد أثار موضوع سلامة نماذج اللغة الكبيرة القلق، وعندما تمتلك هذه النماذج القدرة على التحرك فعليًا، تصبح سلامة الروبوتات شرطًا أساسيًا لقبول المجتمع.

الأمن الاقتصادي هو أحد أعمدة ازدهار بيئة الروبوتات. تعمل شركة OpenMind في هذا المجال على بناء FABRIC - طبقة تنسيق روبوتية لامركزية، تحقق من خلال التشفير هوية الأجهزة، والتحقق من الوجود الفيزيائي، والحصول على الموارد. على عكس إدارة أسواق المهام البسيطة، يمكّن FABRIC الروبوتات من إثبات معلومات الهوية، والموقع الجغرافي، وسجلات السلوك بشكل مستقل دون الاعتماد على وسطاء مركزيين.

يتم تنفيذ قيود السلوك والمصادقة على الهوية من خلال آليات على السلسلة، مما يضمن إمكانية تدقيق الامتثال من قبل أي شخص. ستحصل الروبوتات التي تتوافق مع معايير الأمان ومتطلبات الجودة والمعايير الإقليمية على مكافآت، بينما سيواجه المخالفون عقوبات أو إلغاء التأهيل، مما يؤدي إلى إقامة آلية للمساءلة والثقة في شبكة الروبوتات المستقلة.

يمكن لشبكات إعادة الرهن من الطرف الثالث (مثل Symbiotic) أيضًا تقديم ضمانات أمان متساوية. على الرغم من أن نظام معلمات العقوبات لا يزال بحاجة إلى تحسين، إلا أن التكنولوجيا ذات الصلة دخلت المرحلة العملية. نتوقع أن يتم تشكيل معايير أمان الصناعة قريبًا، وعندها سيتم نمذجة معلمات العقوبات بناءً على هذه المعايير.

مثال على خطة التنفيذ:

شركة الروبوتات تنضم إلى Symbiotic الشبكة.

*تحديد معايير مصادرة قابلة للتحقق (مثل **"*تطبيق قوة تلامس بشرية تتجاوز 2500 نيوتن ");

يقدم المراهنون ضمانات لضمان التزام الروبوت بالمعايير؛

إذا حدثت انتهاكات، ستُستخدم الوديعة كتعويض للضحايا.

تُحفز هذه النموذج الشركات على وضع الأمان في المقام الأول، كما تعزز من قبول المستهلكين من خلال آلية التأمين لصندوق الرهن.

وجهة نظر فريق Symbiotic في مجال الروبوتات هي:

Symbiotic**إطار الإيداع العام يهدف إلى توسيع مفهوم الإيداع ليشمل جميع المجالات التي تحتاج إلى ضمان اقتصادي، سواء من خلال نمط المشاركة أو النمط المستقل. تتراوح سيناريوهات تطبيقه من التأمين إلى تقنيات الروبوتات ويجب تصميمها وفقًا لحالات معينة. على سبيل المثال، يمكن بناء شبكة الروبوتات بالكامل على أساس إطار Symbiotic، مما يمكّن أصحاب المصلحة من تقديم ضمان اقتصادي لسلامة الشبكة.

4**، سد الفجوات في تقنية الروبوتات**

فتحت OpenAI الطريق لانتشار الذكاء الاصطناعي، لكن حجر الأساس لـ ChatGPT قد تم وضعه بالفعل. لقد كسرت خدمات السحابة الاعتماد على القوة الحاسوبية المحلية، وحققت Huggingface نموذج المصدر المفتوح، ووفرت Kaggle منصة تجريبية لمهندسي الذكاء الاصطناعي. هذه الانجازات التدريجية ساهمت مجتمعة في تعميم الذكاء الاصطناعي.

على عكسAI، فإن دخول مجال الروبوتات يكون صعباً عندما تكون الأموال محدودة. لتحقيق انتشار الروبوتات، يجب أن تنخفض عقبة التطوير إلى مستوى سهولة تطوير تطبيقاتAI. نحن نعتقد أن هناك مجالاً للتحسين في ثلاثة مجالات: آلية التمويل، ونظام التقييم، والنظام التعليمي.

التمويل هو نقطة الألم في مجال الروبوتات. يتطلب تطوير البرامج الحاسوبية جهاز كمبيوتر واحد فقط وموارد الحوسبة السحابية، بينما يتطلب بناء روبوت كامل الوظائف شراء المحركات وأجهزة الاستشعار والبطاريات وغيرها من الأجهزة، مما يجعل التكلفة تتجاوز بسهولة 100,000 دولار. هذه الخصائص المادية تجعل تطوير الروبوتات مقارنة بالذكاء الاصطناعي يفتقر إلى المرونة ويكون مكلفًا للغاية.

تحتل بنية تقييم الروبوتات في السيناريوهات الواقعية مرحلة مبكرة من التطور. وقد تم إنشاء نظام واضح من دوال الخسارة في مجال الذكاء الاصطناعي، حيث يمكن أن يتم اختبارها بشكل كامل في بيئة افتراضية. لكن لا يمكن تحويل الاستراتيجيات الافتراضية الممتازة مباشرة إلى حلول فعالة في العالم الحقيقي. يحتاج الروبوت إلى مرافق لتقييم استراتيجياته الذاتية في بيئات واقعية متنوعة، حتى يتمكن من تحقيق تحسينات متكررة.

عندما تنضج هذه البنية التحتية، سيتدفق عدد كبير من المواهب، وستعيد الروبوتات البشرية إنتاج منحنى انفجار الويب 2.0. شركة الروبوتات المشفرة OpenMind تتجه نحو هذا الاتجاه - مشروعها مفتوح المصدر OM1 ("نظام أندرويد للروبوتات") يحول الأجهزة الأصلية إلى وكالات ذكية قابلة للتطوير ذات وعي اقتصادي. يمكن أن تعمل وحدات الرؤية واللغة وتخطيط الحركة مثل التطبيقات على الهواتف المحمولة، حيث يتم تقديم جميع خطوات الاستدلال باللغة الإنجليزية الواضحة، مما يسمح للمشغلين بتدقيق أو تعديل السلوك دون الحاجة إلى التعامل مع البرامج الثابتة. هذه القدرة على الاستدلال بلغة طبيعية تتيح للجيل الجديد من المواهب الدخول بسلاسة إلى مجال الروبوتات، مما يمثل خطوة أساسية نحو منصة مفتوحة لثورة الروبوتات، تمامًا كما كان لحركة المصادر المفتوحة تأثير تسريع على الذكاء الاصطناعي.

! 9w4FeDFrQpSzIOVnqjQL1iz3LrIaGlrRUCz29CRB.png

كثافة المواهب تحدد مسار الصناعة. يعد وجود نظام تعليمي شامل ومنظم أمرًا حيويًا لتزويد مجال الروبوتات بالمواهب. إن إدراج OpenMind في بورصة ناسداك يمثل بداية عصر جديد حيث تشارك الآلات الذكية في الابتكار المالي والتعليم الفعلي. أعلنت OpenMind** وRobostore بشكل مشترك عن إطلاق أول منهج تعليمي عام قائم على الروبوت البشري Unitree G1 في المدارس العامة الأمريكية K-12. **تم تصميم هذا المنهج ليكون غير مرتبط بمنصة معينة، مما يتيح التكيف مع أشكال الروبوت المختلفة، ويقدم للطلاب فرصًا للتطبيق العملي. تعزز هذه الإشارة الإيجابية حكمنا بأن **موارد التعليم الروبوتية في السنوات القادمة ستكون غنية مثل تلك الموجودة في مجال AI.

5**، آفاق المستقبل**

ابتكارات نموذج الرؤية-اللغة-الإجراء (VLA) وتأثيرات وفورات الحجم قد أدت إلى ظهور روبوتات بشرية اقتصادية وفعالة وعامة. مع توسع روبوتات التخزين إلى السوق الاستهلاكية، أصبحت الأمان، ونماذج التمويل، ونظم التقييم الاتجاهات الرئيسية للاستكشاف. نحن نؤمن بأن تقنية التشفير ستدفع تطوير الروبوتات من خلال ثلاث مسارات: تقديم ضمانات اقتصادية للأمان، تحسين البنية التحتية لشحن البطاريات، وتعزيز أداء التأخير وقنوات جمع البيانات.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت