Les données de Jinshi du 26 février, Paradigm Quatre (06682.HK) a lancé aujourd'hui la solution tout-en-un de grande modèle d'inférence SageOneIA, réduisant davantage le coût de l'inférence de grand modèle. Par exemple, la version Full Blood de DeepSeekV3/R1 ne nécessite que deux tout-en-un pour fonctionner. De plus, la solution tout-en-un intègre également la technologie intelligente de pooling de Puissance de calcul, prenant en charge les grands modèles de pointe tels que DeepSeekV3/R1, QWen2.5, LLama3.3, etc. Les entreprises peuvent facilement basculer entre la version Full Blood et plusieurs modèles de distillation, avec une augmentation de plus de 30% de l'utilisation GPU et une amélioration moyenne des performances d'inférence de 5 à 10 fois.
Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
4Paradigm lance SageOne IA, une solution d’appliance d’inférence de grands modèles
Les données de Jinshi du 26 février, Paradigm Quatre (06682.HK) a lancé aujourd'hui la solution tout-en-un de grande modèle d'inférence SageOneIA, réduisant davantage le coût de l'inférence de grand modèle. Par exemple, la version Full Blood de DeepSeekV3/R1 ne nécessite que deux tout-en-un pour fonctionner. De plus, la solution tout-en-un intègre également la technologie intelligente de pooling de Puissance de calcul, prenant en charge les grands modèles de pointe tels que DeepSeekV3/R1, QWen2.5, LLama3.3, etc. Les entreprises peuvent facilement basculer entre la version Full Blood et plusieurs modèles de distillation, avec une augmentation de plus de 30% de l'utilisation GPU et une amélioration moyenne des performances d'inférence de 5 à 10 fois.