MaxML CNN est une solution de calcul haute performance développée par Maxeler Technologies, conçue pour accélérer l'inférence des réseaux de neurones convolutifs (CNN) en utilisant des moteurs de flux de données (DFE). Cette chaîne d'outils cible plusieurs FPGA sur un seul appareil DFE, facilitant la communication efficace entre les FPGA principalement via maxring et, dans certains cas, en utilisant la RAM hors puce. En exploitant le calcul de flux de données, MaxML CNN offre un gain de performance significatif par rapport aux systèmes traditionnels basés sur CPU, ce qui le rend idéal pour les applications nécessitant une inférence CNN rapide et efficace.
Caractéristiques clés et fonctionnalités :
- Exploration automatique de l'espace de conception (DSE) : MaxML CNN recherche automatiquement les paramètres de déroulement de boucle optimaux en utilisant un modèle de performance théorique, simplifiant le processus de conception.
- Estimation de la performance : L'outil fournit des estimations du débit de conception sans nécessiter de compilation ou de simulation complète, permettant une évaluation efficace de la performance.
- Relaxation de compilation : Dans les cas où la compilation échoue, les utilisateurs peuvent relâcher l'utilisation des ressources pour faciliter l'ajustement de la conception sur le FPGA pendant l'étape MPPR, améliorant ainsi la flexibilité.
- Capacités de simulation : MaxML CNN permet la simulation des connexions maxring sans reconfiguration en les simulant comme des connexions PCIe vers le CPU, ce qui est bénéfique pour la vérification de la correction.
- Paramètres de précision et de fréquence personnalisés : Les utilisateurs peuvent spécifier des précisions en point fixe personnalisées et des fréquences FPGA pour chaque réseau de neurones, permettant une optimisation des performances sur mesure.
Valeur principale et problème résolu :
MaxML CNN répond au défi d'accélérer l'inférence CNN en exploitant la puissance des DFE, offrant une alternative à haut débit et faible consommation d'énergie aux systèmes conventionnels basés sur GPU. Cette solution est particulièrement avantageuse dans les scénarios où la vitesse de traitement et l'efficacité énergétique sont critiques, tels que la classification d'images en temps réel et d'autres tâches intensives en calcul. En fournissant une plateforme personnalisable et efficace pour l'inférence CNN, MaxML CNN permet aux utilisateurs d'obtenir des résultats plus rapides avec une consommation d'énergie réduite, améliorant ainsi la performance globale du système et sa durabilité.