MaxML CNN é uma solução de computação de alto desempenho desenvolvida pela Maxeler Technologies, projetada para acelerar a inferência de Redes Neurais Convolucionais (CNNs) usando Motores de Fluxo de Dados (DFEs). Esta cadeia de ferramentas visa múltiplos FPGAs em um único dispositivo DFE, facilitando a comunicação eficiente entre FPGAs principalmente via maxring e, em alguns casos, utilizando RAM fora do chip. Ao aproveitar a computação de fluxo de dados, o MaxML CNN oferece um aumento significativo de desempenho em relação aos sistemas tradicionais baseados em CPU, tornando-o ideal para aplicações que exigem inferência rápida e eficiente de CNN.
Características e Funcionalidades Principais:
- Exploração Automática do Espaço de Design (DSE): O MaxML CNN busca automaticamente os parâmetros ótimos de desenrolamento de loops usando um modelo teórico de desempenho, simplificando o processo de design.
- Estimativa de Desempenho: A ferramenta fornece estimativas de throughput de design sem a necessidade de compilação ou simulação completa, permitindo uma avaliação eficiente do desempenho.
- Relaxamento de Compilação: Em casos onde a compilação falha, os usuários podem relaxar a utilização de recursos para facilitar o ajuste do design no FPGA durante a fase MPPR, aumentando a flexibilidade.
- Capacidades de Simulação: O MaxML CNN permite a simulação de conexões maxring sem reconfiguração, simulando-as como conexões PCIe para a CPU, o que é benéfico para a verificação de correção.
- Configurações de Precisão e Frequência Personalizadas: Os usuários podem especificar precisões de ponto fixo personalizadas e frequências de FPGA para cada rede neural, permitindo uma otimização de desempenho sob medida.
Valor Principal e Problema Resolvido:
O MaxML CNN aborda o desafio de acelerar a inferência de CNNs aproveitando o poder dos DFEs, oferecendo uma alternativa de alta taxa de transferência e baixo consumo de energia aos sistemas convencionais baseados em GPU. Esta solução é particularmente vantajosa em cenários onde a velocidade de processamento e a eficiência energética são críticas, como na classificação de imagens em tempo real e outras tarefas computacionalmente intensivas. Ao fornecer uma plataforma personalizável e eficiente para a inferência de CNNs, o MaxML CNN permite que os usuários alcancem resultados mais rápidos com menor consumo de energia, melhorando assim o desempenho geral do sistema e a sustentabilidade.