Amazon Inferentia est une puce d'inférence d'apprentissage automatique conçue pour offrir des performances élevées à faible coût. AWS Inferentia prendra en charge les frameworks d'apprentissage profond TensorFlow, Apache MXNet et PyTorch, ainsi que les modèles utilisant le format ONNX.