Il software di auto scaling alloca o dealloca dinamicamente le risorse informatiche in base alle esigenze di un'applicazione. Questo tipo di software può automaticamente aumentare le risorse durante il traffico elevato e ridurle quando c'è meno traffico. Gli amministratori IT utilizzano il software di auto scaling per garantire la disponibilità dei sistemi cloud aggiungendo più risorse informatiche quando necessario e ottimizzando i costi decommissionando automaticamente le istanze quando la richiesta di capacità diminuisce.
L'auto scaling ha alcune caratteristiche del software di monitoraggio dell'infrastruttura cloud poiché monitora continuamente i sistemi per controllare l'uso delle risorse. Tuttavia, il software di auto scaling, oltre a monitorare, può anche aumentare o diminuire l'allocazione della capacità. Ha anche caratteristiche che si sovrappongono con il software di bilanciamento del carico, uno strumento che distribuisce il traffico alle istanze server sane per garantire la disponibilità continua. Il bilanciamento del carico e il software di auto scaling che lavorano in tandem forniscono una gestione efficiente delle risorse. Il software di auto scaling fornisce nuove istanze per le quali il software di bilanciamento del carico può fornire connessioni.
Per qualificarsi per l'inclusione nella categoria Auto Scaling, un prodotto deve:
Monitorare continuamente l'ambiente cloud per identificare le esigenze di capacità e liberare risorse
Allocare e deallocare nuove istanze se un'applicazione richiede più o meno risorse
Anticipare le fluttuazioni della domanda basandosi su modelli regolari di consumo delle risorse
Fornire visibilità sul consumo delle risorse in tutto il sistema attraverso un'unica dashboard o portale