Bancos de dados de coluna larga são bancos de dados NoSQL que armazenam dados em tabelas, linhas e colunas. O nome e os formatos de coluna podem variar de uma linha para outra. Bancos de dados de coluna larga são geralmente interpretados como armazenamentos de chave-valor 2D ou chave chave-valor. Bancos de dados de coluna larga também são conhecidos como bancos de dados de família de colunas. Esses bancos de dados são usados para fluxos de trabalho transacionais. Bancos de dados de coluna larga podem ser usados em casos com grandes conjuntos de dados distribuídos por vários nós de banco de dados. Dado o grande volume de dados em IoT, cientistas de dados geralmente usam bancos de dados de coluna larga para armazenar dados de IoT e perfis de usuários. Também é usado para gerenciar grandes armazéns de dados devido à sua capacidade de escalar.
Bancos de dados de coluna larga ajudam na escalabilidade horizontal dos dados e fornecem consistência de dados. Os dados são armazenados em células de coluna que são agrupadas em famílias de colunas. Bancos de dados de coluna larga podem filtrar dados por valor. Bancos de dados de coluna larga diferem de bancos de dados colunares em relação ao armazenamento de dados. Bancos de dados colunares armazenam cada coluna separadamente em um disco, enquanto bancos de dados de coluna larga suportam famílias de colunas armazenadas juntas. Bancos de dados de coluna larga também diferem de bancos de dados relacionais. Bancos de dados relacionais têm várias tabelas, enquanto bancos de dados de coluna larga têm várias famílias de colunas.
Para se qualificar para inclusão na categoria de Bancos de Dados de Coluna Larga, um produto deve:
Conter chave-valor 2D ou chave chave-valor
Ter clustering para banco de dados distribuído
Fornecer gerenciamento de tempo de vida (TTL)
Suportar uma variedade de tipos de dados como String, Boolean, Integer e Double
Fornecer uma estrutura tridimensional (linha, coluna e tempo)