
Às vezes, no aprendizado de máquina clássico, a velocidade oferecida pelo ecossistema PyData simplesmente não é rápida o suficiente. Ferramentas como Dask e Vaex ajudam e executar trabalhos em um cluster Spark é frequentemente uma solução interessante também, mas às vezes você precisa de um pouco mais do que isso.
É aí que o Rapids e todo o ecossistema Rapids entram em cena. Embora eles não sejam substitutos diretos para Pandas, Numpy e Scikit-learn, cudf e cuml ajudam a construir aprendizado de máquina tabular em GPUs de forma muito eficaz. Sua API é principalmente semelhante ao ecossistema PyData e, embora a interoperabilidade seja incerta, é muito possível.
Rapids também facilita a execução em um cluster de GPU distribuído, uma tarefa difícil para algoritmos tabulares. E suas técnicas de gerenciamento de memória com Apache Arrow garantem que esse aspecto funcione suavemente. Análise coletada por e hospedada no G2.com.
Configurar o Rapids fora de clusters gerenciados não é uma tarefa simples. Embora a instalação com pip seja possível, é um pouco arriscado. Às vezes funciona, às vezes não, às vezes finge funcionar e falha de maneiras catastróficas, estúpidas e imprevisíveis. Análise coletada por e hospedada no G2.com.
Validado pelo LinkedIn
Este avaliador recebeu um cartão presente nominal como agradecimento por completar esta avaliação.
Convite do G2. Este avaliador recebeu um cartão presente nominal como agradecimento por completar esta avaliação.
Esta avaliação foi traduzida de English usando IA.


