4 casos de uso que precisam do Cassandra

Samuel Matioli
4 min readDec 28, 2022

--

O Apache Cassandra™ é reconhecido como a melhor solução NoSQL em casos de uso que demandam missão crítica e performance com um volume muito grande de dados. Mas por que ele é estratégico para soluções de ecommerce, financeiras, IoT ou logística?

Uma empresa financeira localizada na Oceânia e cliente da DataStax recentemente nos comentou que, nos últimos sete anos, a única aplicação que não caiu foi justamente o DataStax Enterprise, uma distribuição proprietária do Cassandra com mais recursos empresariais, o que comprova sua aptidão para missão crítica.

Por esta característica de altíssima resiliência e auto recuperação, ele se mostra um componente estratégico na arquitetura de diversos segmentos de negócio.

Vejamos 4 casos de uso em alguns segmentos de negócio que utilizam o Cassandra em seu núcleo:

1 — Aplicativos B2C para consulta de transações

Por que: Milhões de clientes acessando milhões de transações obtendo a resposta em milissegundos

Segmentos: Bancos, Telecom, Cartões de Crédito, Concessionárias de serviço público.

Hoje é comum consultarmos extratos de transações diretamente dos nossos computadores ou celulares. No entanto, para disponibilizar acesso à movimentação das nossas contas bancárias, nossas ligações e consumo do plano de dados ou compras realizadas por cartões de crédito instantaneamente temos de manter um volume muito grande de dados que precisam ser rapidamente recuperados. A arquitetura do Cassandra é perfeita para este caso, uma vez que foi pensada para que o volume de dados não interfira na performance de escrita e leitura, enquanto pode ser constantemente escalada para suportar mais dados conforme o tempo passa. Além disso, por ser nativamente multi data center, atende perfeitamente cenários de altíssima disponibilidade e recuperação de desastres.

2 — Catálogo de Produtos e Ofertas

Por que: Velocidade em meio à montanha de dados para converter vendas

Segmentos: Varejo, E Commerce

A competição pelos clientes é feroz e não proporcionar uma boa experiência de compra é fatal para as vendas. Além disso, são segmentos que têm picos de demanda não necessariamente previsíveis em seu tamanho e época. Por isso, além da velocidade que o Cassandra apresenta para acelerar a exibição dos produtos e variações, com seus preços, ofertas e estoque perfeitamente sincronizados mesmo com alto volume de dados, a sua capacidade de escala para períodos de pico, como a Black Friday, é vital para que todo o investimento de marketing destas épocas não sejam desperdiçadas por uma solução que não suporta a demanda.

3 — IoT

Por que: Muitos dados gerados que precisam ser armazenados, processados e distribuídos com muita rapidez.

Segmentos: Indústria, Varejo, Saúde… (na verdade, quem não usa IoT hoje?!)

Os sensores estão espalhados por aí, em máquinas industriais, câmeras de monitoramento, contadores de produção, e geram dados constantemente. São dispositivos que nunca param de enviar novas informações. Velocidade, escala e disponibilidade são fundamentais, mas aqui gostaria de destacar outra característica: A modelagem do Cassandra é otimizada para armazenamento de séries temporais, simplificando sua utilização e consumo, assim como pode descartar automaticamente dados antigos não mais necessários. Daí, os dados ficam disponíveis para serem utilizados em monitoramento, geração de alertas ou mesmo para predição de eventos em tempo real.

4 — Rastreamento

Por que: Milhares de veículos, milhões de pacotes, milhões de entregas.. Tudo rastreável!

Segmento: Logística, Segurança

Rastrear veículos e objetos é naturalmente uma atividade que envolve muitos dados. Envolve registrar todo o caminho percorrido e o momento em que cada detecção ocorreu, que pode ser tanto a localização de veículos ou registro por leitores em esteiras de galpões para distribuição. As características do Cassandra são fundamentais aqui, dado que são operações que não param e não podem ficar no escuro por indisponibilidade ou lentidão, mas também é importante usar estes registros para gerar decisões. Por exemplo, a localização de um veículo ou uma entrega que não é feita no horário previsto pode indicar um problema de segurança e precisa ser verificada. Notificar o cliente sobre a previsão ou atrasos na entrega aumenta a confiança e transparência da operação. Por isso, o mecanismo de change data capture (ou CDC) ajuda a distribuir dados para que decisões sejam tomadas em tempo real.

Todos estes casos de uso estão hoje em produção com o Cassandra ao redor do mundo. Porém manter esta infraestrutura no ar pode ser uma dor para a equipe de SRE, por isso uma opção para diminuir os esforços de gerenciamento é utilizar o DataStax Astra, um DBaaS (bancoo de dados como serviço) construído em torno do Cassandra pela empresa que mais conhece esta solução. Alem do BD, ainda estão disponíveis o Stargate, uma API gateway automático sobre o modelo de dados e o Astra Streaming, solução de mensageria baseado no Apache Pulsar, que é utilizado para criar aplicações de tempo real.

--

--