Após elaborarmos diversos tópicos como Performance, Capacidade e Escalabilidade, Métricas de Continuidade de Negócio e diversos outros assuntos relacionados, este capítulo tem o objetivo de fazer um “recap” de alguns...
Entenda o que é Single Point of Failure (SPoF) e como projetar sistemas resilientes utilizando redundância, replicação, failover automático e estratégias de Disaster Recovery. Explore também métricas essenciais de confiabilidade...
Um guia profundo sobre Cell-Based Architecture e como projetar sistemas distribuídos resilientes utilizando células independentes, replicação de dados, shuffle sharding e isolamento de falhas para reduzir blast radius em larga...
Este blueprint tem objetivo de mostrar a forma de utilizar o EnvoyFilter para implementar um rate limit local, a nível de pod, para preservar o capacity a nível proativo e...
Entenda o Bulkhead Pattern e como ele isola falhas em sistemas distribuídos. Explore estratégias de segregação de recursos, sharding, segmentação de tenants e redução de blast radius para aumentar a...
Um guia aprofundado de Capacity Planning em sistemas distribuídos, explorando Teoria das Filas, Lei de Little, Knee Curve e modelagem de carga para entender limites de throughput, latência e concorrência...
Uma explicação completa e prática sobre Event Sourcing, cobrindo Event Store, Event Bus, Projections, Read Models, Snapshotting e Rehydration, além de estratégias para lidar com consistência eventual, versionamento, idempotência e...
O gerenciamento de tráfego sincrono durante rollouts de aplicações em Kubernetes pode oferecer algum tipo de ruido operacional e refletir na experiência dos clientes, especialmente quando lidamos com aplicações que...
Este artigo faz parte de uma organização de um material bruto excedente da minha tese de mestrado. Tem o objetivo de compilar as referencias tecnicas e experimentações práticas.