Consultoria Cloud Native · desde 2019

Infraestrutura cloud que não te trava quando o negócio acelera.

Consultoria especializada em AWS, Kubernetes e multi-cloud para empresas que precisam escalar plataforma - inclusive cargas de IA, LLM e GPU - sem inflar custo, headcount ou risco operacional. Migrações estruturadas, modernização de aplicações e operação IaOps com observabilidade end-to-end, SLOs auditáveis e alta disponibilidade desenhada para SLA de quatro noves.

+120workloads
migradas para cloud
38%
redução média de custo
99,98%
SLA médio dos clusters
6sem
time-to-prod típico
Pilares de plataforma · 02

Seis frentes que toda consultoria promete. Nós mensuramos.

SLA 99,98% contratos ativos · últimos 24 meses
IaOps
100% IaC

Infrastructure as Code

Terraform, Pulumi e Crossplane com pipelines reproduzíveis. Nenhuma mudança passa pelo console - tudo em PR, com plan/diff revisado.

Observabilidade
3pilares

Logs, métricas, traces

Stack unificada em OpenTelemetry. SLOs amarrados a error budget, dashboards por domínio e alertas que acordam alguém só quando precisam.

FinOps
−38%

Custo sob governança

Karpenter, savings plans, right-sizing contínuo e showback por equipe. Cada workload tem dono, tag e justificativa de gasto.

HA / DR
99,99%

Alta disponibilidade

Arquiteturas multi-AZ por padrão, multi-região quando RPO/RTO exige. Disaster recovery testado em GameDay trimestral, não em slide.

Security
0incidentes

Segurança contínua

Workload identity, image signing, runtime detection e least-privilege auditado. Atende PCI-DSS, ISO 27001, LGPD e SOC 2.

IA & Op.
6frentes

IA na operação

Infra, custo, código, deploy, segurança e escala - IA mexe nas seis ao mesmo tempo. Tratamos como engenharia de plataforma, não como demo de modelo.

Serviços · 03

O que entregamos.

Trabalhamos como extensão do seu time de plataforma. Cada projeto começa por entender contexto, restrições e objetivos - antes de propor escopo - e termina com runbooks, automação e o time interno apto a operar, não a depender de nós.

S/01

Migração On-Premise → Cloud AWS · primary

Discovery automatizado, wave planning e cutover sem janela escura. Aplicações com banco stateful, mainframe-adjacent e dependências de rede pesada são nosso pão com manteiga.

  • Assessment 6R · TCO comparativo
  • Landing Zone multi-account com Control Tower
  • Replatform com EKS / ECS · containers OCI
  • Migração de SQL Server, Oracle e legados
S/02

Cloud → Cloud multi-vendor

Saída de single-vendor lock-in ou consolidação após M&A. Movimentamos workloads entre AWS, Azure e GCP preservando observabilidade, identidade e compliance.

  • Re-arquitetura para serviços managed equivalentes
  • Federação SSO/IAM cross-cloud
  • Data replication com janela < 4h
  • FinOps unificado pós-migração
S/03

Modernização de Aplicações app · 12factor

Tiramos monólitos de WAS/IIS, refatoramos em strangler-fig e empacotamos em containers prontos para Kubernetes. Sem big-bang, sem reescrita de 18 meses.

  • Containerização · Helm · ArgoCD GitOps
  • Service mesh quando faz sentido (Istio/Linkerd)
  • API gateway, autenticação e rate-limiting
  • Observabilidade OpenTelemetry end-to-end
S/04

Plataforma Kubernetes CKA · CKS

EKS, AKS, GKE ou bare-metal. Construímos plataformas hardened com pod security, secrets KMS-backed, runtime security e custo previsível via Karpenter/Cluster Autoscaler.

  • Cluster bootstrap em IaC reproduzível
  • Multi-tenancy com namespaces + OPA Gatekeeper
  • Disaster recovery testado (Velero, etcd backups)
  • Onboarding de devs em developer portal
S/05

SRE & DevOps as a Service on-call

Estendemos seu time durante 3–12 meses com engenheiros sênior on-call, runbooks vivos e SLOs de verdade. Saímos quando seu time já corre sozinho.

  • Error budget, postmortem e GameDay mensal
  • Pipelines CI/CD com SLSA 3+
  • Cost optimization contínuo (savings plans, RIs)
  • Transferência de conhecimento documentada
S/06

Segurança Cloud Native CKS · zero-trust

Threat model de plataforma, hardening de cluster e revisão de pipeline supply chain. Atendemos exigências de PCI-DSS, ISO 27001, LGPD e SOC 2.

  • Workload identity sem secrets long-lived
  • Image signing (cosign) e SBOM por build
  • Runtime detection (Falco/Tetragon)
  • Auditoria de IAM e least-privilege contínuo
IA na operação · 04

IA muda infra, custo, código, deploy e risco. Tudo ao mesmo tempo.

A adoção de IA não é só "subir um endpoint de LLM". Reflete em capacity planning, fatura de cloud, padrões de revisão de código, política de deploy, superfície de ataque e modelo de escalabilidade. Tratamos as seis frentes juntas - porque elas falham juntas.

F/01 · Infra

Onde IA encosta na plataforma

Workloads de inferência mudam o perfil de capacity: VRAM como gargalo, cold starts longos, padrões de tráfego em rajada. Modelamos node pools dedicados, scale-to-1 quando faz sentido e isolamento de tenant.

  • Node pools GPU com Karpenter (H100 / A100 / L4)
  • vLLM, Triton, KServe e NIM em EKS / GKE
  • RAG self-hosted (Qdrant, Pgvector) com cache
F/02 · Custo

FinOps quando o token é a unidade

API comercial cobra por token, GPU dedicada cobra por hora, embedding cobra duas vezes. Mapeamos cost-per-feature, comparamos vendor vs. self-hosted e cortamos gasto invisível - cache, batching e fallback de modelo.

  • Showback de IA por time, feature e endpoint
  • Alerta de anomalia antes do fechamento de fatura
  • Bedrock / Vertex / Anthropic com guardrail de budget
F/03 · Código

Copilot, mas sob política da empresa

Code assistant integrado ao GitLab / GitHub - com modelo self-hosted quando o código é sensível. Padrões de review automatizados, geração de testes e ADRs sugeridos. Sem mandar repositório inteiro pra fora.

  • LLM gateway interno · audit log por dev
  • Test scaffolding e doc generation no PR
  • Policy de uso (PII, IP, secrets) auditável
F/04 · Deploy

IA dentro do pipeline, não em cima dele

LLM revisando Terraform plan, sumarizando diff, classificando risco de PR antes do humano. Changelog e release notes gerados do commit history. Runbook draft no momento que o alerta toca.

  • PR risk scoring (blast radius, custo, breaking change)
  • Postmortem assistido por LLM (correlação de eventos)
  • Runbook generation a partir de incidentes anteriores
F/05 · Segurança

Superfície nova, controles antigos não bastam

Prompt injection, vazamento de PII, model supply chain, jailbreak de tool-use. Aplicamos DLP no caminho do prompt, gating em tool-calling e auditoria por sessão. Atende LGPD, ISO 27001 e SOC 2 para conteúdo gerado por IA.

  • Guardrails: PII, jailbreak, output schema, rate-limit
  • Model signing e SBOM dos modelos em produção
  • Audit log prompt / resposta · retenção configurável
F/06 · Escala

Padrão de tráfego diferente do que sua API conhece

Inferência tem latência variável por contexto, request size desbalanceado e custo marginal alto. Reorganizamos throttling, queueing e cache para que o backend tradicional não pague o preço do hype.

  • Queue-based autoscaling (KEDA, queue_depth)
  • Semantic cache · roteamento por custo e qualidade
  • Modelo small / medium / large por tipo de requisição
.github/workflows/iac-review.yaml · LLM-assisted
01# revisão de Terraform plan com modelo self-hosted
02name: iac-review · cost + security + blast-radius
03on: pull_request
04jobs:
05  ai-review:
06    steps:
07    - uses: actions/checkout@v4
08    - run: terraform plan -out=plan.json
09    - uses: shiftcore/llm-review@v3
10      with:
11        model: "self-hosted/llama-3.1-70b"
12        plan: plan.json
13        checks: [iam-blast, cost-delta, ha-loss, cve-drift]
14        budget_usd: 0.04  # gasto máximo por PR
15 
16 14 PRs/dia · 0 chamadas a API externa · custo médio $0,012/PR
workflow · iac-review.yaml ● self-hosted · PII redacted · audit on
−54%
tempo médio de review de IaC após LLM no pipeline
67%
dos PRs aprovados em 1ª revisão (era 41%)
$0,18
custo por 1M de tokens em modelo 70B self-hosted
0
vazamentos de prompt / PII em 12 meses auditados

Não vendemos modelo. Desenhamos a operação ao redor dele - infra, custo, código, deploy, segurança e escala - para que IA gere produtividade contábil, não risco contábil.

Expertise · 05

Engenheiros, não revendedores.

Time 100% sênior com pelo menos 8 anos de cloud. Todas as certificações abaixo são ativas e mantidas - nenhuma está vencida, nenhuma é "em treinamento". Mostramos os badges sob NDA, se quiser conferir.

/01 AWS Solutions Architect - ProfessionalSAP-C02 · validade rolling AWS 11/14
/02 AWS DevOps Engineer - ProfessionalDOP-C02 AWS 9/14
/03 Certified Kubernetes AdministratorCKA · Linux Foundation CNCF 12/14
/04 Certified Kubernetes Security SpecialistCKS · pré-requisito CKA CNCF 7/14
/05 AWS Security - SpecialtySCS-C02 AWS 5/14
/06 Azure Solutions Architect ExpertAZ-305 / AZ-104 Microsoft 4/14
/07 Google Cloud Professional Architect+ Pro DevOps Engineer GCP 3/14
/08 HashiCorp Terraform Associate+ Vault Associate HashiCorp 14/14
Resultado · 06

Números que defendemos com runbook na mão.

Médias dos últimos 24 meses, 18 contratos encerrados e 11 ativos. Cada métrica é mensurada antes do início do projeto e auditada no encerramento - não estimada em slide.

−42%
Redução de custo cloudMédia em projetos de modernização concluídos em 2025
3,4×
Deploys / semanaAntes 1× a cada 2 semanas, depois várias por dia
−71%
MTTR de incidentesApós onboarding em SLO + observabilidade OTel
0
Vazamentos de dadosEm 24 meses, com 6 clientes em PCI-DSS / LGPD

Custo cloud mensal · antes vs. depois (USD · cliente médio)

Pré-projeto Pós-shiftcore
amostra · n = 11 contratos concluídos 2024–2025 fonte · AWS CUR + Azure Cost Mgmt + GCP Billing
Metodologia · 07

Cinco fases. Sem teatro de PowerPoint.

Todo engajamento segue a mesma cadência. Você sabe a fase em que está, o que precisa ser entregue na próxima, e quem é o responsável de cada lado. Reuniões são curtas; o trabalho fica em pull request.

FASE 01 · 1 SEMANA

Descoberta

Conversa inicial, mapeamento de workloads, dependências, custos e riscos. Saída: relatório técnico + plano 6R.

  • Wiz / Steampipe scan
  • TCO comparativo
  • Risk map
FASE 02 · 2 SEM.

Landing Zone

Multi-account, IaC, identidade federada e guardrails - fundação reproduzível em Terraform.

  • Control Tower / OUs
  • SSO + IAM Identity Center
  • Network hub-and-spoke
FASE 03 · 3–8 SEM.

Migração / Build

Wave-by-wave. Para cada workload: lift, refator ou rewrite - decisão técnica, não emocional.

  • Pipelines GitOps
  • Cutover plan + rollback
  • Smoke + carga
FASE 04 · 2 SEM.

Operação

Observabilidade, SLOs, runbooks e on-call. Time do cliente conduz, nós cobrimos a retaguarda.

  • OpenTelemetry stack
  • Error budget policy
  • GameDay #1
FASE 05 · CONTÍNUO

Handover

Documentação viva, transferência formal e plano de evolução. Você não fica refém da gente.

  • Runbooks em ADR
  • Treinamento hands-on
  • Roadmap 6-12 meses
Cases · 08

O que entregamos, fora do slide.

Três engajamentos representativos dos últimos 18 meses. Nomes alterados sob NDA; arquiteturas, métricas e cronograma reais - referências disponíveis sob solicitação.

CASE / 01 · FINTECH em operação

Migração de core bancário on-prem para AWS multi-região

~ 8 milhões de contas · PCI-DSS Lv1
−54%custo infra/ano
11semcutover total

Saída de datacenter próprio para EKS multi-AZ com replicação síncrona em duas regiões. Banco Oracle migrado para Aurora PostgreSQL via DMS com janela de 38 minutos.

AWSEKSAuroraKarpenterArgoCD
CASE / 02 · RETAIL em operação

Modernização de e-commerce monolítico em strangler-fig

14M visitas/mês · pico Black Friday
0incidentes na BF
9×deploys / semana

Decomposição de monólito .NET em microsserviços containerizados; checkout, catálogo e pagamentos extraídos progressivamente. Service mesh Linkerd com mTLS automático.

AWSEKSLinkerdCosignOTel
CASE / 03 · HEALTH-TECH em operação

Saída de Azure single-region para GCP + AWS multi-cloud

2,1M usuários · LGPD + HIPAA-ready
99,99%SLA pós-migração
−31%custo agregado

Workloads de inferência migrados para GKE com TPUs sob demanda; dados sensíveis isolados em AWS São Paulo. Federação Workload Identity entre nuvens.

GCPAWSGKEEKSVault
CASE / 04 · LOGTECH em operação

Plataforma Kubernetes self-service para 180 devs

42 microsserviços · entrega contínua
−71%MTTR de incidentes
6mindo commit à prod

Internal developer portal sobre Backstage, golden-path templates e GitOps fim-a-fim. Time de plataforma reduziu fila de tickets em 84% no primeiro trimestre.

AWSEKSBackstageArgoCDCrossplane
CASE / 05 · GENAI em operação

Plataforma LLM self-hosted para suporte e copiloto de produto

8× H100 · 22k tokens/s · LGPD-ready
−68%custo vs. API comercial
410mslatência p95

Llama-3.1 70B em vLLM com tensor-parallel, RAG sobre Qdrant e guardrails de PII. Spot fallback com 87% de utilização média - inferência saiu de US$ 0,52 para US$ 0,18 por 1M de tokens.

AWSEKSvLLMQdrantKarpenter
05 cases · arraste →
Clientes · 09

O que dizem quem nos colocou em produção.

Depoimentos coletados após o encerramento de cada engajamento. Os nomes estão omitidos publicamente por confidencialidade - encaminhamos referências diretas em conversas comerciais.

A shiftcore foi o primeiro fornecedor que recusou um escopo nosso porque "isso aqui você não precisa pagar consultoria pra fazer". Saímos com −47% de custo, deploy em horas em vez de semanas e - pela primeira vez - um runbook que o time de plantão entende.
Head of Platform Engineering FINTECH · 1.200 colaboradores
Já fiz três migrações para AWS na carreira. Esta foi a única em que o cutover aconteceu no horário planejado, sem rollback, e o time interno aprendeu o suficiente para evoluir sozinho depois.
CTO SaaS B2B · série C
Contratamos pela CKS. Ficamos pelo jeito como entregam: pull request, ADR, documentação, GameDay. Engenharia adulta.
Diretor de Tecnologia VAREJO · capital aberto
Em quatro meses paramos de tratar Kubernetes como caixa-preta. Equipe sênior, didática e que não some depois de assinar o aceite final.
VP de Engenharia HEALTHTECH · 250 eng.
Foi a primeira conversa em que a consultoria perguntou mais do que apresentou. Saímos da primeira call com 27 achados pra rever, 9 quick-wins óbvios e o motivo técnico de cada um. Em duas semanas, tinham desenhado um plano que três fornecedores anteriores não conseguiram.
Head of SRE LOGTECH · unicórnio
Stack

Tecnologias que rodam no nosso dia a dia.

AWSKubernetesTerraformEKSArgoCDKarpenter vLLMTritonKServeBedrockSageMakerOllama IstioLinkerdVaultPrometheusOpenTelemetryGrafana AzureGCPGKEAKSCosignFalco QdrantPgvectorKubeflowArgo WorkflowsLangChainNVIDIA NIM DatadogGitLabGitHub ActionsHelmPulumiCrossplane AWSKubernetesTerraformEKSArgoCDKarpenter vLLMTritonKServeBedrockSageMakerOllama IstioLinkerdVaultPrometheusOpenTelemetryGrafana AzureGCPGKEAKSCosignFalco QdrantPgvectorKubeflowArgo WorkflowsLangChainNVIDIA NIM DatadogGitLabGitHub ActionsHelmPulumiCrossplane
Contato · 10

Vamos conversar.

A gente prefere escutar antes de propor. Conte o contexto, restrições e objetivos - quem responde do outro lado é um engenheiro sênior, não um SDR. Em até um dia útil agendamos uma conversa de 45 minutos para entender se faz sentido trabalhar junto.

msg.new · shiftcore/contato ready
04Qual o contexto? selecione um ou mais
06Quando precisa começar?
awaiting input