A GitHub divulgou que enfrentou quatro episódios de degradação de desempenho em seus serviços ao longo de outubro de 2025. Os problemas, descritos no relatório mensal de disponibilidade, envolveram falhas de rede, erro de configuração, interrupção de serviço externo e dependência de fornecedor terceirizado.
9 de outubro – falha de rede durante manutenção
Entre 14h35 e 15h21 UTC, um equipamento de rede em modo de manutenção foi reintegrado antes do término dos reparos. O tráfego que passava pelo dispositivo registrou perda significativa de pacotes, provocando lentidão na interface do github.com para usuários autenticados nos primeiros cinco minutos. As APIs tiveram pico de 7,3% de erros, estabilizando em cerca de 0,05% até a mitigação. O GitHub Actions teve 24% das execuções atrasadas em média 13 minutos e o Large File Storage apresentou 0,038% de falhas. A empresa vai reforçar o processo de validação antes de recolocar equipamentos desse tipo em produção.
17 de outubro – interrupção em notificações push
Das 12h51 às 14h01 UTC, notificações push para dispositivos móveis deixaram de ser entregues por 70 minutos, afetando usuários do github.com e do GitHub Enterprise Cloud em todas as regiões. O problema foi causado por alteração de configuração equivocada em recursos de nuvem responsáveis pelo serviço. Procedimentos de gestão desses recursos estão sendo revistos para evitar recorrência.
20 de outubro – queda no Codespaces
Entre 08h05 e 10h50 UTC, o Codespaces apresentou instabilidade: a criação de novos ambientes teve média de 39,5% de erros, chegando a 71%, enquanto operações de retomada registraram 23,4% de falhas, com pico de 46%. A origem foi uma falha em serviço terceirizado essencial para compilar imagens devcontainer, desencadeando efeito cascata. A normalização ocorreu após a recuperação do fornecedor. A GitHub analisa alternativas para retirar essa dependência do caminho crítico e aprimorar monitoramento e alertas.
29 de outubro – pane em fornecedor externo afeta vários serviços
Das 14h07 às 23h15 UTC, uma ampla indisponibilidade em provedor terceirizado provocou degradação generalizada. Usuários do Codespaces enfrentaram taxas de erro médias de 90%, atingindo 100% em todas as regiões. Runners de maior porte no GitHub Actions registraram 0,5% de fluxos afetados e quase 10% dos jobs atrasados ou falhos por mais de cinco minutos, com recuperação às 20h40 UTC. O GitHub Enterprise Importer apresentou falhas em migrações durante git push e atrasos significativos; novos testes do GitHub Enterprise Cloud com Data Residency também foram retardados. Já o Copilot Metrics API teve cerca de 100 solicitações frustradas até o início da recuperação às 20h25 UTC. Mitigações foram aplicadas ao longo do evento, mas a plena restauração só ocorreu após o retorno do serviço externo. A empresa busca reduzir dependências críticas de fornecedores e implementar degradação controlada em situações semelhantes.
Imagem: Internet
O relatório recomenda acompanhar a página de status da plataforma para atualizações em tempo real, além de consultar o blog de engenharia para detalhes sobre melhorias em curso.
Com informações de GitHub Blog

