2026년 실시간 DevOps 인터뷰 질문 30개
다운타임 없음을 보장하고 문제 발생 시 몇 분 내에 롤백할 수 있는 배포 전략을 설계하십시오.
언제 블루-그린, 롤링 또는 카나리아 배포를 사용해야 합니까? 각 유형의 장단점은 무엇입니까?
시스템 다운타임을 유발하지 않고 데이터베이스 마이그레이션을 처리하는 방법은 무엇입니까?
배포 후 CPU 스파이크 및 응답 시간이 5배 증가하면 어떤 순서로 디버깅합니까?
오늘 배포된 빌드가 프로덕션과 동일하도록 어떻게 해야 합니까? (재현 가능한 빌드)
대규모 트래픽 시스템을 위한 표준 CI/CD 파이프라인에는 어떤 단계가 있어야 합니까?
빌드 시간을 20분에서 5분으로 줄이는 방법은 무엇입니까?
빠른 실패를 위해 파이프라인을 어떻게 설계합니까?
Secrets는 어떻게 해야 합니까? CI/CD에서 누출을 방지하기 위해 관리해야 합니까?
언제 하나의 모놀리식 파이프라인 대신 여러 파이프라인을 분리해야 합니까?
언제 VM 대신 컨테이너를 선택해야 합니까?
시스템이 1개의 서버로 시작하는데 어떻게 수백만 대까지 확장할 수 있습니까? 사용자?
수직적 확장과 수평적 확장 — 기준에 따라 선택 무엇을?
고가용성(99.9%+) 시스템을 설계하는 방법은 무엇입니까?
다중 지역 배포가 가치가 있습니까? 언제 사용해야 합니까?
Pod가 계속 다시 시작됩니다. 무엇을 먼저 확인합니까?
언제 HPA(Horizontal Pod Autoscaler)와 VPA를 사용해야 합니까?
활성 사용자를 삭제하지 않고 배포하는 방법 연결?
낭비를 피하기 위해 리소스 요청/제한을 어떻게 최적화합니까?
클러스터에 리소스가 가득 찬 경우 프로덕션이 실행되는 동안 어떻게 처리합니까?
시스템이 "죽고" 있는지 알기 위해 모니터링해야 하는 측정항목은 무엇입니까?
잘못 로깅하면 시스템이 중단될 수 있습니다 — 왜?
어떤 유형의 경고가 "의미 없는 경고"입니까?
실행 방법 마이크로서비스 시스템에서 근본 원인을 찾는 방법은 무엇입니까?
실제 상황에서 메트릭, 로그, 추적을 어떻게 구별합니까?
어떻게합니까? DDoS로부터 인프라를 보호합니까?
클라우드에서 최소 권한 원칙은 어떻게 적용됩니까?
다운타임 없이 보안 비밀을 순환하는 방법은 무엇입니까?
오전 3시에 프로덕션이 중단됩니다. — 전체 클라우드 제공업체 지역이 다음과 같은 경우에는 어떤 프로세스를 따르나요?
가동 중단 시 시스템이 어떻게 살아남을 수 있나요?
자세히 보기: 고급 Next.js 2026 인터뷰 질문
공유








