광고를 게재하는 도중이나 판매가 가장 많은 시간대에 웹사이트가 "병"되면 1분 1초가 돈이 됩니다. 이 문서는 호치민시 기업을 위한 P1 표준 비상 대응 플레이북입니다. 사고 식별 방법, 처음 2시간 내 '소방' 절차, 데이터 위험 제어 및 지속 가능한 복구 로드맵.
1) 빠른 식별: 어떤 상황에 직면하고 있나요?
P1 그룹 - 즉시 처리해야 함
HTTP 500: 공백 page/“내부 서버 오류”, 로그에서 PHP 치명적/시간 초과, 백엔드 서비스 중단을 보고합니다.
일괄 HTTP 404/Soft 404일괄 HTTP 404/Soft 404: 잘못된 리디렉션, 배포/마이그레이션 후 슬러그 변경, 사이트맵 오류.
해킹/악성 코드: 이상한 팝업, 다른 도메인으로 리디렉션,
.php파일 이상합니다. Google에서는 "이 사이트는 해킹당했을 수 있습니다"라는 경고를 표시합니다.인터페이스 손상됨: CSS/JS가 로드되지 않음, 타사 스크립트 충돌, 테마/플러그인 업데이트 오류.
결제 오류: 웹훅/결제 게이트웨이 시간 초과, 이중 청구, 주문을 생성하지 않음 CMS.
관련 징후
GA4 세션이 갑자기 감소합니다. 종료율이 비정상적으로 증가했습니다.
가동 시간 모니터가 다운되고 CPU/RAM이 급증했습니다.
Search Console에서 오류 5xx/404가 증가했습니다. 판매자 센터에서 제품을 거부합니다.
2) '2 황금 시간' 규칙(최대 손실)
변경 사항 동결: 모든 대규모 배포/플러그인 업데이트/크론을 일시 중지합니다.
안전한 유지 관리 모드 활성화: 필요한 경우에만(예: 데이터가 노출됨) data/hack).
현재 상태 스냅샷: 터치하기 전에 데이터베이스 + 백업 파일
wp-content/app내보내기.로그 및 모니터 켜기: 서버 로그(Nginx/Apache), PHP-FPM, 애플리케이션(error.log), 게이트웨이 log.
P1 우선순위 P2: 액세스, 결제, 광고 방문 페이지 복원 → 그런 다음 아름답게 최적화합니다.
명확한 SLA가 포함된 연중무휴 대기 프로세스가 필요한 경우 Tan에서 호치민 웹사이트 유지관리 서비스(기둥 문서, P1 구조 프로세스에 대한 전체 설명, 체크리스트 및 교대 할당)를 참조하세요. Phat Digital: 호치민 웹사이트 유지관리 서비스.
3) 사고 처리 프로세스
A. HTTP 500 / 화이트 페이지
디버그 및 로그 활성화:
WP_DEBUG_LOG(WP),APP_DEBUG(Laravel), 오류 추적을 확인하세요.빠른 롤백: 500 이후에 가장 최근 빌드/백업으로 돌아갑니다. 배포.
원본 계정 해제: PHP-FPM 다시 시작, OPcache 플러시, DB 연결 확인(max_connections).
플러그인/테마 일시적 비활성화: 사이트가 먼저 작동하도록 오류를 일으키는 폴더 이름을 바꾸고 원본은 나중에 수정합니다.
B. 대량 404/Soft 404
고유 링크 복원(WP), 경로 재구축(프레임워크).
1–1 301 매핑 마이그레이션/구조 변경 후 변경된 URL에 대한
사이트맵 정리: URL만 포함 200–인덱싱 가능–표준; GSC를 다시 제출하세요.
"트래픽 마이그레이션 및 삭제"의 경우 팀에서 표준화한 월별 유지 관리 프로세스(반복 오류 모니터링 및 예방을 위한 SOP)에 모두 포함된 P1~P3(로봇, 301 맵, 표준, 사이트맵)에 따라 처리하세요. 월별 웹사이트 유지 관리 프로세스.
C. 해킹/악성 코드
모든 비밀번호 격리 및 변경(호스팅, DB, 관리자, SFTP, API).
검사 및 정리: 이상한 파일 찾기, 난독화 서명(base64/gzinflate/eval); 깨끗한 코어를 교체하고
wp-content/uploads를 유지합니다.업데이트 및 패치: CMS/플러그인/테마 버전, 이전 익명 플러그인 유형, 쓰기 잠금
wp-config.php.WAF/CDN: 방화벽 활성화(속도 제한, 봇 규칙), 공격 소스 IP 차단 2FA 관리자를 활성화하세요.
검색에서 경고가 표시되면 재검토를 요청하세요.
D. 인터페이스 손상됨(CSS/JS)
캐시 제거/CDN; 404 정적, 번들이 버전과 충돌하는지 확인하세요.
테마/플러그인 버전 롤백; 임시 자동 업데이트 잠금.
충돌하는 스크립트 분리/비활성화(채팅, 픽셀, A/B 테스트) → 조건부 로드.
E. 결제 오류
로그 제어: 웹훅(200/400/500), CMS의 주문 상태, cron 대기열.
실패 안전: 결제가 성공했지만 주문이 생성되지 않은 경우 수동 주문을 보상하고 고객에게 알립니다.
시간 제한 늘리기 및 재시도: 게이트웨이/웹후크에서 SSL/TLS 및 IP 허용 목록을 확인하세요.
4) 상업용 사이트(WordPress/Woo, Shopify, Custom)에 대한 "호흡 산소" 체크리스트
WordPress/WooCommerce 플랫폼
"이상한" 플러그인을 끄고 새로 업데이트된 플러그인을 롤백하세요. 버전.
.htaccess/permalink를 다시 생성합니다.mu-plugins 삽입을 삭제하고
wp-content/uploads에서 쉘을 검사합니다.Woo 대기열(작업 스케줄러) 확인 및 webhook.
Shopify
롤백 테마 버전; 새로 설치된 앱을 끄고 → 장바구니/체크아웃을 다시 테스트하세요.
checkout.liquid(Shopify Plus)에 삽입된 ScriptTag/앱을 확인하세요.
Custom/Laravel/Next.js
상태 확인 DB/cache/queue; 롤백 빌드;
.env연결 변수를 확인하세요.SSR/CSR 확인: 번들 오류, Nginx에서 경로 재작성.
5) 피해를 알리고 최소화하세요(침묵하지 마세요)
상태 메시지 배너/FAQ/FB 팬페이지: 예상 수정 사항 시간.
광고 일시중지 오류 페이지로 이동합니다. 핫라인/채팅 채널로 예산 이전.
보류 주문에 대한 고객 관리: 합당한 보상 약속(바우처/무료 배송).
6) 사고 기록 종료: RCA 및 강화(24~72시간 후)
RCA – 근본 원인 분석: 타임라인, 근본 원인, 영향 & 피해를 입힙니다.
SOPification: 환경에 따른 500/404/hack/결제 플레이북.
강화:
2FA, 최소 원칙에 따른 분산화.
3–2–1 백업: 3개 복사본, 2개 중간, 외부 1개; 매월 복원 테스트.
가동 시간 및 핵심 웹 바이탈 모니터.
Chaos day 매월: 30분 롤백/복원 훈련.
재발 방지를 위해 정기적으로 운영할 "인계" 팀이 필요합니까? 웹 유지 관리 패키지(속도/보안 감사, 당직 근무, 사고 보고 포함)로 전환할 수 있습니다. 웹 유지 관리 서비스.
7) "빠른 대응 팀"을 위한 SLA 제안
P1 – 사이트 다운/해킹/결제 오류: 교대 근무 허용 ≤ 15분, 기본 액세스 복원 ≤ 120 분.
P2 – 인터페이스 손상, 404개의 소그룹: ≤ 24시간.
P3 – 속도 최적화, 기술 SEO: 1~2주 스프린트.
커뮤니케이션 채널: Slack/Zalo 그룹, 연중무휴 대기 일정, 매일 업데이트 P1의 경우 30~60분.
8) 자주 묻는 질문(FAQ)
P1에서 사이트를 복원하는 데 얼마나 걸리나요?
가까운 백업 및 서버 액세스가 있는 경우 일반적으로 30~120분이 소요됩니다. 심층 데이터 해킹/해킹에는 >4시간이 걸릴 수 있습니다.
사이트를 패치하는 동안 광고를 실행할 수 있나요?
실패하는 페이지에서는 광고를 일시중지해야 합니다. 핫라인/채팅 채널 또는 랜딩 페이지에 대한 캠페인을 일시적으로 유지합니다.
맬웨어가 깨끗한지 어떻게 알 수 있나요?
서명 스캔, 코어 비교 삭제, cron/admin 진입점 확인, 아웃바운드 연결 모니터링 및 24~48시간 후 다시 스캔.
기술적 수정 후에도 트래픽이 여전히 즉시 반환되지 않는 이유는 무엇입니까?
SEO는 Google이 다시 크롤링/색인을 생성하는 데 시간이 필요합니다. 판매 웹사이트를 사용하면 전체 트래픽 전에 수익이 회복됩니다.
9) 사고 후 "최소 필수" 설정
일일 자동 백업 + 배포 시 스냅샷.
스테이징 필요, 게시하기 전에 체크리스트 검토 생산.
모니터링: 가동 시간, 오류 로그, CWV, 성공적인 결제 비율.
권한 및 로그: 소유자, 관리자, 개발자; 로그 편집 코드/구성.
사이트 오류는 피할 수 없습니다. 하지만 명확한 P1 플레이북, 적절한 액세스, 백업/모니터링 습관, 배포 시 규율이 있다면 피해를 제어할 수 있습니다. (액세스 복원 → 감염 방지 → 복구 → 강화) 올바른 순서로 처리하면 처음 2시간 이내에 시스템을 안정적인 상태로 만들고 반복을 방지할 수 있습니다.
공유








