Skip to content
@cloud-wave-best-zizon

cloud-wave-best-zizon

🌐 Cloud Infrastructure for Global OliveYoung

K-뷰티 리더 올리브영의 글로벌 확장을 위한 MSA 기반 제로 트러스트(Zero Trust) 보안 인프라


CJ OliveNetworks Cloud Wave 6기 | 팀 `최강zl존`

민동일 심규선 김지호 장욱재 박소정

🚀 프로젝트 목표

구분 목표
🔐 보안 Zero Trust 기반 다층 방어: 내/외부 위협 실시간 탐지 및 100% 자동화 대응
⚡ 성능 대규모 트래픽 처리 및 무중단 DR: '올영세일' 수준 트래픽 처리, 2분 내 재해 복구
💰 비용 FinOps 기반 비용 최적화: 유휴 리소스 및 스토리지 비용 자동 관리 및 추적

🏗️ 아키텍처

💡 아래 제목을 클릭하면 상세 아키텍처 다이어그램이 펼쳐집니다.


[Architecture Diagram] 📍 AWS Seoul Region (Production / Staging)

[Architecture Diagram] 🇯🇵 AWS Tokyo Region (DR Site)

  • Hybrid Cloud: On-Premise (GitLab) + AWS Cloud (EKS) 연동
  • Multi-AZ: 운영계(Seoul) 다중 AZ 구성으로 고가용성 확보
  • Disaster Recovery: DR Site(Tokyo) Warm Standby 구성 (2분 내 자동 전환)

✨ 핵심 기능

🔐 보안 (Security)

💡 아래 3개의 주제를 클릭하면 상세 구현 내용과 증명 자료(이미지)가 펼쳐집니다.


[구현 상세] 1. 원칙: "절대 신뢰하지 말고, 항상 검증하라"
  • 서비스 간 상호 인증: MSA 환경 내 모든 서비스 통신에 mTLS 상호 인증 적용

    TLS vs mTLS Communication

  • mTLS 자동화: 수동 관리의 한계 → SPIRE 도입으로 워크로드 증명(Attestation) 기반 인증서 발급/갱신 100% 자동화

    SPIRE Architecture

  • 인증서 탈취 대응: 60초 수명의 초단기 인증서(SVID)를 30초 주기로 자동 갱신하여 탈취 피해 최소화

    Short-Lived SVID Renewal Proof

[구현 상세] 2. 자동화된 외부 위협 대응
  • 테스트 시나리오: 대규모 Credential Stuffing 공격 및 개인정보 유출 상황 모의

    Simulated Data Breach Scenario

  • 대응 파이프라인: 탐지 → 차단 → 시각화 → 알림 → 분석 → 리포팅 전 과정 100% 자동화

    Automated Threat Response Pipeline

  • 실시간 대응: WAF 자동 차단 → OpenSearch 실시간 시각화 → Slack 즉각 알림

    Real-time Detection & Alerting Demo

  • 분석 및 리포팅: WAF Log (S3)Athena 자동 쿼리 → SES 일일 보고서 발송

    Automated Log Analysis & Reporting

[구현 상세] 3. CI/CD 파이프라인 보안 (DevSecOps)
  • 정적 코드 분석: SonarQube를 통한 소스 코드 레벨의 잠재적 보안 취약점 사전 탐지

    SonarQube SAST

  • 민감 정보 스캐닝: Git 커밋 내 민감 정보(API 키 등) 실시간 탐지, 자동 비활성화 및 경고

    Secret Scanning & Alerting


⚡ 성능 (Performance)

  • 유연한 리소스 확장: PrometheusHPAKarpenter 연동으로 트래픽에 따른 동적 오토스케일링
  • 안정적인 요청 처리: Kafka 메시지 큐를 통한 비동기 처리로 대규모 트래픽 병목 현상 해소
  • 응답 속도 향상: VPC Endpoint를 통한 AWS 내부망 통신으로 네트워크 지연 최소화
  • 비용 대비 성능 극대화: AWS Graviton(ARM) 프로세서 도입으로 컴퓨팅 효율 최적화

🔬 성능 검증: '올영세일' 시나리오 스트레스 테스트

💡 아래 제목을 클릭하면 상세 테스트 과정 및 결과가 펼쳐집니다.


[Test Details] 시나리오 정의, 실시간 스케일링, 테스트 결과
  • 시나리오 정의:

    • 기준: 올리브영 공식 트래픽 5단계 모델 기반
    • 목표: 최고 부하 단계인 '(S) Special - 올영세일' (평시 20배 이상) 트래픽을 안정적으로 처리

    Traffic Level Scenario

  • 실시간 스케일링 동작:

    • Pod 확장 (HPA): Prometheus로 수집된 CPU/Memory 임계값 초과 시 HPA가 Pod 수를 4개에서 13개로 확장
    • Node 프로비저닝 (Karpenter): HPA에 의해 스케줄링 불가능한 Pod 발생 시 Karpenter가 신규 Node(7개→10개)를 Just-in-Time 방식으로 즉시 프로비저닝

    Real-time Scaling Visualization

  • 테스트 결과 (Grafana 대시보드):

    • 결과: 트래픽 폭증에 성공적으로 대응 후, 트래픽 감소 시 Pod와 Node가 설정된 기준에 따라 안정적으로 축소됨을 확인
    • Pod 수: 4 → 13 → 4 (안정적 복귀)
    • Node 수: 7 → 10 → 8 (비용 최적화를 위한 점진적 축소)

    Grafana Dashboard Results


💰 비용 (Cost)

  • 체계적인 비용 관리: 전 리소스 태깅(Tagging)을 통한 팀/서비스 단위 비용 추적 및 분석 (FinOps)
  • 스토리지 비용 절감: S3 Lifecycle Policy (Standard → IA → Glacier) 자동 이전 (44% 절감)
  • 유휴 리소스 관리: Lambda + EventBridge로 심야 시간 개발 환경 리소스 자동 축소/종료
  • 예산 초과 방지: AWS Budget 설정으로 지정된 비용 임계값 초과 시 자동 알림 발송

🛠️ 기술 스택

구분 기술
Cloud & Infra AWS EC2 EKS RDS Aurora S3 Route53 Lambda VPC ECS Fargate EventBridge
Container Docker Kubernetes Karpenter Helm HPA
Backend Go Java (Spring Boot) DynamoDB
CI/CD & IaC GitLab Jenkins ArgoCD Terraform Amazon ECR
Security SPIRE (mTLS) Falco SonarQube AWS WAF Secret Scanner NIST ZTA
Monitoring Prometheus Grafana OpenSearch Slack
Message Queue Kafka
Data Analysis Amazon Athena Amazon SES

📊 핵심 성과

영역 성과
보안 SSL Labs BA 등급 달성
성능 '올영세일' 부하 테스트 통과 (무중단 트래픽 처리)
DR 재해 복구 전환 2분 이내 달성 (목표 60% 단축)
비용 스토리지 비용 44% 절감 (실제 환경 54% 기대)

📂 레포지토리

  • MSA (Go): product-service, order-service
  • MSA (Java): user-service
  • Infrastructure: eks-cluster, aws-infra-terraform

Popular repositories Loading

  1. .github .github Public

    1

  2. order-service order-service Public

    Go 1

  3. product-service product-service Public

    Go 1

  4. product-service-springboot product-service-springboot Public

    Java

  5. order-service-springboot order-service-springboot Public

    Java

  6. aws-infra-terraform aws-infra-terraform Public

    HCL

Repositories

Showing 8 of 8 repositories

Top languages

Loading…

Most used topics

Loading…