🌐 Cloud Infrastructure for Global OliveYoung
K-뷰티 리더 올리브영의 글로벌 확장을 위한 MSA 기반 제로 트러스트(Zero Trust) 보안 인프라
CJ OliveNetworks Cloud Wave 6기 | 팀 `최강zl존`
구분
목표
🔐 보안
Zero Trust 기반 다층 방어 : 내/외부 위협 실시간 탐지 및 100% 자동화 대응
⚡ 성능
대규모 트래픽 처리 및 무중단 DR : '올영세일' 수준 트래픽 처리, 2분 내 재해 복구
💰 비용
FinOps 기반 비용 최적화 : 유휴 리소스 및 스토리지 비용 자동 관리 및 추적
💡 아래 제목을 클릭하면 상세 아키텍처 다이어그램이 펼쳐집니다.
[Architecture Diagram] 📍 AWS Seoul Region (Production / Staging)
[Architecture Diagram] 🇯🇵 AWS Tokyo Region (DR Site)
Hybrid Cloud : On-Premise (GitLab) + AWS Cloud (EKS) 연동
Multi-AZ : 운영계(Seoul) 다중 AZ 구성으로 고가용성 확보
Disaster Recovery : DR Site(Tokyo) Warm Standby 구성 (2분 내 자동 전환)
💡 아래 3개의 주제를 클릭하면 상세 구현 내용과 증명 자료(이미지)가 펼쳐집니다.
[구현 상세] 1. 원칙: "절대 신뢰하지 말고, 항상 검증하라"
서비스 간 상호 인증 : MSA 환경 내 모든 서비스 통신에 mTLS 상호 인증 적용
mTLS 자동화 : 수동 관리의 한계 → SPIRE 도입으로 워크로드 증명(Attestation) 기반 인증서 발급/갱신 100% 자동화
인증서 탈취 대응 : 60초 수명 의 초단기 인증서(SVID)를 30초 주기로 자동 갱신하여 탈취 피해 최소화
[구현 상세] 2. 자동화된 외부 위협 대응
테스트 시나리오 : 대규모 Credential Stuffing 공격 및 개인정보 유출 상황 모의
대응 파이프라인 : 탐지 → 차단 → 시각화 → 알림 → 분석 → 리포팅 전 과정 100% 자동화
실시간 대응 : WAF 자동 차단 → OpenSearch 실시간 시각화 → Slack 즉각 알림
분석 및 리포팅 : WAF Log (S3) → Athena 자동 쿼리 → SES 일일 보고서 발송
[구현 상세] 3. CI/CD 파이프라인 보안 (DevSecOps)
정적 코드 분석 : SonarQube를 통한 소스 코드 레벨의 잠재적 보안 취약점 사전 탐지
민감 정보 스캐닝 : Git 커밋 내 민감 정보(API 키 등) 실시간 탐지, 자동 비활성화 및 경고
유연한 리소스 확장 : Prometheus → HPA → Karpenter 연동으로 트래픽에 따른 동적 오토스케일링
안정적인 요청 처리 : Kafka 메시지 큐를 통한 비동기 처리로 대규모 트래픽 병목 현상 해소
응답 속도 향상 : VPC Endpoint를 통한 AWS 내부망 통신으로 네트워크 지연 최소화
비용 대비 성능 극대화 : AWS Graviton(ARM) 프로세서 도입으로 컴퓨팅 효율 최적화
🔬 성능 검증: '올영세일' 시나리오 스트레스 테스트
💡 아래 제목을 클릭하면 상세 테스트 과정 및 결과가 펼쳐집니다.
[Test Details] 시나리오 정의, 실시간 스케일링, 테스트 결과
시나리오 정의 :
기준 : 올리브영 공식 트래픽 5단계 모델 기반
목표 : 최고 부하 단계인 '(S) Special - 올영세일' (평시 20배 이상) 트래픽을 안정적으로 처리
실시간 스케일링 동작 :
Pod 확장 (HPA) : Prometheus로 수집된 CPU/Memory 임계값 초과 시 HPA가 Pod 수를 4개에서 13개로 확장
Node 프로비저닝 (Karpenter) : HPA에 의해 스케줄링 불가능한 Pod 발생 시 Karpenter가 신규 Node(7개→10개)를 Just-in-Time 방식으로 즉시 프로비저닝
테스트 결과 (Grafana 대시보드) :
결과 : 트래픽 폭증에 성공적으로 대응 후, 트래픽 감소 시 Pod와 Node가 설정된 기준에 따라 안정적으로 축소됨을 확인
Pod 수 : 4 → 13 → 4 (안정적 복귀)
Node 수 : 7 → 10 → 8 (비용 최적화를 위한 점진적 축소)
체계적인 비용 관리 : 전 리소스 태깅(Tagging) 을 통한 팀/서비스 단위 비용 추적 및 분석 (FinOps)
스토리지 비용 절감 : S3 Lifecycle Policy (Standard → IA → Glacier) 자동 이전 (44% 절감)
유휴 리소스 관리 : Lambda + EventBridge 로 심야 시간 개발 환경 리소스 자동 축소/종료
예산 초과 방지 : AWS Budget 설정으로 지정된 비용 임계값 초과 시 자동 알림 발송
구분
기술
Cloud & Infra
AWS EC2 EKS RDS Aurora S3 Route53 Lambda VPC ECS Fargate EventBridge
Container
Docker Kubernetes Karpenter Helm HPA
Backend
Go Java (Spring Boot) DynamoDB
CI/CD & IaC
GitLab Jenkins ArgoCD Terraform Amazon ECR
Security
SPIRE (mTLS) Falco SonarQube AWS WAF Secret Scanner NIST ZTA
Monitoring
Prometheus Grafana OpenSearch Slack
Message Queue
Kafka
Data Analysis
Amazon Athena Amazon SES
영역
성과
보안
SSL Labs B → A 등급 달성
성능
'올영세일' 부하 테스트 통과 (무중단 트래픽 처리)
DR
재해 복구 전환 2분 이내 달성 (목표 60% 단축)
비용
스토리지 비용 44% 절감 (실제 환경 54% 기대)
MSA (Go) : product-service, order-service
MSA (Java) : user-service
Infrastructure : eks-cluster, aws-infra-terraform
Popular repositories
Loading
Repositories
Showing 8 of 8 repositories
cloud-wave-best-zizon/.github’s past year of commit activity
0
1
0
0
Updated Nov 9, 2025
cloud-wave-best-zizon/eks-cluster’s past year of commit activity
0
1
0
0
Updated Sep 3, 2025
cloud-wave-best-zizon/product-service’s past year of commit activity
Go
0
1
0
0
Updated Aug 26, 2025
cloud-wave-best-zizon/order-service’s past year of commit activity
Go
0
1
0
0
Updated Aug 26, 2025
cloud-wave-best-zizon/user-service’s past year of commit activity
Java
0
0
0
0
Updated Aug 21, 2025
cloud-wave-best-zizon/aws-infra-terraform’s past year of commit activity
HCL
0
0
0
0
Updated Aug 14, 2025
cloud-wave-best-zizon/order-service-springboot’s past year of commit activity
Java
0
0
0
0
Updated Aug 12, 2025
cloud-wave-best-zizon/product-service-springboot’s past year of commit activity
Java
0
0
0
0
Updated Aug 12, 2025
Most used topics
Loading…
You can’t perform that action at this time.