MetroEyes 정책 보고분산 운임 인센티브 — ROI v3 정량 분석

시민 분산 한 번에 +200원, 사회적 가치 1,393억/년

MetroEyes (코드명 SubwayBEV) 는 지하철·버스 BEV CV + 실시간 도시데이터 + 시민 분산 인센티브 의 3-축 통합 시스템입니다. 본 보고서는 정책 ROI v3 모델 (호선 9개 × 시간 24시간 매트릭스) 을 통한 분산 운임 정책의 정량 효과 분석을 제공합니다. 실데이터 9개 API 자체 CV BEV 양면 클로즈드 루프

핵심 KPI — 응답률 슬라이더로 라이브 갱신

응답률 30%
기준 30% = 현실적 중간 시나리오 (행동경제학 인센티브 응답률 평균). 0% = 인프라만 도입, 80% = 이상.
순 사회적 가치
1,393억/년
통근+사고+광고+에너지 − 인센티브
ROI 배수
347x
인프라 4억 / 134역 우선
절감 시간
473M분/년
2호선 단독 비중 33%
정책 비용
282억/년
분산 인센티브 지급 (100~200원)
ROI 응답률 곡선 — 0~80%
━ 순 사회적 가치 (억/년) ━ ROI 배수 (x10) ━ 정책 비용 (억/년) ● 현재 슬라이더 위치

시나리오 민감도 — 응답률 5단계

시나리오 응답률 절감 분/년 통근 가치 사고 회피 광고/에너지 정책 비용 순 가치 ROI
매우 보수5%79M197억258억74억−47억482억120×
보수15%237M592억294억102억−141억847억211×
중간 (기준)30%473M1,183억348억143억−282억1,393억347×
낙관50%789M1,972억420억200억−470억2,122억528×
이상70%1,105M2,761억492억255억−658억2,851억709×
호선 × 시간대 절감 매트릭스
그림 1 — 호선 9개 × 24시간 절감 분 매트릭스 (응답률 30%) · 출퇴근 양봉 + 만석 호선 우선

시스템 흐름 — 5단계 양면 클로즈드 루프

📷
CV BEV 검출
YOLO11n + BoT-SORT
🌆
도시 데이터
citydata 110 POI
🤖
자동 의사결정
절전·응급·분실·분산
📱
시민 분산 액션
5%p +100, 30%p +200원
📈
ROI 가시화
krw / value_won 라이브

차별점

🔬 학술 모델 정밀도

  • 호선별 cap 도달도 (1호선 0.55 → 9호선 1.10) 차등 적용
  • 출근 응답률 0.7 vs 퇴근 1.0 비대칭 (자율성 차이 반영)
  • 1주차 EDA K=3 클러스터링 (silhouette 0.387) 으로 환승허브 우선 적용
  • CardSubway 칸 컬럼 부재 입증 — 자체 CV 백엔드 명분

🛠 시연 신뢰성 (D-day fail-safe)

  • --demo 모드 — CV 모델 없이도 BEV 트랙 5Hz broadcast
  • ▶︎ 시연 인젝터 — 30초 5종 이벤트 자동 발생 (운영자/버스/광고)
  • 4-패널 통합 시연 페이지 (운영자 + 시민 + 광고 + 실카메라)
  • backend 신규 클라이언트 join 시 즉시 누적 summary 전송

💡 사람 살리는 AI

  • 응급 골든타임 — 30초+ 정지 + AED 거리 자동 안내
  • 분실물 자동 검출 — BoT-SORT 가방 클래스 트래킹 + 무인 12s 임계
  • 인파 폭증 — 네이버 뉴스 + Claude LLM 자동 컨텍스트
  • 24h 폭증 예측 — 시간 baseline + hist_trend + hot 가중

🔗 양면 가치 사슬

  • 시민 분산 → backend krw 누적 → 운영자 콘솔 정책 비용 + ROIx 라이브
  • 운영자 절전 N칸 → 시민 PWA 한산 추천 → 시민 분산 보상
  • 한국교통연구원 혼잡비용 167원/분 환산 (외부 검증 가능)
  • 9개 공공 API 라이브 호출 (서울 7 + 공공데이터포털 2)

1주차 EDA 발견 — 자체 CV 백엔드 명분

📊 양봉 패턴 (시간대)

  • 출퇴근 양봉 — 08시 / 18시 진폭 1.9× (피크/한산)
  • 전 호선 공통 — 시간대 더미가 점유 변동의 97% 설명
  • 1호선 최대 양봉 (5시 9% → 18시 150%) · 9호선·2호선 cap 상시 도달

🚇 칸 컬럼 부재 입증

  • CardSubwayTime 스키마: HR_h_GET_ON_NOPE × 24시간 → 역 단위 합계만
  • 같은 역 내 1~10호차 분산 차이 미 captures
  • SK PUZZLE 칸별 실시간 = 10분만 / 공공 데이터 = 30분 평균
  • 자체 CV BEV (lite_server + tesla_bev) 필요

🎯 K=3 클러스터링

  • silhouette 0.387 · PCA 2-D 분산 84.1%
  • 오피스 (강남·광화문) / 주거 (잠실) / 환승 허브 (서울역·홍대) 3 분할
  • 환승 허브 85역 = 정책 우선 적용 그룹
  • 클러스터별 운영 시간 / 인프라 / 광고 단가 차별화 가능

↔ 환승역 비대칭

  • 예상: ON ≈ OFF (양방향 통행 균형)
  • 실제: 일부 환승역 ON/OFF 비율 1.5배 이상 비대칭
  • → "환승 통로의 한쪽 방향 압력" 가설 → A* 비상 동선 설계 근거
호선별 시간대 추정 칸 점유율
그림 2 — 호선별 시간대 추정 칸 점유율 — 1호선만 양봉 (5시 9% → 18시 150%), 다른 호선은 cap 도달 → MetroEyes CV 명분

데이터 출처 — 9개 공공 API 라이브 호출

🌆 서울 열린데이터광장 (7)

  • citydata — 통합 도시데이터 (110 POI 분단위)
  • citydata_ppltn — 인구·혼잡도 (성수동 폭증 포착)
  • SPOP_DAILYSUM_JACHI — 자치구 일별 생활인구
  • CardSubwayStatsNew — 시간대별 승하차 (월 단위)
  • realtimeStationArrival — TOPIS 실시간 도착
  • ListPublicReservationCulture — 문화 행사 예약
  • bikeList / tbCycleStationInfo — 따릉이 정류장

🔌 공공데이터포털 / 외부 (2)

  • 버스 도착 BIS (별도 키)
  • 네이버 검색 + Anthropic Claude — 인파 폭증 시 자동 컨텍스트 (네이버 뉴스 → Claude Haiku 4.5 요약)

🤖 자체 CV 백엔드

  • YOLO11n + BoT-SORT + 호모그래피 BEV → ws broadcast
  • --demo 모드 — CV 없이 fake BEV 트랙 5Hz (시연 fail-safe)
  • 9개 외부 API 라이브 호출 라우팅 + 폭증 감지 자동 LLM 컨텍스트

EDA v3 — 실 CardSubwayTime 직접 회귀 R²=0.931

data/processed/subway_time_202602.parquet (621행 × 52컬럼) 의 HR_*_GET_ON_NOPE 직접 입력. 171 (호선 × 시간대) 샘플 → GradientBoostingRegressor (300, depth 4, lr 0.05) + 5-fold CV. R² 0.931 ± 0.048 · MAE 29.25 명/칸 (target std 170.4 → MAE/std = 0.17 정밀도). Top 특징: n_stations 0.300 (호선 길이) / is_late 0.191 / hour 0.175 / is_peak_pm 0.119.

실 GBR 특징 중요도
그림 3 — 실 데이터 GBR 특징 중요도 — n_stations + 시간대 양봉이 점유 변동 87% 설명
실 데이터 예측 vs 실측
그림 4 — 실 parquet 예측 vs 실측 (대각선 = 완벽 일치) · 5-fold R² 0.931 ± 0.048
5-fold CV detail: fold R² = 0.939, 0.974, 0.841, 0.929, 0.972 (mean 0.931, MAE 29.25 명/칸 vs target std 170.4). 잔차 top 5 모두 |Δ| < 10 명/칸 — 모델 안정 학습. 호선 길이(n_stations) 가 cars(차량 수) 보다 점유 분산 4배 강한 변수.

EDA v2 — Synth target sanity check R²=0.981

v1 cap_ratio + 양봉 곡선 위 1,080 샘플 sanity check — is_peak_am/pm + hour 가 점유율의 97% 설명. 실 데이터 v3 R² 0.931 보다 높은 이유: target 자체가 양봉 함수의 deterministic 변환이라 GBR 이 거의 완벽 예측. v3 가 신뢰할 만한 검증.

결론 — 한 줄로

시민 한 사람의 분산 액션 ₩200 → backend 누적 → 운영자 정책 비용 ₩X / ROI x 라이브 → 응답률 30% 시 사회적 가치 1,393억/년.
"혼잡은 가만히 있어도 비용. 분산은 가만히 있어도 자산." — 칸 단위 BEV 가시화 + 시민 인센티브 클로즈드 루프 + 정책 ROI 정량화.

향후 발전 로드맵

📅 단기 (3개월)

  • 2호선 환승 허브 5역 파일럿 — Jetson Orin Nano 카메라 4대/역
  • 실 보상 결제 연동 (Tmoney 마일리지 또는 지자체 포인트)
  • 응급/분실 알림 → 역 직원 모바일 푸시 (현장 대응 평균 30초 단축 목표)

📅 중기 (6개월)

  • 모든 환승 허브 85역 + 운영자 통합 관제센터 라이브
  • 버스 연계 — 환승 시 분산 보상 합산 (지하철 + 버스 양방향)
  • 호선별 cap 평탄화 -0.66%p → -2%p 측정 (실 데이터 검증)

📅 장기 (1년+)

  • 전 296역 확대 — 인프라 9억 (296×3M) → ROI 200x 유지
  • 광역 BIS 연계 (수도권 GTX·광역버스) — 환승 패턴 학습
  • 다른 광역시 적용 (부산·대구·인천 — 호선 차등 모델 전이)
  • 오픈소스 일부 공개 — 다른 도시 BEV 시스템 표준화

심사위원 시연 가이드

1.
이 페이지 상단 응답률 슬라이더 0~80% 이동 → 4 KPI + 곡선 라이브 갱신 확인
2.
nav 우상단 🎬 통합 시연 → ▶︎ 시연 시작 클릭 → 5분 4-패널 자동 재생
3.
🚇 운영자 콘솔 → ▶︎ 시연 모드 30초 → 무임/분실/응급/이상/분산 5종 자동 발생
4.
📱 시민 PWA → 권장 칸 CTA 클릭 → +200원 보상 toast → onboard 누적 카드
5.
🛠 Debug Console → Live Impact 카드 7 KPI + 메시지 sparkline 60초 → 백엔드 전체 가시