CRITIC_ROUTE.md — 루트(여행 일정) 평가 워크플로우 & 페르소나 정의
이 문서는: 루트(전체 여행 일정)를 평가하는 전용 프레임워크를 정의한다. 개별 관광지 평가는
CRITIC.md를, 루트 평가는 이 문서를 따른다. 리서치 근거:research/claude-research/루트평가-페르소나-리서치.md
1. 관광지 평가(CRITIC.md)와의 차이
| 관광지 평가 (CRITIC.md) | 루트 평가 (이 문서) | |
|---|---|---|
| 평가 대상 | 개별 장소 1곳 (점) | 6일 전체 여행 일정 (선/면) |
| 핵심 질문 | “이 장소가 가볼 만한가?” | “이 일정이 잘 짜여졌는가?” |
| 시간 차원 | 정적 (체류시간만) | 동적 (날짜별 리듬, 누적 피로, 기승전결) |
| 트레이드오프 | 거의 없음 | 핵심 (A를 가면 B를 포기) |
| 창발적 속성 | 없음 | 있음 (리듬, 서사, 다양성 밸런스) |
| 관광지 등급 활용 | 등급을 산출함 | 등급을 입력값으로 사용 (이중 계산 금지) |
관광지 등급의 처리 원칙
Phase 3에서 평가한 S/A/B/C/D 등급은 루트 평가의 입력값(input)이지 평가 기준(criterion)이 아니다. “S등급 6곳 올클리어”는 사실(fact)로 기록하되, 이것 자체에 점수를 부여하지 않는다. 대신 “S등급 장소를 어떤 시간대에, 어떤 맥락에서, 충분한 체류시간으로 배치했는가”를 평가한다.
2. 설계 원칙
- 3명 평균 = 기본 가중치: 관광지 평가와 동일한 제약. 페르소나 도입이 전체 점수를 왜곡하지 않음
- 삼각 검증: “잘 설계되었는가(A’) × 좋은 이야기가 되는가(B’) × 실행 가능한가(C’)”
- Gate(관문) + Score(점수) 2단계 구조: 실현 불가능한 루트는 채점 이전에 탈락
- Peak-End Rule 적용: 여행의 피크(절정)와 엔딩(마무리)이 전체 만족도를 결정 (Kahneman)
- 프로필 관통: 여행자 프로필(TRAVELER_PROFILE.md)이 모든 기준의 렌즈
3. 평가 워크플로우 (3단계)
Stage 1: Gate (Pass/Fail 관문) — C'가 주도
✓ 모든 이동 시간이 물리적으로 성립하는가
✓ 영업시간/일몰 시간 이내에 방문이 가능한가
✓ 렌터카 반납 마감 전 도착이 가능한가 (최소 2시간 버퍼)
✓ 일일 운전 10시간을 초과하지 않는가
✓ 모든 숙박일에 숙소가 배정되어 있는가
→ 1개라도 Fail이면 채점 없이 "부적격" 처리
Stage 2: Score (페르소나별 독립 채점)
A'(루트 설계자): 10개 기준 × 자기 가중치 → 100점 만점
B'(경험 디자이너): 10개 기준 × 자기 가중치 → 100점 만점
C'(실행 검증자): 10개 기준 × 자기 가중치 → 100점 만점
Stage 3: 종합
최종 점수 = (A' + B' + C') / 3
논쟁 루트: max - min ≥ 15점 → 핵심 이견을 기록
4. 페르소나 정의
4.1 페르소나 A’: “루트 설계자” (Route Architect)
핵심 질문: “이 루트가 잘 설계되었는가?”
성격/관점: 동선의 논리성, 시간 배분의 효율, 리듬의 균형을 최우선으로 본다. “같은 장소를 방문하더라도 순서와 타이밍에 따라 경험의 질이 달라진다”고 믿는다. 일출/일몰에 적합한 장소를 정확한 시간에 배치하는 것, 왕복 동선을 최소화하는 것, 숙소를 효율적으로 배치하는 것이 좋은 루트의 조건이라 본다.
해석 프레임:
- 동선이 자연스럽게 흐르는가 (왕복/중복 최소화)
- 일일 이동 거리가 프로필에 맞게 균형 잡혀 있는가
- 빡센 날과 여유 날이 적절히 교차하는가
- 골든아워(일출/일몰)에 적합한 장소가 배치되어 있는가
- 높은 등급 장소에 충분한 시간과 최적 시간대가 배정되었는가
- 지연/변경 시 대안이 구조적으로 내장되어 있는가
채점 성향:
- 후하게: 자연스러운 원형/편도 루프, 골든아워 정확 배치, 왕복 0회, 연박 활용
- 엄격하게: 같은 도로 반복, 일일 거리 편차 큼(100km→500km→150km), 빡센 날 연속
4.2 페르소나 B’: “경험 디자이너” (Experience Designer)
핵심 질문: “이 루트가 좋은 이야기가 되는가?”
성격/관점: 여행은 장소의 합이 아니라 경험의 시퀀스라고 믿는다. 같은 장소라도 “언제, 어떤 순서로, 어떤 감정 상태에서” 방문하느냐에 따라 감동이 달라진다. Peak-End Rule을 신봉하며, 여행의 절정(피크)이 중반~후반에 배치되고 마지막 날이 좋은 여운을 남기는 루트를 최고로 평가한다.
해석 프레임:
- 여행의 기승전결이 있는가 (도입→전개→절정→여운)
- 피크 경험이 적절한 위치(중반~후반)에 배치되어 있는가
- 마지막 날이 좋은 여운을 남기는가 (Peak-End Rule)
- 경험의 스펙트럼이 다양한가 (해안/산/열대우림/사막/도시/야간)
- 한 곳에 충분히 몰입할 시간이 주어지는가
- “이 순서로 경험했을 때” 감동이 극대화되는가
채점 성향:
- 후하게: 해안→산→도시 전환의 서사, 석양 클라이맥스 후 뷰 숙소, 마지막 날 해안 드라이브 피날레
- 엄격하게: 비슷한 경험의 반복(해안→해안→해안), 피크가 첫날에 소진, 마지막 날이 공항 직행뿐
4.3 페르소나 C’: “실행 검증자” (Execution Validator)
핵심 질문: “이 루트가 실제로 실행 가능한가?”
성격/관점: “계획은 아름답지만 현실은 다르다”를 모토로 삼는다. 시간표의 물리적 성립 여부, 피로 누적 패턴, 날씨 악화 시 대안, 안전 마진을 집요하게 검증한다. 10시간 비행 직후의 솔로 운전, 5일차의 누적 피로, 금요일 오후 시드니 정체 같은 현실적 요소를 가장 중시한다.
해석 프레임:
- 각 날의 시간표가 물리적으로 가능한가 (이동시간, 영업시간, 일몰)
- 피로가 위험 수준으로 누적되지 않는가 (연속 장거리, 서카디안 리듬)
- 날씨 악화 시 전체 일정이 어떻게 되는가 (연쇄 붕괴 가능성)
- 예약 필수 항목이 확보 가능한가
- 안전 마진(버퍼)이 충분한가 (반납, 비행기)
- 여행자 프로필(체력, 운전 경험, 예산)에 부합하는가
채점 성향:
- 후하게: 매일 400km 이하, 야간 운전 최소, 우천 대안 구체적, 반납 3시간+ 버퍼
- 엄격하게: Day 1 882km 야간 3시간, 연속 빡센 날, Plan B 없음, 반납 1시간 버퍼
5. 평가 기준 (10개)
5.1 기준 정의
| # | 기준 | 정의 | 채점 앵커 |
|---|---|---|---|
| R1 | 동선 설계 | 왕복/중복 최소화, 자연스러운 흐름, 지역 간 이동 논리성 | 9-10: 완벽한 편도 루프 / 5-6: 일부 왕복 / 1-2: 같은 도로 반복 |
| R2 | 리듬 균형 | 빡센/여유 교차, 일일 운전거리 분포의 균일성, 피로 누적 관리 | 9-10: 완벽한 교차 / 5-6: 연속 2일 빡센 / 1-2: 매일 빡센 |
| R3 | 골든아워 활용 | 일출/일몰에 적합한 장소 배치, 방향(동/서) 고려, 타이밍 실현성 | 9-10: 3회+ 정확 배치 / 5-6: 1-2회 / 1-2: 골든아워 무시 |
| R4 | 경험 서사 | 기승전결 구성, 피크 배치(중반~후반), 엔딩 품질, 감정 곡선 | 9-10: 명확한 기승전결+Peak-End / 5-6: 피크 있으나 서사 약함 / 1-2: 평탄 |
| R5 | 경험 다양성 | 지형(해안/산/열대우림/사막), 활동 유형, 낮/야간, 도시/자연 교차 | 9-10: 5종+ 스펙트럼 / 5-6: 3종 / 1-2: 단일 유형 반복 |
| R6 | 명소 활용도 | 높은 등급 장소에 충분한 시간·최적 시간대 배정, 체류시간 적정성 | 9-10: 모든 S등급에 골든아워+1시간+ / 5-6: 일부 압축 / 1-2: S등급 30분 통과 |
| R7 | 유연성 | Plan B 유무, 날씨 대안, 일정 지연 시 흡수 여력, 교체 가능한 구조 | 9-10: 날짜별 대안 구체적 / 5-6: 일부만 / 1-2: 분단위 빡빡, 대안 없음 |
| R8 | 실행 안전성 | 야간 운전 최소화, 첫날/마지막날 마진, 피로 누적 한계 미달 | 9-10: 야간 0시간, 버퍼 5시간+ / 5-6: 야간 2시간, 버퍼 3시간 / 1-2: 야간 3시간+, 버퍼 1시간 |
| R9 | 프로필 적합도 | 여행자 체력/예산/운전경험/선호 스타일에 부합하는 정도 | 9-10: 프로필 완벽 부합 / 5-6: 일부 초과/미달 / 1-2: 프로필 무시 |
| R10 | 숙소 전략 | 연박 효율, 뷰 숙소의 클라이맥스 배치, 체크인/아웃과 일정 조화 | 9-10: 뷰 숙소+연박+피크 배치 / 5-6: 기본적 / 1-2: 매일 이동, 비효율 |
5.2 MECE 검증: 경계 영역 처리
| 경계 항목 | 주 담당 | 참조 | 이유 |
|---|---|---|---|
| 일일 이동 거리 | A’ (동선 설계) | C’ (실행 안전) | A’가 “동선이 효율적인가”, C’가 “실행 가능한가” |
| 골든아워 배치 | A’ (배치 효율) | B’ (감성 가치) | A’가 “타이밍이 맞는가”, B’가 “감동이 극대화되는가” |
| 숙소 | A’ (연박 효율) | B’ (뷰 숙소 감성) | A’가 “효율적인가”, B’가 “감동적인가” |
| 날씨 대안 | C’ (실행 리스크) | A’ (유연 설계) | C’가 “리스크가 관리되는가”, A’가 “대안이 설계에 내장되어 있는가” |
| 프로필 적합 | 3명 공통 (10%) | — | 모든 판단의 렌즈. 특정 페르소나에 독점시키지 않음 |
6. 가중치
6.1 페르소나별 가중치
| 기준 | 기본값 | A’ (루트 설계자) | B’ (경험 디자이너) | C’ (실행 검증자) | 3명 평균 |
|---|---|---|---|---|---|
| R1. 동선 설계 | 15% | 25% | 5% | 15% | 15.0% |
| R2. 리듬 균형 | 15% | 20% | 10% | 15% | 15.0% |
| R3. 골든아워 활용 | 5% | 5% | 10% | 0% | 5.0% |
| R4. 경험 서사 | 10% | 0% | 25% | 5% | 10.0% |
| R5. 경험 다양성 | 10% | 5% | 20% | 5% | 10.0% |
| R6. 명소 활용도 | 10% | 15% | 10% | 5% | 10.0% |
| R7. 유연성 | 10% | 10% | 5% | 15% | 10.0% |
| R8. 실행 안전성 | 10% | 5% | 0% | 25% | 10.0% |
| R9. 프로필 적합도 | 10% | 10% | 10% | 10% | 10.0% |
| R10. 숙소 전략 | 5% | 5% | 5% | 5% | 5.0% |
| 합계 | 100% | 100% | 100% | 100% | 100% |
6.2 가중치 설계 근거
A’ (루트 설계자): 동선(25%)+리듬(20%)+명소활용(15%) = 60%가 “설계의 구조적 품질”에 집중. 경험 서사(0%)는 B’에 전적으로 위임. 실행 안전(5%)은 C’에 맡기되 완전히 무시하지는 않음.
B’ (경험 디자이너): 서사(25%)+다양성(20%)+골든아워(10%) = 55%가 “경험의 질”에 집중. 동선(5%)과 실행(0%)은 A’/C’에 위임. 리듬(10%)은 “여유에서 나오는 감동”으로 연결되므로 일정 비중.
C’ (실행 검증자): 실행안전(25%)+유연성(15%)+동선(15%)+리듬(15%) = 70%가 “실제로 되는가”에 집중. 골든아워(0%)와 경험서사(5%)는 감성 영역으로 관심 최소.
6.3 제약 조건 검증
| 제약 | 결과 |
|---|---|
| 각 페르소나 합계 = 100% | 통과 (A’: 100%, B’: 100%, C’: 100%) |
| 3명 평균 = 기본 가중치 | 통과 (10개 기준 모두 정확히 일치) |
| 기본값 대비 ±25% 이내 | 통과 (최대 편차: A’ 동선 +10%, B’ 서사 +15%, C’ 안전 +15%) |
6.4 특수 사항
A’의 경험 서사 0%: A’는 “구조의 효율”에 집중하며, “그 구조가 감동을 주는가”는 B’의 영역. raw score는 기록하되 가중합에 미반영.
B’의 실행 안전성 0%: B’는 “경험의 질”에만 집중. “실행 가능한가”는 Gate에서 이미 검증되었으므로, Score 단계에서 B’가 다시 볼 필요 없음.
C’의 골든아워 활용 0%: 골든아워는 감성적 가치 판단. C’는 “그 시간에 도착이 물리적으로 가능한가”만 실행안전성(R8)에서 검증.
7. 관광지 평가(CRITIC.md) 기준과의 대응 관계
| 관광지 평가 기준 | → | 루트 평가 기준 | 변환 논리 |
|---|---|---|---|
| google_rating (15%) | → | R6. 명소 활용도 (10%) | “평점이 높은가”에서 “높은 장소를 잘 활용했는가”로 |
| review_count (10%) | → | 삭제 | 루트 수준에서 의미 없음 |
| scenery (20%) | → | R3 (5%) + R4 (10%) | “경치가 좋은가”에서 “경치를 언제, 어떤 맥락에서 보는가”로 |
| accessibility (15%) | → | R1 (15%) + R8 (10%) | 개별 접근성에서 전체 동선 논리+실행 안전으로 |
| value_for_money (10%) | → | R9 (10%) | 비용은 프로필 적합도의 일부로 흡수 |
| time_efficiency (10%) | → | R2 (15%) + R6 (10%) | 개별 체류시간에서 전체 리듬+명소 활용으로 |
| uniqueness (20%) | → | R5 (10%) + R4 (10%) | 개별 유니크함에서 전체 경험 스펙트럼+서사로 |
8. 채점 가이드라인
R4. 경험 서사 — 상세 가이드
Peak-End Rule(Kahneman) 적용:
| 점수 | B’ (주 담당) | A’ (참조) | C’ (참조) |
|---|---|---|---|
| 9-10 | 피크가 Day 4~5에 배치, 마지막 날에 여운 있는 피날레(해안 드라이브 등), 전체가 하나의 이야기 | (채점 안 함) | 피크/엔딩의 시간표가 실현 가능 |
| 7-8 | 피크 있으나 위치가 Day 2~3(초반), 엔딩은 괜찮음 | 대부분 실현 가능 | |
| 5-6 | 피크가 명확하지 않거나, 엔딩이 공항 직행으로 여운 없음 | ||
| 3-4 | 평탄한 경험의 나열, 감정 곡선 없음 | ||
| 1-2 | 피크가 첫날에 소진, 마지막 날이 피로의 절정 | 엔딩 자체가 실행 불가능 |
R2. 리듬 균형 — 상세 가이드
| 점수 | A’ (주 담당) | C’ (참조) |
|---|---|---|
| 9-10 | 빡센→여유→빡센 완벽 교차. 일일 거리 편차 CV < 30% | 연속 빡센 날 0일 |
| 7-8 | 대체로 교차하지만 1곳 연속 빡센 날 | 연속 빡센 2일이나 관리 가능 |
| 5-6 | 매일 비슷한 강도 (균일하지만 교차 없음) | 피로 누적 가능 |
| 3-4 | 연속 3일 빡센 or 연속 3일 여유 | 피로 누적 위험 |
| 1-2 | 매일 빡센 or 리듬 고려 없음 | 안전 위험 |
R8. 실행 안전성 — 상세 가이드
| 점수 | C’ (주 담당) |
|---|---|
| 9-10 | Day 1 야간 0시간, 전체 야간 합계 2시간 이하, 반납 5시간+ 버퍼 |
| 7-8 | Day 1 야간 1.5시간, 전체 야간 합계 3시간, 반납 3시간+ 버퍼 |
| 5-6 | Day 1 야간 2시간, 전체 야간 합계 4시간, 반납 2시간+ 버퍼 |
| 3-4 | Day 1 야간 2.5시간+, 전체 야간 합계 5시간+, 반납 1시간 버퍼 |
| 1-2 | Day 1 야간 3시간+, 연속 야간 운전, 반납 버퍼 부족 |
9. 출력 형식
Gate 결과
## Gate 검증 (Pass/Fail)
- [ ] 시간 실현성: 모든 Day의 이동시간 물리적 성립
- [ ] 영업시간 준수: 폐장 후 방문 계획 없음
- [ ] 렌터카 반납: 마감 대비 2시간+ 버퍼
- [ ] 안전 한계: 일일 운전 10시간 미초과
- [ ] 숙소 배정: 모든 숙박일 확인
→ 결과: Pass / Fail (사유: ...)
페르소나별 채점
### A' (루트 설계자): XX.X점
| 기준 | 가중치 | 점수 | 근거 |
|------|--------|------|------|
| R1. 동선 설계 | 25% | X/10 | ... |
| R2. 리듬 균형 | 20% | X/10 | ... |
| ... | ... | ... | ... |
10. 계절 반영 (5월 방문 기준)
루트 평가 시 5월 계절 보정 점수(may_adjusted_score)를 기준으로 명소의 가치를 판단한다. 관광지별 계절 보정은
CRITIC.md §8과data/scores/attraction_scored.json의seasonal_adjustment필드를 참조.
루트 평가에서의 계절 반영 포인트
| 기준 | 5월 계절 반영 사항 |
|---|---|
| R3. 골든아워 | 5월 일몰 17:00 — 16:00 이후 배치된 전망대는 골든아워 활용 가능. 일출 06:25 |
| R4. 경험 서사 | 5월 보정으로 승격된 장소(블로우홀 A등급, 그랜드캐니언 S등급)가 피크에 배치되었는가 |
| R5. 경험 다양성 | 겨울 스웰 파도, 고래 관찰, 가을 단풍 등 5월에만 가능한 경험이 포함되었는가 |
| R6. 명소 활용도 | 5월 보정 후 S등급(6곳) 기준으로 평가. 그랜드캐니언 트랙(A→S), 카툼바 폭포(A→S) 반영 |
| R7. 유연성 | 5월 안개(블루마운틴), 비포장도로 상태(Lithgow) 등 계절적 리스크에 대한 대안 |
| R8. 실행 안전성 | 5월 일몰 17:00 이후 야간 운전 시간 계산, 캥거루 사고 5월 32% 증가 반영 |
5월 보정 후 S등급 (루트 배치 평가 기준)
| 순위 | 장소 | 기존 점수 | 5월 보정 | 보정 이유 |
|---|---|---|---|---|
| 1 | 케이프 바이런 등대 | 85.5 | 90.5 | 고래 시즌 + 비수기 |
| 2 | 룩앳미나우 | 85.3 | 88.3 | 고래 + 쾌적 |
| 3 | 뉴캐슬 메모리얼 | 85.0 | 87.0 | 맑은 하늘 |
| 4 | 그랜드 캐니언 트랙 | 81.3 | 86.3 | 하이킹 최적 + 이끼 절정 (A→S) |
| 5 | 그랜드 퍼시픽 드라이브 | 82.3 | 85.3 | 겨울 스웰 + 고래 |
| 6 | 카툼바 폭포 | 80.3 | 85.3 | 야간 조명 + 서늘한 분위기 (A→S) |
11. 적용 범위
- Phase 4 (일정 생성): 루트 후보를 비교·평가할 때 이 프레임워크 사용
- 관광지 평가: 여전히 CRITIC.md 사용 (이 문서는 관광지 평가에 적용하지 않음)
참고 문헌: TripScore(arXiv 2025), TravelAgent(arXiv 2024), TravelPlanner(ICML 2024), Peak-End Rule(Kahneman & Fredrickson), Multi-persona Argument Assessment(ACL 2025) 이 문서의 위치:
docs/CRITIC_ROUTE.md관련 문서: CRITIC.md (관광지 평가), TRAVELER_PROFILE.md (여행자 프로필), SPEC.md (기술 설계)