22대 양자대결 백테스트 MAE —pp · 게이트 ≤ 2.0pp
패널이 22대 결과로 raking 되었음에도 시뮬 양자대결 예측이 게이트를 넘는 이유: 효용함수 학습이 단순화된 grid-search라서 인구 marginal보다 후보 효용 추정에 오차가 누적됨. 본 보선용 파라미터는 grid best 채택하되, 정합도 검증 metric으로 노출.
21대 대선 부산 북구 백테스트 MAE —pp · 게이트 ≤ 3.0pp
2022년 시점 패널을 2026년 데이터로 빌드한 한계. 정성적으로 보수 우세는 재현되나 양자단순화 정확도는 부족. 트렌드 자체보다 패널의 이념 분포가 적정한지 검증하는 보조 metric.
19건 폴 가중평균에 House Effects 미보정
τ=14일 단순 지수감쇠만 적용. 기관별 바이어스(예: 특정 ARS 회사가 보수 share를 과대표집)는 보정하지 않음.
LLM 비결정성·Cutoff 한계
시사 What-if는 Perplexity로 사실관계 검색 후 5축 척도로 변환하여 결정론으로 만들었으나, Claude의 자유텍스트 응답 분류는 여전히 분포 수준 재현만 보장 (정확한 동일 응답 X). KL 1만 vs 10만회 측정은 후속 작업.
패널 1,781명의 표본 크기 한계
v2 부산 북구 3,562명을 8동 비례 배분한 결과. 일부 셀(예: 70세이상 × 만덕2동 × 진보)은 N이 10명 미만일 수 있음.