프로젝트 개요
삼천리 IPCC 재구축 — AICC 도입 검증
- 목적: 삼천리 IPCC(2026.10 만기) 재구축 전, AICC 도입 명분 확보를 위한 콜 데이터 STT 전사 + VOC 분석
- 비교 평가: LG유플러스 브리지텍 ECS텔레콤 3사 동일 데이터로 STT 성능(CER) 비교
- 분석 범위: 1차 인바운드 60만건(작년3월+올해3월), 2차 아웃바운드 30만건
과업 흐름
End-to-End 파이프라인
샘플 50~100건 수령
→
도메인 학습 (200~300시간)
→
60만건 STT 전사
→
비식별 처리
→
VOC 분류
→
전년비교 애널리틱스
일정 현황
타임라인 & 리스크
- 3/1 착수 예정이었으나 20일 지연 상태
- 도메인학습 2~3주 + 전사/VOC분류 ~2개월 → 결과 도출 6월경
- IPCC 만기 10월까지 RFP 발행 + 사업 착수 필요 → 일정 촉박
핵심 이슈
화자분리 (TX/RX 미분리)
현황
| 항목 | 상태 |
|---|---|
| 녹취 형식 | 모노(mono) — 상담원+고객 음성 혼합 |
| 대상 | 60만건 음성 파일 전체 |
| 원인 | 그동안 화자분리 필요성을 느끼지 못해 관리 안 함 |
왜 문제인가
- TX/RX 미분리 시 말 겹침(overlap)으로 CER 하락 (LG유플러스 CTO 의견)
- STT 전사 전에 화자분리 중간 단계가 반드시 선행되어야 함
- 인소싱스쿼드, 화자분리 솔루션 도입 검토중 (해당 솔루션으로 화자분리 가능여부 검토필요)
대응 방안
현재 대응 방안
| 방안 | 상세 | 상태 |
|---|---|---|
| 샘플 단계 | 50건은 화자분리 없이 진행 가능 | 즉시 가능 |
| LG유플러스 솔루션 | 2인 화자까지 분리 가능한 솔루션 보유 → CTO 확인 필요 | 양준모 → CTO 협의 대기 |
| 과거 데이터 확인 | 2년 전 작업 시 화자분리된 데이터가 남아있을 가능성 | 삼천리 IT 담당 확인 중 |
| 향후 RFP 반영 | IPCC 재구축 RFP에 화자분리 요건 필수 포함 | 계획 |
확인 필요 사항
해결을 위한 Action Items
1
LG유플러스 CTO: 60만건 규모 화자분리 처리 가능 여부, 소요 시간, 비용
2
삼천리 IT: 2년 전 화자분리 데이터 존재 여부 (있으면 분리 작업 생략 가능)
3
추가 비용/일정 영향: 화자분리 중간 단계 추가 시 전체 일정에 미치는 영향 산정
4
3사 비교 조건: 화자분리 후 데이터를 3사에 동일하게 제공할지, 각 사가 자체 분리할지 기준 정립