LG U+ · AX사업부문
삼천리 AICC 화자분리 이슈 정리
← 분석 허브
삼천리 AICC 프로젝트

콜 데이터 STT 전사 & VOC 분석
화자분리 이슈 핵심 정리

삼천리 IPCC 재구축 전 AICC 도입 명분 확보를 위한 STT 성능 비교 평가 및 화자분리(TX/RX) 미분리 이슈 대응 현황

60만건
1차 인바운드
30만건
2차 아웃바운드
3사
비교 평가
2026.10
IPCC 만기

삼천리 IPCC 재구축 — AICC 도입 검증

  • 목적: 삼천리 IPCC(2026.10 만기) 재구축 전, AICC 도입 명분 확보를 위한 콜 데이터 STT 전사 + VOC 분석
  • 비교 평가: LG유플러스 브리지텍 ECS텔레콤 3사 동일 데이터로 STT 성능(CER) 비교
  • 분석 범위: 1차 인바운드 60만건(작년3월+올해3월), 2차 아웃바운드 30만건

End-to-End 파이프라인

샘플 50~100건 수령
도메인 학습 (200~300시간)
60만건 STT 전사
비식별 처리
VOC 분류
전년비교 애널리틱스

타임라인 & 리스크

  • 3/1 착수 예정이었으나 20일 지연 상태
  • 도메인학습 2~3주 + 전사/VOC분류 ~2개월 → 결과 도출 6월경
  • IPCC 만기 10월까지 RFP 발행 + 사업 착수 필요 → 일정 촉박

화자분리 (TX/RX 미분리)

Critical — 60만건 전체 영향

녹취 파일이 모노(mono) 형식으로, 상담원+고객 음성이 혼합된 상태. TX/RX 미분리 시 말 겹침(overlap)으로 CER 하락이 불가피.

현황

항목상태
녹취 형식 모노(mono) — 상담원+고객 음성 혼합
대상 60만건 음성 파일 전체
원인 그동안 화자분리 필요성을 느끼지 못해 관리 안 함

왜 문제인가

  • TX/RX 미분리 시 말 겹침(overlap)으로 CER 하락 (LG유플러스 CTO 의견)
  • STT 전사 전에 화자분리 중간 단계가 반드시 선행되어야 함
  • 인소싱스쿼드, 화자분리 솔루션 도입 검토중 (해당 솔루션으로 화자분리 가능여부 검토필요)

현재 대응 방안

방안상세상태
샘플 단계 50건은 화자분리 없이 진행 가능 즉시 가능
LG유플러스 솔루션 2인 화자까지 분리 가능한 솔루션 보유 → CTO 확인 필요 양준모 → CTO 협의 대기
과거 데이터 확인 2년 전 작업 시 화자분리된 데이터가 남아있을 가능성 삼천리 IT 담당 확인 중
향후 RFP 반영 IPCC 재구축 RFP에 화자분리 요건 필수 포함 계획

해결을 위한 Action Items

1
LG유플러스 CTO: 60만건 규모 화자분리 처리 가능 여부, 소요 시간, 비용
2
삼천리 IT: 2년 전 화자분리 데이터 존재 여부 (있으면 분리 작업 생략 가능)
3
추가 비용/일정 영향: 화자분리 중간 단계 추가 시 전체 일정에 미치는 영향 산정
4
3사 비교 조건: 화자분리 후 데이터를 3사에 동일하게 제공할지, 각 사가 자체 분리할지 기준 정립