SEARCH_PRJ
검색 질의어 분석엔진 개발
Search And BigData
본문
추진배경
- 다양한 검색 질의어에 대한 도메인별 질의어 분석이 어려움.
- 질의어 분석이 잘못될 경우 잘못된 검색 결과 도출
- 질의어에 대한 분석이 잘못되어 검색이 될 경우 고객 VOC 발생할 수 있음
- 검색 결과 품질에 대한 고도화
- 입력되는 질의어에 대한 도메인별 질의어 분석
추진방향
- 도메인별 어휘에 대한 질의 분석용 학습모델 사전 구축
- 질의어 term 별 의미 분석
- 질의어 단순 검색이 아닌 의미 분석을 통한 필터 검색이 가능해 짐
- 질의 시 질의를 의미검색용 질의유형으로 분류하고, 질의유형별 엔진질의식 생성
- 색인 시 의미검색을 위한 TERM분리 결과 생성 및 색인어 추가
- 검색 프로세스에 의미분석을 적용하여 검색 풀질의 향상됨
추진목표
- 검색 색인 프로세스 개선
- 검색 질의 프로세스 개선
- 질의어 의미 분석을 통한 검색 품질의 향상
- 검색 품질의 향상으로 고객 VOC를 줄임
- 검색품질의 향상으로 고객 만족도 증가
사전에 개채명 태깅으로 훈련된 학습모델을 이용하여 질의어의 개체명을 정확하게 인식하여 자동을 케테고리 분류 부스팅(boosting)을 해 줌으로써 사용자의 의도를 보다 정확하게 반영한 검색을 수행해 주게 된다.
색인 시점에 자동으로 개체명 필드를 생성해 준다.
Solr의 SearchHandler 를 Wrapping 하여 개체명 인식기를 이용한 질의어 분석 프로세스를 처리해 준다. 질의어에서 인식된 개체명은 자동으로 개체명의 해당 필드를 부스팅 해 준다