Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그
검색엔진의 Analyzer, 형태소분석기 ≠ 토크나이저 섬네일

검색엔진의 Analyzer, 형태소분석기 ≠ 토크나이저

요기요 favicon요기요·Backend·
ElasticsearchMeCabKoTokenizerMorphological AnalysisTokenizerAnalyzer
2024년 05월 27일2

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

요기요의 Search Platform 팀은 Analyzer의 작동 원리와 형태소분석기/토크나이저의 차이를 설명하는 기술 글을 공개했습니다.

주요 특징

  • Character Filtering으로 문자 정규화 및 필요 패턴 제거를 적용
  • MeCabKoTokenizer 기반의 형태소 분석-어절 형성-토큰화의 3단계 처리
  • 동의어, Shingle, N-gram, Stop 필터를 순차 적용하는 Token-Filtering
  • 예시 키워드 '찜하다'에 대해 커스텀 토큰 구성을 적용해 정확도를 높임

적용 고려사항

  • 오픈소스 MeCabKoTokenizer 활용 및 Elasticsearch 레퍼런스 참조 필요
  • 토큰 필터의 순서 및 커스텀 토큰 구성 조정이 검색 품질에 큰 영향
  • 동의어 관리 정책 수립 및 운영 필요

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
요기요 검색에서 형태소 분석기의 한계와 극복 섬네일
82%

요기요 검색에서 형태소 분석기의 한계와 극복

요기요 favicon요기요·2024년 07월 21일
“검색으로 연결되는 재능” — 크몽 검색은 어떻게 동작할까요? 섬네일
71%

“검색으로 연결되는 재능” — 크몽 검색은 어떻게 동작할까요?

크몽 favicon크몽·2025년 08월 02일
Opensearch 검색엔진을 이용한 네이버 페이 검색 하기 섬네일
67%

Opensearch 검색엔진을 이용한 네이버 페이 검색 하기

Naver Pay faviconNaver Pay·2025년 06월 02일