시맨틱 검색

최종 수정 2026.03.25

시맨틱 검색은 의미를 기반으로 한 검색을 뜻하며, 검색 엔진이 질의어의 전체적인 의미를 이해하지 않고 질의어 또는 그 변형의 문자 그대로의 일치를 찾는 어휘 검색과 구별된다.[^5] 시맨틱 검색은 웹이든 폐쇄형 시스템이든 검색 가능한 데이터 공간에서 검색자의 의도와 용어의 문맥적 의미를 이해하여 검색 정확도를 높이고 더 관련성 높은 결과를 생성하고자 하는 정보 검색 접근 방식이다. 현대의 시맨틱 검색 시스템은 단어, 구문 또는 문서를 수치 벡터로 표현하기 위해 벡터 임베딩을 사용하는 경우가 많으며, 이를 통해 검색 엔진이 정확한 키워드 일치가 아닌 의미에 기반한 유사성을 측정할 수 있다.[^6][^7]

일부 저자들은 시맨틱 검색을 시맨틱 웹에서 발견되는 온톨로지 및 XML과 같은 풍부하게 구조화된 데이터 소스에서 지식을 검색하기 위한 기술의 집합으로 간주한다.[^8] 이러한 기술은 높은 수준의 표현력으로 도메인 지식을 형식적으로 표현할 수 있게 하며, 사용자가 질의 시 자신의 의도를 더 상세하게 지정할 수 있도록 한다.[^9] 이러한 표현은 질의와 관련된 특정 장소, 인물 또는 개념을 포함함으로써 콘텐츠의 관련성과 깊이를 향상시킨다.

모델 및 도구

구글의 지식 그래프와 같은 도구는 질의 해석을 풍부하게 하기 위해 개체 간의 구조화된 관계를 제공한다.[^1]

BERT 및 Sentence-BERT와 같은 모델은 단어나 문장을 유사성 비교를 위한 밀집 벡터로 변환한다.[^2]

웹 온톨로지 언어, 자원 기술 프레임워크, Schema.org와 같은 시맨틱 온톨로지는 개념과 관계를 체계화하여 시스템이 관련 용어와 더 깊은 의미를 추론할 수 있게 한다.[^3]

하이브리드 검색 모델은 최적의 성능을 위해 어휘 검색(예: BM25)과 사전 학습된 트랜스포머 모델을 사용한 시맨틱 순위화를 결합한다.[^4]

같이 보기

*검색 엔진 목록 *시맨틱 웹 *시맨틱 통합 *자원 기술 프레임워크 *자연어 검색 엔진 *시맨틱 질의 *벡터 데이터베이스 *단어 임베딩

외부 링크

de:Semantische Suche


참고 문헌

[^1]: Singhal, A. (2012). 지식 그래프 소개: 문자열이 아닌 사물. Google Blog. https://blog.google/products/search/introducing-knowledge-graph-things-not/

[^2]: Reimers, N., & Gurevych, I. (2019). Sentence-BERT: 샴 BERT 네트워크를 이용한 문장 임베딩. ''EMNLP 2019''. https://arxiv.org/abs/1908.10084

[^3]: Bodenreider, O. (2004). 통합 의학 언어 체계(UMLS): 생의학 용어 통합. ''Nucleic Acids Research'', 32(suppl_1), D267–D270.

[^4]: Lin, J., et al. (2021). 텍스트 순위화를 위한 사전 학습된 트랜스포머: BERT와 그 너머. https://arxiv.org/abs/2010.06467

[^5]: Bast, Hannah. https://www.nowpublishers.com/article/Details/INR-032. (2016)

[^6]: Klampanos, Iraklis A.. Manning Christopher, Prabhakar Raghavan, Hinrich Schütze: 정보 검색 입문. (2009-06-02)

[^7]: Kim, Bosung. 사전 학습된 언어 모델을 이용한 지식 그래프 완성을 위한 다중 작업 학습. International Committee on Computational Linguistics. (2020)

[^8]: Dong, Hai. 시맨틱 검색 기술 조사. IEEE. (2008)

[^9]: Ruotsalo, T.. 시맨틱 웹: 연구와 응용. (May 2012)