시맨틱 검색
시맨틱 검색은 의미를 기반으로 한 검색을 뜻하며, 검색 엔진이 질의어의 전체적인 의미를 이해하지 않고 질의어 또는 그 변형의 문자 그대로의 일치를 찾는 어휘 검색과 구별된다.[^5] 시맨틱 검색은 웹이든 폐쇄형 시스템이든 검색 가능한 데이터 공간에서 검색자의 의도와 용어의 문맥적 의미를 이해하여 검색 정확도를 높이고 더 관련성 높은 결과를 생성하고자 하는 정보 검색 접근 방식이다. 현대의 시맨틱 검색 시스템은 단어, 구문 또는 문서를 수치 벡터로 표현하기 위해 벡터 임베딩을 사용하는 경우가 많으며, 이를 통해 검색 엔진이 정확한 키워드 일치가 아닌 의미에 기반한 유사성을 측정할 수 있다.[^6][^7]
일부 저자들은 시맨틱 검색을 시맨틱 웹에서 발견되는 온톨로지 및 XML과 같은 풍부하게 구조화된 데이터 소스에서 지식을 검색하기 위한 기술의 집합으로 간주한다.[^8] 이러한 기술은 높은 수준의 표현력으로 도메인 지식을 형식적으로 표현할 수 있게 하며, 사용자가 질의 시 자신의 의도를 더 상세하게 지정할 수 있도록 한다.[^9] 이러한 표현은 질의와 관련된 특정 장소, 인물 또는 개념을 포함함으로써 콘텐츠의 관련성과 깊이를 향상시킨다.
모델 및 도구
구글의 지식 그래프와 같은 도구는 질의 해석을 풍부하게 하기 위해 개체 간의 구조화된 관계를 제공한다.[^1]
BERT 및 Sentence-BERT와 같은 모델은 단어나 문장을 유사성 비교를 위한 밀집 벡터로 변환한다.[^2]
웹 온톨로지 언어, 자원 기술 프레임워크, Schema.org와 같은 시맨틱 온톨로지는 개념과 관계를 체계화하여 시스템이 관련 용어와 더 깊은 의미를 추론할 수 있게 한다.[^3]
하이브리드 검색 모델은 최적의 성능을 위해 어휘 검색(예: BM25)과 사전 학습된 트랜스포머 모델을 사용한 시맨틱 순위화를 결합한다.[^4]
같이 보기
*검색 엔진 목록 *시맨틱 웹 *시맨틱 통합 *자원 기술 프레임워크 *자연어 검색 엔진 *시맨틱 질의 *벡터 데이터베이스 *단어 임베딩
외부 링크
de:Semantische Suche
참고 문헌
[^1]: Singhal, A. (2012). 지식 그래프 소개: 문자열이 아닌 사물. Google Blog. https://blog.google/products/search/introducing-knowledge-graph-things-not/
[^2]: Reimers, N., & Gurevych, I. (2019). Sentence-BERT: 샴 BERT 네트워크를 이용한 문장 임베딩. ''EMNLP 2019''. https://arxiv.org/abs/1908.10084
[^3]: Bodenreider, O. (2004). 통합 의학 언어 체계(UMLS): 생의학 용어 통합. ''Nucleic Acids Research'', 32(suppl_1), D267–D270.
[^4]: Lin, J., et al. (2021). 텍스트 순위화를 위한 사전 학습된 트랜스포머: BERT와 그 너머. https://arxiv.org/abs/2010.06467
[^5]: Bast, Hannah. https://www.nowpublishers.com/article/Details/INR-032. (2016)
[^6]: Klampanos, Iraklis A.. Manning Christopher, Prabhakar Raghavan, Hinrich Schütze: 정보 검색 입문. (2009-06-02)
[^7]: Kim, Bosung. 사전 학습된 언어 모델을 이용한 지식 그래프 완성을 위한 다중 작업 학습. International Committee on Computational Linguistics. (2020)
[^8]: Dong, Hai. 시맨틱 검색 기술 조사. IEEE. (2008)
[^9]: Ruotsalo, T.. 시맨틱 웹: 연구와 응용. (May 2012)
관련 인사이트

디지털 트윈, 당신 공장엔 이미 있다 — 엑셀과 MES 사이 어딘가에
디지털 트윈은 10억짜리 3D 시뮬레이션이 아니다. 지금 쓰고 있는 엑셀에 좋은 질문 하나를 더하는 것 — 두 전문가가 중소 제조기업이 이미 가진 데이터로 예측하는 공장을 만드는 현실적 로드맵을 제시한다.

공장의 뇌는 어떻게 생겼는가 — 제조운영 AI 아키텍처 해부
지식관리, 업무자동화, 의사결정지원 — 따로 보면 다 있던 것들입니다. 제조 AI의 진짜 차이는 이 셋이 순환하면서 '우리 공장만의 지능'을 만든다는 데 있습니다.

그 30분을 18년 동안 매일 반복했습니다 — 품질팀장이 본 AI Agent
18년차 품질팀장이 매일 아침 30분씩 반복하던 데이터 분석을 AI Agent가 3분 만에 해냈습니다. 챗봇과는 완전히 다른 물건 — 직접 시스템에 접근해서 데이터를 꺼내고 분석하는 AI의 현장 도입기.