Machine Learning
(작성중) 네이버 지식그래프 Deview 정리
marsjin97
2022. 7. 6. 00:02
지식그래프의 특징과 네이버에서의 활용
- 지식그래프는 데이터의 출처에 상관없이 의미단위의 엔티티로 구성되어, Semantic(의미) 특성을 가지게됨
- 네이버에선 지식베이스로 검색결과를 보여줄 때, 그래프 구조로 엮어있는 지식그래프 상에서 엔티티를 찾고, 엔티티와 연결된 정보를 사용자에게 제공하고 있음
지식그래프의 활용
- [검색] QA, 추천 서비스
- [금융] 사람 엔티티가 여러개의 신용카드를 발급받는 경우와 같은 신용 사기 탐지
- [금융] 회사나 조직에서의 관계 그래프를 참고하여 진행하는 신용 등급 평가
- [금융] 생산에 필요한 원재료의 공급이나 수요 간의 관계를 파악하여 사회 문제(ex.코로나) 발생 시 영향력 평가
- [의학] 질병 확진자의 감염경로 파악
- [커머스] 상품 추천 (ex. 아마존의 쇼핑 상품 그래프)
- [소셜 미디어] 사용자들이 생성하는 정보에 대한 팩트 체크
- [소셜 미디어] 사용자들이 어떤 네트워크를 통해 정보가 전파 양상 확인
- [소셜 미디어] 각종 이슈 모니터링
지식그래프 연구
- 자연어 질의의 의미를 이해하기 위해서 활용, 이런 관계를 시각화하여 인사이트를 얻을 수도 있음
- GPT와 같은 언어모델에서 사실이나 지식에 기반한 답안을 생성할 수 있도록 연구
- 지식그래프 자체를 임베딩에 활용하여 사용할 수 있도록 연구
- 사용자 질의에 대해 임베딩 공간에서 Geometric Operation을 시도하여 답을 생성할 수 있도록 연구
네이버 지식그래프의 구성 블록
- 지식그래프 빌딩 블록 - 원본 데이터로부터 지식그래프를 생성
- 데이터 처리 : 수집 및 콘텐츠 서비스에 제공받은 데이터 처리 및 가공
- 온톨로지 : 관계를 정의해놓은 상태에서, 실제 데이터에 이러한 관계들이 존재하는지 탐색 및 검증
- ex) 자녀, 부모 등의 관계를 온톨로지에 정의하고, 인물 데이터에서 관계를 탐색
- 관계 추론 활용, 새로운 개념에 대해 구축 및 확장도 진행
- 엔티티 추출 : 정형화된 또는 비정형화된 텍스트 데이터로부터 엔티티를 추출
- 지식그래프 모델링 블록 - 생성한 지식그래프에서 새로운 부가가치를 생성
- 지
- 지식그래프 서빙 블록 - 완성된 그래프를 네이버 대용량 트래픽에 대응하여 사용자에게 제공
지식그래프 빌딩의 하위 구성요소