Machine Learning

(작성중) 네이버 지식그래프 Deview 정리

marsjin97 2022. 7. 6. 00:02

지식그래프의 특징과 네이버에서의 활용

  • 지식그래프는 데이터의 출처에 상관없이 의미단위의 엔티티로 구성되어, Semantic(의미) 특성을 가지게됨
  • 네이버에선 지식베이스로 검색결과를 보여줄 때, 그래프 구조로 엮어있는 지식그래프 상에서 엔티티를 찾고, 엔티티와 연결된 정보를 사용자에게 제공하고 있음

지식그래프의 활용

  • [검색] QA, 추천 서비스
  • [금융] 사람 엔티티가 여러개의 신용카드를 발급받는 경우와 같은 신용 사기 탐지
  • [금융] 회사나 조직에서의 관계 그래프를 참고하여 진행하는 신용 등급 평가 
  • [금융] 생산에 필요한 원재료의 공급이나 수요 간의 관계를 파악하여 사회 문제(ex.코로나) 발생 시 영향력 평가
  • [의학] 질병 확진자의 감염경로 파악
  • [커머스] 상품 추천 (ex. 아마존의 쇼핑 상품 그래프)
  • [소셜 미디어] 사용자들이 생성하는 정보에 대한 팩트 체크
  • [소셜 미디어] 사용자들이 어떤 네트워크를 통해 정보가 전파 양상 확인
  • [소셜 미디어] 각종 이슈 모니터링

지식그래프 연구 

  • 자연어 질의의 의미를 이해하기 위해서 활용, 이런 관계를 시각화하여 인사이트를 얻을 수도 있음
  • GPT와 같은 언어모델에서 사실이나 지식에 기반한 답안을 생성할 수 있도록 연구
  • 지식그래프 자체를 임베딩에 활용하여 사용할 수 있도록 연구
  • 사용자 질의에 대해 임베딩 공간에서 Geometric Operation을 시도하여 답을 생성할 수 있도록 연구

네이버 지식그래프의 구성 블록

  • 지식그래프 빌딩 블록 - 원본 데이터로부터 지식그래프를 생성
    • 데이터 처리 : 수집 및 콘텐츠 서비스에 제공받은 데이터 처리 및 가공
    • 온톨로지 : 관계를 정의해놓은 상태에서, 실제 데이터에 이러한 관계들이 존재하는지 탐색 및 검증
      • ex) 자녀, 부모 등의 관계를 온톨로지에 정의하고, 인물 데이터에서 관계를 탐색
      • 관계 추론 활용, 새로운 개념에 대해 구축 및 확장도 진행
    • 엔티티 추출 : 정형화된 또는 비정형화된 텍스트 데이터로부터 엔티티를 추출 
  • 지식그래프 모델링 블록 - 생성한 지식그래프에서 새로운 부가가치를 생성
  • 지식그래프 서빙 블록 - 완성된 그래프를 네이버 대용량 트래픽에 대응하여 사용자에게 제공

지식그래프 빌딩의 하위 구성요소