Overview
WISE TEA V2 텍스트 마이닝 솔루션
-
문서별 주제를 부여하는
텍스트마이닝 솔루션 ! -
WISE TEA V2는 WISE TEA V2는 비정형 텍스트 테이터에 대한 마이닝을 통해 각 문서별 주제(Topic)를 부여하는 ‘텍스트 마이닝 솔루션’ 입니다.
- 각종 기관/기업 내부 시스템 속 비정형 텍스트 데이터를 대상으로 데이터
마이닝, 클러스터 분석 등 다양한 방법론을 통해 주제(Topic)를 추출 - 검색 사용자와 정보 간 관계를 분석한 결과를 검색엔진과 연동
- 검색 사용자의 의사결정을 위한 혁신적인 검색 환경을 제공
- 각종 기관/기업 내부 시스템 속 비정형 텍스트 데이터를 대상으로 데이터
core technology
- 키워드 및
주제 분석 기술 -
입력된 문서에서 키워드 및 주제를 추출하기 위해 자사에서
응용개발한 알고리즘으로 분석을 수행합니다. 주제어 추출, 문서
군집, 군집 별 주제 분석을 수행하고 주제 간의 연관 관계와 시계열
분석을 수행합니다.
- 분석 결과
시각화 및 관리 -
키워드 및 주제의 분석 결과를 다양한 시각화 그래프를 통해
확인하고, 분석의 품질을 향상시키기 위해 사전 관리 및 분석 설정을
수행합니다
- 키워드 분석 결과를 통한
색인 연동 기술 -
자사 제품인 Search Formula-1의 단어 색인 품질 향상을 위해 TEA
에서 키워드를 추출하고 Search Formula-1과 소켓통신 방식의
연동 색인을 수행합니다. 연동 색인을 통해 TEA의 키워드 및 주제
등을 검색 결과로 나타낼 수 있습니다.
- HTTP 통신 및
DB 이중화 기능 -
HTTP 통신을 통해 TEA의 키워드 및 주제 분석 기능을 수행할 수
있으며, 배치 분석 결과를 저장할 때 DB 이중화를 통해 분석 오류가
났을 시 정보가 손실되지 않도록 관리 합니다.
system diagram
WISE TEA V2는 외부 요청에 대한 처리와 분석 처리를 별도의 서버모듈로 분리하여 안정적인 아키텍처를 구성하였으며,
분석된 데이터를 별도의 특화된 저장소에 저장하도록 구성되어 있습니다.
main function
-
-
주제 마이닝
(Topic Mining) -
주어진 문서에서 주제어(Keyword)를 추출
주제어(Keyword)를 통한 주제(Topic) 생성
생성된 주제(Topic)에 대한 자동 주제 이름
생성(Topic Labeling)
-
-
-
주제 관리
-
자동 생성된 주제 이름(Topic)에 대한 관리
주제(Topic)에 포함된 주제어(Keyword)에 대한 관리
주제 마이닝(Topic Mining)을 위한 사전 관리 (우선 적용 주제어/
공통 제외 주제어)
-
-
-
분석
(Analysis) -
맞춤 필드 분석(Custom Field Analysis)를 통해 주제(Topic)와
다양한 필드에 대한 분석맞춤 필드(Custom Field) 설정에 따라 아래와 같은 다양한
분석이 가능주제(Topic)에 대한 관계 분석
특정 주제(Topic)에 대한 시계열 분석
주제(Topic)을 기반으로 한 조직별 관계 분석
주제(Topic)을 기반으로 한 작성자(Author) 관계 분석
조직별 문서 생산량에 대한 시계열 분석
시스템 별(Collection) 문서 분포 분석
직급별 문서 분포 분석
-
-
-
관리도구 (Administrative Tool)
-
손쉬운 사용의 Web 기반 관리도구 제공
WISE TEA V2 서버 모니터링
주제 관리 기능 → 주제(Topic), 주제어(Keyword), 사전 관리
편리한 주제 관리를 위한 가져오기/내보내기 기능
주제(Topic) 분석 결과
주제(Topic) 연관도
3개월/6개월/1년 단위 주제 클라우드(Topic Cloud)
최근 1년간 월별 특정 주제(Topic)에 대한 트랜드(Trend)
관리도구 사용자 관리
-
-
-
기타
-
설치 인스톨러 제공
WISE TEA V2 단독 솔루션으로 개발API를 통해 입력되어진
텍스트에 대한 주제(Topic), 주제어(Keyword)정보 제공 및
맞춤 필드 분석(Custom Field Analysis) 지원
-
-
-
SF-1 연동
-
아래와 같은 추가 검색 결과 요소를 다양한 시각화(Visualization) 기법으로 표현
검색 결과의 주제 클러스트링(Topic Clustering)
검색 결과의 특정 주제(Topic)에 대한 전문가
검색 결과 문서 작성자들 간의 대한 인물 관계
검색 결과 문서의 주제(Topic)들의 최근 1년의 트랜드(Trand)
입력된 검색어(Query)와 연관된 주제어(Keyword)
기본 시각화 컴포넌트 제공 (Javascript 기반)
색인기(Indexer)를 통한 WISE TEA V2와 손쉬운 연동 (SF-1 V5)
색인 과정 시 자동으로 WISE TEA V2와 연동하여 색인 문서에 대한 주제(Topic), 주제어(Keyword) 정보 연동
동적 색인 시 추가 문서에 대한 맞춤 필드(Custom Field) 정보를 WISE TEA V2에 자동으로 제공하여 실시간 맞춤 필드 분석(Custom Field Analysis) 지원
-
REFERENCE
고객사 | 구축연도 | 프로젝트 내용 | ||
---|---|---|---|---|
2021 |
|
|||
2021 |
|
|||
2020 |
|
|||
2020 |
|
|||
2020 |
|
|||
2020 |
|
|||
2020 |
|
|||
2020 |
|