yido
- yido -> 세종대왕 본명
- 한국어 자연어 처리 프로젝트
- jdk 1.8
- 상세 문서 페이지
modules
splitter (문단 문장 구분기)
- 문단구분과 문장구분등에 사용 됨
- 구분기는 이전 룰베이스 방식의 구분기가 성능이 좋은것을 확인함
- 구분 데이터 정확도와 구분속도 등 모두 우수한 성능을 나타냄
- 이전 방식을 관리방안이 쉽게 더 잘구성하여 관리하는 프로젝트로 진행함
- 이전에는 문장 구분기 였는데 구분기로 잡아서 문단 구분에도 활용할 수 있게 함
tokenizer
문서 및 연구 내역
모듈 설명 및 소스
text-mining
- text mining 방법의 클래스 제공
신조어
오탈자교정
전처리기
- 전반각
- 개인정보 처리 (삭제, 블라인드)
- 특수문자 변환
STT 한글형 기호
- 날짜 ( 7일전 1시간 등, 한글형 날짜)
- 한글형 금액
- 한글형 자동차번호
communication
blog, homepage
slack
- moaara.slack.com
- wigoailab.slack.com
main developer
-
macle
-
wjrmffldrhrl