[머신러닝] 데이터 마이닝 툴 - WEKA
류명운
·2016. 9. 19. 17:58
[머신러닝] 데이터 마이닝 툴 - WEKA
웨카(Weka, Waikato Environment for Knowledge Acquisition)
뉴질랜드의 와이카토대학교(University of Waikato)에서 자바로 만든 머신 러닝과 데이터 마이닝 툴킷이다. 워크벤치(workbench) 프로그램이나 명령줄 도구를 이용하여 학습과 시각화 도구를 제공한다. JDBC 드라이버로 기존 데이터 소스에서 데이터를 가져올 수 있다. 웨카를 통해 수행 가능한 작업은 다음과 같다.
- 데이터 전처리(Preprocessing data)
- 클러스터링(Clustering)
- 분류(Classification)
- 회귀 분석(Regression)
- 연관 규칙(Association rules)
웨카는 널리 사용되며, 현재는 하둡과 연결하여 빅데이터에 접근하는 것을 지원한다.
* 웨카 설치 : http://www.cs.waikato.ac.nz/ml/weka/downloading.html
* 자바를 다른 컴파일 언어와 구분 짓는 것이 가장 큰 특징
* 웨카 프로그램에서 사용하는 파일 형식 : ARFF(Attribute-Relation File Format)
* 자바가 설치되어 있어야 함(플랫폼에 따라 설치해야 하는 자바 버전이 다를 수 있음)
* WEKA에서 livsvm 사용하기 - http://m.blog.naver.com/poiusky5/220626264103
* 테스트 데이터 셋 - https://github.com/jasebell/mlbook
'삶의 늪에 들어 가기 전 > 정리중(미정리)' 카테고리의 다른 글
[머신러닝] 아파치 스파크를 위한 스칼라 프로그래밍 기본 소양 익히기 (2) | 2016.09.24 |
---|---|
[머신러닝] 머신러닝을 위한 데이터 저장소 (0) | 2016.09.19 |
[참고사이트] 김포프 - https://www.youtube.com/user/KimPopeTV (0) | 2016.09.16 |
[프로젝트, 4학년] 직원관리 사이트 (0) | 2016.09.15 |
[MongoDB] 강좌 1편: 소개, 설치 및 데이터 모델링 (0) | 2016.09.08 |