[머신러닝] 데이터 마이닝 툴 - WEKA

류명운

·

2016. 9. 19. 17:58

반응형

[머신러닝] 데이터 마이닝 툴 - WEKA



웨카(Weka, Waikato Environment for Knowledge Acquisition)


  뉴질랜드의 와이카토대학교(University of Waikato)에서 자바로 만든 머신 러닝과 데이터 마이닝 툴킷이다. 워크벤치(workbench) 프로그램이나 명령줄 도구를 이용하여 학습과 시각화 도구를 제공한다. JDBC 드라이버로 기존 데이터 소스에서 데이터를 가져올 수 있다. 웨카를 통해 수행 가능한 작업은 다음과 같다.

  • 데이터 전처리(Preprocessing data)
  • 클러스터링(Clustering)
  • 분류(Classification)
  • 회귀 분석(Regression)
  • 연관 규칙(Association rules)

웨카는 널리 사용되며, 현재는 하둡과 연결하여 빅데이터에 접근하는 것을 지원한다.


* 웨카 설치 : http://www.cs.waikato.ac.nz/ml/weka/downloading.html


* 자바를 다른 컴파일 언어와 구분 짓는 것이 가장 큰 특징


* 웨카 프로그램에서 사용하는 파일 형식 : ARFF(Attribute-Relation File Format)


* 자바가 설치되어 있어야 함(플랫폼에 따라 설치해야 하는 자바 버전이 다를 수 있음)


* WEKA에서 livsvm 사용하기 - http://m.blog.naver.com/poiusky5/220626264103


* 테스트 데이터 셋 - https://github.com/jasebell/mlbook

반응형