빅데이터 - 데이터마이닝의 뜻과 분야

2020. 10. 6. 03:17애니리뷰

반응형

데이터 마이닝이란? 


데이터 마이닝은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 분석하여 그중에 


필요한 가치있는 정보만을 추출하는 과정을 데이터 마이닝이라고 합니다.  약칭으로 KDD라고도 합니다.






데이터마이닝의 기법


데이터마이닝은 다양한 기법들을 활용하는데 통계학쪽에서 


나온 탐색적자료분석, 가설 검정, 다변량 분석, 시계열 분석, 일반선형 모형 등의 


방법론, 온라인 분석 처리등에 의한 다양한 방법이 있습니다.




데이터 마이닝의 적용 분야



분류(Classification): 일정한 집단에 대한 특정 정의를 통해 분류및 구분을 추론합니다. (예: 경쟁자에게 이탈한 고객)


군집화(Clustering): 구체적인 특성을 공유하는 군집을 찹습니다.  


군집화는 미리 정의된 특성에 대한 정보를 가지지 않는다는 점에서 


분류와 다릅니다.   (예: 유사 행동 집단의 구분)



연관성(Association): 동시에 발생한 사건간의 관계를 정의한다. (예: 장바구니안의 동시에 들어 가는 상품들의 관계 규명)


예측(Forecasting): 대용량 데이터 집합 내의 패턴을 기반으로 미래에 어떨지 예측을 합니다.





반응형