300x250

데이터 마이닝이란?

  • 이베이 옥션은 수많은 사용자 정보 거래정보 등이 DB에 저장이 되어있습니다. 이런 데이터에서 연관 규칙 등을 통하여 판매, 구매 패턴 고리를 찾고 마케팅 목적으로 대상고객을 선별하여 다양하게 활용 하는데요.
  • 이를테면, 옥션의 패션, 의류 카테고리에서 여성, 남성의 구매 성향 및 패턴을 분석하여 고객에게 연령별, 시즌별, 패턴별 마케팅 전략을 세워 고객 맞춤 서비스 하는 예입니다.
  • 이런 데이터를 잘 모아놓는 직업을 DM(Dala Warehouse)라고 하고요, 모아 놓은 데이터에서 특정 패턴 및 일정한 경향을 추출하는 과정이 바로 데이터 마이닝이라고 합니다. 더불어이런 지식을 탐사하는 과정 및 분야를 범용적인 용어로 KDD(Knowledge Discovery in Database)라고 합니다.



I. 효율적인 의사결정에 적용하는 유용한 정보의 추출, Data Mining의 개요

가. 데이터 마이닝(Dala Mining)의 정의

  • 대용량의 데이터에 숨겨져 있는 데이터간의 관계, 패턴을 탐색하고 이를 모형화하여업무에 적용할 수 있는 의미 있는 정보로 변환함으로써 기업의 의사결정에 적용하는 일련의 과정

나. Data Mining 의 특징

  • 1) 정보의 Activity와 Rule을 추론하여 경영의 경쟁력 강화를 위하여 목표 예상을 가능하게함
  • 2) 지식 집약적(Knowledge Intensive) : 응용분야 지식, DB/DW지식, 데이터 마이닝기법에 대한 지식
  • 3) 데이터 마이닝은 대용량 데이터베이스로부터 데이터를 추출함
  • 4) 귀납적 결과에 초점

 

Ⅱ. Data Mining 시스템 연관도 및 적용 기술

가. Data Mining과 OLAP의 개념도

예상치 못한 지식 발견 및 예측
기존데이터→

ETT→ 

DW→
    ↘
Data Mining
결과제공
  ↓
→  마케팅 전략수립
외부데이터↗ Metadata OLAP
다차원 질의에
대한 답변

- OLAP(Online Analytical Processing)은 정보사용자가 직접 접근하여 다차원 질의를 통해 대화식으로 정보를 탐색하고 분석하는 프로세스

나. Data Mining 적용 기술

기술 설명
연관성 분석
(Association Analysis)
여러 개의 트랜잭션들 중에서 동시에 발생하는 트랜잭션의 연관 관계를 발견하는 것임.

[사례]
- 넥타이를 구매하는 고객이 셔츠를50% 이상 구매하고, 정장과 벨트를 구매하는 고개은 코트를 구매할 확률이 40% 이상
연속성 규칙
(Sequence)
개인별 트랜잭션 이력 데이터를 시계열적으로 분석하여 트랜잭션의 향후 발생 가능성을 예측하는 것

[사례]
- A 품목을 구입한 회원이 향후 품목을 구입할 가능성은 75% 이다.
- 5번 회원에게 | 품목 추천하여 마케팅의 정확화를 높임
분류 규칙
(Classification)
이미 알려진 특정 그룹의 특징을 부여하고 정의된 분류에 맞게 구분
분류 규칙의 형태 표기는 의사결정트리, 신경망 형식으로 표현

[사례]
- 신용카드 신규 가입자를 낮음/중간/높음 신용 위험 집단으로 구분함
데이터 군집화
(Clustering)
상호간에 유사한 특성을 갖는 데이터들을 집단화 하는 과정

[사례]
- A~D의 데이터를 집단화하는 과정에서 고객 군집별 특성을 파악함
- A 군집은 소득이 300만원 이상이고, 자녀가 2~3명이고 연령이 30대 군집
- B군집은 교육 수준이 높으며, 자녀는 모두 출가했고, 연평균 구매액이 200~300만원 정도
특성화
(Characterization) 
 - 데이터 집합의 일반적인 특성을 분석하는 것으로 데이터의 요약 과정을 통하여 특성 규칙을 발견하는 기법



반응형

+ Recent posts