300x250
Data Mining의 연관 규칙 사례
가. 연관 규칙의 주요 수식 리스트
- 관심 있는 규칙 (xy) 즉 예를 들면, buy(A, "모니터") => buys(A, "키보드")의 예에서
1) 지지도(Support)
- A 고객이 모니터와 키보드를 동시에 2개 구매하는 비율을 의미함.
- 수식 : (모니터, 키보드 동시 거래건수) / 전체거래수
2) 신뢰도(Confidence)
- 모니터를 사고, 키보드를 사는 구매 경우를 의미함.
- 수식 : (모니터, 키보드 동시 거래건수) / 모니터가 포함된 거래수
3) 리프트(Lift); 향상도(Lift/Improvement)
- 향상도는 위 연관규칙을 인식했을 때와 알지 못했을 때를 비교해서 얼마만큼의 향상이 있는지의 관련도에 대한 정도를 나타냄
- 향상도 1이면 양의 연관관계, 향상도가 1이면 음의 연관관계를, 향상도가 = 1이면 서로가 관련이 없는 독립적인 관계를 나타냄.
- 수식 : (모니터와 키보드를 동시에 구매하는 기래건수) / (모니터구매건수 * 키보드구매건수) / * 전체거래수
나. 연관 규칙 사례(모니터 구매와 키보드 구매 사례)
거래 목록 | 구매 품목 |
1 | 모니터, 키보드 |
2 | 키보드 마우스 |
3 | 모니터, 키보드, 마우스 |
4 | 모니터, 보안 유리 |
1) 지지도
- 2/4 = 0.5X100% = 50%
2) 신뢰도
- 2/3 = 0.667X100% = 66.7%
3) 향상도
- 2 / 3x3 X 4 = 0.889 <1 이므로 음의 연관관계를 나타냄.
[참고 문헌]
강창완 외 공저, 데이터 마이닝, 사이플러스, 2007
이재호, 데이터베이스 총론, 정일출판사, 2008
반응형
'IT > 정보관리기술사' 카테고리의 다른 글
[기업경영전략] 웹 마이닝의 설명 및 유형 (0) | 2022.01.12 |
---|---|
[기업경영전략] 프로세스 마이닝(Process Mining) 정의 및 구성요소 (0) | 2022.01.12 |
[기업경영전략] 데이터 마이닝(Data Mining) 정의 및 특징 (0) | 2022.01.12 |
[기업경영전략] BSC 구축절차 및 기존 성과 평가와의 차이점, 도입효과 (0) | 2022.01.09 |
[기업경영전략] 균형 성과 관리(Balanced Score Card) 정의, 특징 및 구성요소 (0) | 2022.01.09 |