300x250

Data Mining의 연관 규칙 사례

가. 연관 규칙의 주요 수식 리스트

  • 관심 있는 규칙 (xy) 즉 예를 들면, buy(A, "모니터") => buys(A, "키보드")의 예에서

1) 지지도(Support)

  • A 고객이 모니터와 키보드를 동시에 2개 구매하는 비율을 의미함.
  • 수식 : (모니터, 키보드 동시 거래건수) / 전체거래수

2) 신뢰도(Confidence)

  • 모니터를 사고, 키보드를 사는 구매 경우를 의미함.
  • 수식 : (모니터, 키보드 동시 거래건수) / 모니터가 포함된 거래수

3) 리프트(Lift); 향상도(Lift/Improvement)

  • 향상도는 위 연관규칙을 인식했을 때와 알지 못했을 때를 비교해서 얼마만큼의 향상이 있는지의 관련도에 대한 정도를 나타냄
  • 향상도 1이면 양의 연관관계, 향상도가 1이면 음의 연관관계를, 향상도가 = 1이면 서로가 관련이 없는 독립적인 관계를 나타냄.
  • 수식 : (모니터와 키보드를 동시에 구매하는 기래건수) / (모니터구매건수 * 키보드구매건수) / * 전체거래수

나. 연관 규칙 사례(모니터 구매와 키보드 구매 사례)

거래 목록 구매 품목
1 모니터, 키보드
2 키보드 마우스
3 모니터, 키보드, 마우스
4 모니터, 보안 유리


1) 지지도

  • 2/4 = 0.5X100% = 50%

2) 신뢰도

  • 2/3 = 0.667X100% = 66.7%

 

3) 향상도

  • 2 / 3x3 X 4 = 0.889 <1 이므로 음의 연관관계를 나타냄.


[참고 문헌]
강창완 외 공저, 데이터 마이닝, 사이플러스, 2007
이재호, 데이터베이스 총론, 정일출판사, 2008

반응형

+ Recent posts