Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

최대 빈도 항목 집합이란 무엇입니까?

<시간/>

최대 빈도 항목 집합은 직접 상위 집합이 자주 사용되지 않는 빈도 항목 집합으로 표시됩니다. 격자의 항목 집합은 빈번한 항목과 드물게 발생하는 항목의 두 그룹으로 나뉩니다. 점선으로 정의되는 빈번한 항목 집합 테두리입니다.

경계 위에 있는 각 항목 집합은 빈번한 반면 경계 아래에 있는 항목(음영 처리된 노드)은 드물게 있습니다. 경계 근처에 있는 항목 집합 사이에 {a, d}, {a, c, e} 및 {b, c, d, e}는 직접 상위 집합이 드물기 때문에 최대 빈도 항목 집합으로 처리됩니다.

{a, d}를 포함하는 항목 집합은 일부 직접 상위 집합인 {a, b, d}, {a, c, d} 및 {a, d, e}가 드물기 때문에 최대 빈도입니다. 대조적으로 {a, c}는 직접 상위집합인 {a, c, e}가 빈번하기 때문에 극대값이 아닙니다.

최대 빈도 항목 집합은 빈도 항목 집합에 대한 간략한 설명을 적절하게 지원합니다. 다른 말로 하면, 그것들은 일부 빈번한 항목 집합이 파생될 수 있는 가장 작은 항목 집합 집합을 형성합니다. 예를 들어, 빈번한 항목 집합은 다음과 같은 두 그룹으로 나눌 수 있습니다. -

  • 항목으로 시작하고 항목 c, d 또는 e를 포함할 수 있는 빈번한 항목 집합. 이 그룹은 {a), {a, c), {a, d}, {a, e} 및 {a, c, e}를 포함한 항목 집합을 포함합니다.

  • 항목 b, c, d 또는 e로 시작하는 빈번한 항목 집합. 이 그룹은 {b}, {b, c}, {c, d}, {b, c, d, e} 등을 포함한 항목 집합을 포함합니다.

첫 번째 그룹에 적용되는 빈번한 항목 집합은 {a, c, e} 또는 {a, d}의 하위 집합이고 두 번째 그룹에 적용되는 항목 집합은 {b, c, d, e}의 하위 집합입니다. 따라서 최대 빈도 항목 집합 {a, c, e}, {a, d} 및 {b, c, d, e}는 빈도 항목 집합에 대한 간략한 설명을 지원합니다.

최대 빈도 항목 집합은 이러한 데이터에 기하급수적으로 여러 빈도 항목 집합이 있기 때문에 매우 높고 빈번한 항목 집합을 만들 수 있는 데이터 집합에 대한 귀중한 설명을 지원합니다. 이 방법은 일부 하위 집합을 열거할 필요 없이 최대 빈도 항목 집합을 명시적으로 발견하는 효과적인 알고리즘이 발생한 경우에만 실용적입니다.

간결한 설명을 지원함에도 불구하고 최대 빈도 항목 집합에는 하위 집합의 지원 데이터가 포함되지 않습니다. 예를 들어, 최대 빈도 항목 집합 {a,c,e}, {a,d} 및 {b,c,d,e}의 지원은 해당 하위 집합의 지원에 대한 아이디어를 제공하지 않습니다.

최대가 아닌 빈도 항목 집합의 지원 개수를 결정하려면 데이터 집합에 대한 추가 전달이 필요합니다. 어떤 경우에는 지원 데이터를 보존하는 빈번한 항목 집합에 대한 최소한의 설명을 갖는 것이 바람직할 수 있습니다.