Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

히트맵이란 무엇입니까?

<시간/>

히트맵은 색상이 값을 나타내는 데 사용되는 숫자 데이터의 그래픽 표시입니다. 데이터 마이닝 컨텍스트에서 히트맵은 두 가지 목적, 즉 상관 관계 테이블 시각화와 데이터의 결측값 시각화에 특히 유용합니다. 두 경우 모두 정보가 2차원 테이블로 전달됩니다.

히트맵은 여러 값을 정의하기 위해 색상 코딩 시스템이 필요한 데이터에 대한 그래픽 설명입니다. 히트맵은 다양한 형태의 분석에 사용되지만 특정 웹 페이지 또는 웹 페이지 템플릿에서 사용자 행동을 표시하는 데 가장 일반적으로 사용됩니다. 히트맵은 사용자가 페이지를 눌렀던 위치, 페이지 아래로 스크롤한 거리를 표시하거나 시선 추적 테스트의 결과를 표시하는 데 사용할 수 있습니다.

p 변수에 대한 상관 테이블에는 p 행과 p 열이 있습니다. 데이터 테이블에는 p개의 열(변수)과 n개의 행(관측값)이 포함됩니다. 여러 행이 크면 하위 집합을 사용할 수 있습니다. 두 경우 모두 값 대신 색상 코딩을 스캔하는 것이 더 간단하고 빠릅니다.

히트맵은 수많은 값을 결정할 때 유용하지만 색상 차이를 정확하게 인식할 수 없기 때문에 막대 차트를 포함하여 보다 정확한 그래픽 표시를 위한 복원은 아닙니다.

결측값 히트맵에서 행은 데이터와 연관되고 열은 변수와 연관됩니다. 1은 누락된 값을 나타내고 0은 그렇지 않은 경우 초기 데이터 세트의 이진 코딩이 필요합니다. 이 새로운 이진 테이블은 누락된 값 셀(값이 1인)만 포함하여 색상이 지정됩니다.

데이터에는 전 세계 여러 국가에 대한 경제, 사회, 정치 및 "복지" 데이터가 포함됩니다(각 행은 국가임). 변수는 여러 출처에서 병합되었으며 각 출처에 대해 모든 국가에서 정보를 항상 사용할 수 있는 것은 아닙니다.

누락된 데이터 히트맵은 결합된 데이터 파일에서 "결측" 수준과 양을 시각화하는 것을 지원합니다. 일부 "결측" 설계는 사실상 모든 관측값에 대해 누락된 변수와 여러 값이 누락된 행 클러스터(국가)를 나타냅니다.

결측값이 거의 없는 변수도 명확합니다. 이 데이터는 누락을 관리하는 방법을 결정하는 데 사용할 수 있습니다(예:일부 변수 삭제, 일부 데이터 삭제, 대치 등).

Google Analytics 또는 Site Catalyst와 같은 분석 도구는 사용자가 방문하는 페이지를 표시하는 측정항목을 지원하는 데 탁월하지만 사용자가 해당 페이지를 사용하는 방식을 이해하기 위해 세부정보가 필요할 수 있습니다. 히트맵은 사용자의 행동 방식에 대한 보다 포괄적인 개요를 제공할 수 있습니다.

히트맵은 표준 분석 보고서보다 시각적이므로 한 눈에 분석하기 쉽게 만들 수 있습니다. 따라서 특히 많은 양의 데이터를 분석하는 데 익숙하지 않은 사람들이 더 쉽게 액세스할 수 있습니다.

CrazyEgg와 같은 우수한 열 매핑 도구를 사용하면 분석가가 데이터를 분류하고 필터링할 수 있습니다. 즉, 여러 유형의 사용자가 특정 페이지에 참여하는 방식을 간단하게 볼 수 있습니다.