Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

웹 사용 마이닝의 규칙은 무엇입니까?

<시간/>

웹 마이닝은 데이터 마이닝 기술을 사용하여 웹 기반 레코드 및 서비스, 서버 로그 및 하이퍼링크에서 처리하여 웹의 도움으로 일반적으로 유익한 패턴 추세 및 데이터를 추출하는 프로세스를 정의합니다. 웹 마이닝의 목적은 필수적인 통찰력을 얻기 위해 정보를 수집하고 분석하여 웹 기록에서 디자인을 찾는 것입니다.

웹 마이닝은 인터넷에 대한 적응된 데이터 마이닝 접근 방식의 소프트웨어로 볼 수 있는 반면, 데이터 마이닝은 지식 발견 프로세스에 고정된 일반적으로 구조화된 데이터의 패턴을 발견하기 위한 알고리즘의 응용으로 정의됩니다.

웹 마이닝에는 여러 데이터 유형 집합을 제공하는 고유한 기능이 있습니다. 웹에는 텍스트를 포함한 웹 페이지, 하이퍼링크를 통해 링크된 웹 페이지, 웹 서버 로그를 통해 고객 활동 모니터링 등을 포함하여 마이닝 절차에 대한 다양한 접근 방식을 제공하는 여러 요소가 있습니다.

웹 사용 마이닝에는 다음과 같은 다양한 규칙이 있습니다 -

전처리 − 웹 사용 로그는 마이닝 응용 프로그램에서 액세스할 수 있는 형식이 아닙니다. 마이닝 응용 프로그램에서 사용할 일부 데이터의 경우 데이터를 다시 형식화하고 정리해야 할 수 있습니다. 특히 웹로그 사용과 관련된 몇 가지 문제가 있습니다. 처리 단계에는 정리, 사용자 식별, 세션 식별, 경로 완성 및 서식 지정이 포함됩니다.

데이터 구조 − 웹 사용 마이닝 프로세스 동안 식별된 패턴을 추적하기 위해 몇 가지 고유한 데이터 구조가 제안되었습니다. 사용되는 기본 데이터 구조를 트리라고 합니다. 트리는 루트 트리이며 루트에서 리프까지의 각 경로는 시퀀스를 나타냅니다. 나무는 패턴 일치 응용 프로그램을 위해 문자열을 저장할 수 있습니다. 나무의 유일한 문제는 공간 요구 사항입니다.

패턴 발견 − 클릭스트림 데이터에 사용되는 가장 일반적인 데이터 마이닝 기술은 순회 패턴을 찾는 것입니다. 순회 패턴은 세션에서 사용자가 검사하는 페이지 그룹입니다. 다른 유형의 패턴은 웹 사용 마이닝으로 발견할 수 있습니다. 다양한 기능과 다양한 목적을 발견하는 데 사용되는 다양한 조합을 사용하여 패턴을 찾습니다.

패턴 분석 − 패턴이 발견되면 해당 정보를 어떻게 사용할 수 있는지 결정하기 위해 패턴을 분석해야 합니다. 일부 패턴은 삭제될 수 있으며 관심 있는 것으로 결정되지 않습니다.

패턴 분석은 발견 활동의 결과를 보고 해석하는 단계입니다. 빈번한 유형의 순회 패턴을 식별할 필요는 없지만 고유성 또는 통계적 속성으로 인해 관심 있는 패턴을 식별해야 합니다.