웹 사용 마이닝은 웹로그 데이터에서 유용한 데이터, 정보, 지식을 도출하는 데 사용되며 웹 페이지에 대한 사용자 액세스 디자인을 식별하는 데 도움이 됩니다.
웹 자원의 관리인 마이닝에서 개인은 웹 서버 로그로 구성된 웹사이트 방문자의 요청 데이터에 대해 생각하고 있습니다. 웹 페이지 세트의 콘텐츠와 메커니즘은 페이지 작성자의 의도를 따르지만 단일 요청은 사용자가 이러한 페이지를 보는 방식을 보여줍니다. 웹 사용 마이닝은 페이지 디자이너가 제안하지 않은 관계를 공개할 수 있습니다.
웹 서버는 일반적으로 웹 페이지에 액세스할 때마다 (웹) 로그 항목 또는 웹 로그 항목을 등록합니다. 여기에는 요청된 URL, 요청이 도입된 IP 주소 및 타임스탬프가 포함됩니다.
웹 기반 전자 상거래 서버의 경우 많은 웹 액세스 로그 데이터가 수집되고 있습니다. 유명 웹사이트는 매일 수천 메가바이트의 순서로 Weblog 기록을 등록할 수 있습니다. Weblog 데이터베이스는 웹 역학에 대한 풍부한 데이터를 지원합니다. 따라서 정교한 Weblog 마이닝 접근 방식을 만드는 것이 필수적입니다.
웹 사용 마이닝을 위한 방법을 개발함에 있어 다음과 같은 사항을 고려할 수 있다. 첫째, Weblog 파일 분석의 여러 응용 프로그램을 구상하는 것은 고무적이지만 자극적입니다. 이러한 응용 프로그램의 성공은 대규모 원시 로그 레코드에서 찾을 수 있는 진실하고 신뢰할 수 있는 지식의 내용과 양을 기반으로 한다는 점을 이해하는 것이 중요합니다.
둘째, 사용 가능한 URL, 시간, IP 주소 및 웹 페이지 콘텐츠 데이터를 사용하여 Weblog 데이터베이스에 다차원 보기를 구축할 수 있으며 다차원 OLAP 분석을 구현하여 상위 N명의 사용자, 상위 N개의 액세스 웹 페이지, 잠재 고객, 사용자, 시장 등을 찾는 데 도움이 될 일반적으로 액세스되는 기간 등
셋째, 웹로그 기록에 대한 데이터 마이닝을 구현하여 웹 액세스의 연관 패턴, 순차 패턴 및 경향을 발견할 수 있습니다. 웹 액세스 패턴 마이닝의 경우 정확한 웹로그 분석을 단순화하기 위해 더 많은 사용자 순회 데이터를 확보하기 위한 추가 조치를 취하는 것이 필수적입니다.
이러한 추가 데이터에는 인터넷 서버 버퍼에 있는 웹 페이지의 사용자 탐색 시퀀스가 포함될 수 있습니다. 이러한 웹로그 문서의 필요성으로 인해 시스템 구현 분석, 웹 캐싱, 웹 페이지 프리페칭 및 웹 페이지 스와핑을 통한 시스템 설계 향상에 대한 연구가 진행되었습니다. 웹 트래픽의 기능 이해 고객 반응과 동기를 이해합니다.
예를 들어, 일부 연구에서는 사용자 액세스 패턴을 이해함으로써 스스로를 향상시키는 적응형 사이트를 제안했습니다. 웹로그 분석은 또한 단일 사용자를 위한 맞춤형 웹 서비스를 구축하는 데 도움이 될 수 있습니다.