Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

CRISP-DM의 응용 프로그램은 무엇입니까?

<시간/>

CRISP-DM(Cross Industry Standard Process for Data Mining)은 M&V 방법론을 더욱 표준화하고 에너지 절약을 보다 효율적으로 평가할 수 있는 접근 방식으로 인식되었습니다. 다음과 같은 CRISP-DM의 여러 응용 프로그램이 있습니다 -

비즈니스 이해 − M&V를 돕기 위한 DM 적용 가능성을 만들기 위해 사례 연구로 생물의학 제조 시설을 선택했습니다. 분석 중인 비즈니스에 대한 품질 이해는 프로세스의 모델링 및 평가 단계에서 결과를 실행하는 데 중요했습니다. 이는 프로세스 안내, 학습 프로세스 흐름도, 배관 및 계측 다이어그램을 수행하여 구현되었습니다.

이 단계부터 분석 경계 내 시스템에 대한 지식이 필요했으며 시설의 엔지니어링 팀에서 몇 가지 문제를 더 이해했습니다. 분석의 경계는 전체 제조 시설에 걸친 전기 에너지 소비였습니다.

데이터 이해 − CRISP-DM 참조 모델의 데이터 이해 절차는 시설의 데이터 기술 인프라에 대한 조사를 통해 완료되었습니다. 에너지 소비 데이터의 흐름과 데이터가 저장된 데이터베이스에 대한 이해를 얻었습니다.

데이터 준비 − 에너지 소비 데이터는 계량 기능으로 인해 계산이 복잡합니다. 전기 에너지는 누적 계량기를 사용하므로 출력된 데이터에 대한 전처리가 완료되어야 합니다. 조사 중인 케이스의 경우 사용자에게 출력되기 전에 달성되었습니다.

그러나 이러한 데이터 사전 정리에도 불구하고 사전 정리 절차가 모든 이상을 제거하지 않았기 때문에 데이터 세트에 이상값이 남아 있었습니다. 따라서 데이터 준비 단계는 사용자에게 전달되는 데이터 세트에 남아 있는 일부 이상값을 제거하는 데 사용되었습니다.

현장의 전기 에너지 소비자에 대한 전체 분석에 필요한 데이터를 수집하는 데 에너지 관리 응용 프로그램과 풍력 터빈 관리 응용 프로그램이라는 두 가지 데이터 소스가 사용되었습니다.

현장에서 매료된 전기 에너지는 누적 킬로와트시(kWh) 미터로 계산됩니다. 이 데이터의 사전 처리에는 계량기 오류로 인해 생성된 이상값을 감지하고 데이터를 kWh에서 킬로와트(kW)의 평균 전기 부하로 변환하는 작업이 포함되었습니다. 동일한 형식과 단위로 일부 데이터를 분석하려면 두 번째 단계가 필요했습니다.

모델링 − 데이터 준비 절차의 데이터 세트 출력은 구현된 데이터 정리의 결과로 깨끗하고 기능적인 형식이었습니다. 이 사례 연구의 감옥에 대해 압축 공기 부하는 사용 가능한 에너지 데이터의 힘을 특징으로 하는 가장 적합한 변수였기 때문에 모델링할 양으로 선택되었습니다.

부하가 높은 수준에서 고려되었을 때 현장의 다른 필수 에너지 사용자와 명확하고 명백한 상관 관계가 없었습니다. 다른 필수 에너지 사용자는 공급 일정과 표준 운영 프로세스의 존재로 인해 더 예측 가능했습니다.