일반적인 스프레드시트 실수는 원시 데이터를 변경하는 것입니다. 누군가가 데이터의 유일한 복사본에서 "한 가지만 수정"하거나 실수로 원본 데이터 세트를 덮어쓰면 결국 혼란스러운 문제를 해결하는 데 몇 시간을 소비하게 됩니다. 우리 모두 그런 경험이 있습니다. 빠른 수정은 정보 손실과 의심스러운 결과의 악몽으로 변합니다.
이를 방지하려면 "원시 데이터를 건드리지 마십시오."라는 황금률을 따르십시오. 원본 데이터 세트를 그대로 유지하고 복사본이나 파생 버전으로 작업하면 오류를 최소화하고 추적성을 유지하며 작업 흐름의 재현성을 높일 수 있습니다.
이 튜토리얼에서는 여러분의 고민을 덜어줄 수 있는 간단한 작업 흐름 조정 방법을 살펴보겠습니다.
이 워크플로가 중요한 이유
- 오류 방지: 원시 데이터는 진실의 원천입니다. 이를 직접 변경(예:행 삭제 또는 셀 덮어쓰기)하면 특히 대규모 또는 복잡한 데이터 세트에서 되돌릴 수 없는 실수가 발생할 수 있습니다.
- 재현성: 분석 내용을 다시 확인하거나 다른 사람과 공유해야 하는 경우 원본 데이터를 그대로 유지하면 추측 없이 단계를 추적할 수 있습니다.
- 버전 관리 라이트: 원시 데이터를 읽기 전용으로 처리하면 기본적인 버전 제어를 모방하고 '데이터 재해'로부터 보호할 수 있습니다.
- 효율성: 데이터를 정리하고 별도의 시트로 변환하면 모든 내용이 체계적으로 정리되어 나중에 반복하거나 자동화하기가 더 쉬워집니다.
이 접근 방식은 일관되지 않은 형식, 중복 또는 누락된 값이 있는 CSV 파일을 가져올 때와 같이 지저분한 데이터세트에 특히 유용합니다. 원본 파일을 편집하는 대신 새 시트에 복제하여 정리하게 됩니다.
이 단계별 작업 흐름을 구축해 보겠습니다.
1단계:원시 데이터 가져오기
- 새 스프레드시트 파일 열기
- 'Raw_Data'라는 이름의 새 시트 만들기
- 원시 데이터 세트 가져오기
- 데이터로 이동 탭>> 데이터 가져오기 선택>> 출처를 선택하세요

핵심 규칙:
가져온 후에는 실수로 편집되는 것을 방지하기 위해 이 시트를 잠그십시오.
- 시트 탭을 마우스 오른쪽 버튼으로 클릭하고>> 시트 보호를 선택합니다.
- 필요한 경우 비밀번호를 설정하세요
- 상단에 '수정하지 마세요. 소스 데이터만'이라는 메모를 추가하세요.

이 시트는 이제 귀하의 손댈 수 없는 아카이브입니다. 여기에서는 절대 셀을 편집하지 마세요.
2단계:클리닝 시트 만들기
- 'Cleaned_Data'라는 새 시트 추가
- 사람의 실수를 피하기 위해 수동으로 복사하는 대신 원시 데이터를 참조하세요.
- 수식을 사용하여 동적으로 데이터 가져오기
- A1 셀에 다음 수식을 삽입하세요.
- 드래그하여 범위를 채우거나 효율성을 위해 배열 수식을 사용하세요.

이 수식은 연결된 복사본을 만듭니다. 이제 원본에 영향을 주지 않고 이 시트를 청소할 수 있습니다.
3단계:새 시트의 데이터 정리
이제 이 시트의 지저분한 데이터를 정리하세요. 열별로 작업하거나 내장된 도구를 사용하여 일괄 작업을 수행하세요.
일관되지 않는 형식(예:날짜) 수정:
- A열의 날짜가 일치하지 않는다고 가정합니다.
- 새 열에서 수식을 사용하여 날짜를 표준화합니다.
형식:
=IF(A2="","", IF(ISNUMBER(A2),A2, IFERROR( DATEVALUE(SUBSTITUTE(SUBSTITUTE(A2,"-","/"),".","/")), DATE(RIGHT(A2,4),MID(A2,4,2),LEFT(A2,2)))))

오타 및 불일치 처리:
- PROPER() 등의 수식을 사용하세요. 텍스트 대문자 사용을 표준화하기 위해
오타 수정:
- Ctrl + H 누르기 찾기 및 바꾸기를 열려면 대화 상자
- 잘못된 항목을 올바른 값으로 교체
- 모두 바꾸기를 클릭하세요.

중복 삭제:
- 필요한 경우 열 정렬
- 데이터로 이동 탭>> 중복 제거를 선택합니다.
누락된 값 처리:
- 다음과 같은 공식을 사용하여 논리적으로 빈칸을 채우세요:
필요한 경우 파생 열 추가:
- 총 매출:

- 정리되면 새 열을 복사하여 원래 지저분한 열에 값으로 붙여넣습니다.
- 마우스 오른쪽 버튼 클릭>> 선택하여 붙여넣기 선택>> 값 선택

프로세스 전반에 걸쳐 별도의 '메모' 시트에 변경 사항을 기록하거나 인라인 댓글(삽입>> 댓글)을 사용하여 기록하세요.
4단계:보고서 작성(데이터 분석)
분석을 새 시트로 분리하는 것이 좋습니다. 다른 시트를 추가하고 이름을 "Analytics"로 지정합니다. 수식, 피벗 테이블 또는 쿼리에 'Cleaned_Data' 시트의 데이터를 사용하세요.
피벗 테이블 만들기:
- 삽입으로 이동 탭>> 피벗 테이블 선택
- 'Cleaned_Data'에서 소스 범위를 선택하세요
- 위치 선택>> 확인을 클릭하세요.

월간 요약 작성:
- 피벗 테이블 필드에서 목록
- 지역 드래그 및 제품 행 지역
- 날짜를 드래그하세요. 열 지역
- 총 매출을 드래그하세요. 값 지역
슬라이서 삽입:
- 피벗 테이블 분석으로 이동 탭>> 슬라이서 삽입을 선택합니다.
- 지역 선택
- 확인을 클릭하세요.

이제 보고서는 지저분한 내보내기가 아닌 깨끗한 데이터에 의존합니다. 이렇게 하면 인사이트와 별도로 정리를 유지하고 정리 논리를 업데이트하면 쉽게 새로 고칠 수 있습니다.
5단계:"새로 고침" 루틴 만들기(시간을 절약하는 습관)
새로운 내보내기가 도착할 때마다:
- 'Raw_Data' 시트의 데이터를 교체합니다(동일한 헤더 유지)
- 하지 않음 "Raw_Data" 시트의 값을 편집하세요.
- 'Cleaned_Data' 시트 업데이트
- 자동 새로고침 시간 설정 또는 수동으로 새로고침
- 데이터로 이동 탭>> 모두 새로고침을 클릭하세요.

이를 통해 수동 정리 프로젝트 대신 주간 보고를 반복 가능한 프로세스로 전환할 수 있습니다.
6단계:파일 저장 및 버전 관리
- 다른 이름으로 저장: "Project_Data_v1.xlsx"와 같은 파일 이름을 사용하고 시간이 지남에 따라 버전 번호를 높이십시오.
- 공동작업의 경우: 작업 흐름 무결성을 유지하기 위해 읽기 전용 버전을 공유하세요
- 자동화: 원시 시트를 건드리지 않고 자동으로 정리되고 새로 고쳐지는 쿼리에 원시 데이터를 로드하는 Excel의 파워 쿼리를 알아보세요.
요약
다음 단계를 수행하면 분석을 유연하게 유지하면서 원시 데이터를 보호하는 워크플로우를 구축할 수 있습니다. 원시 내보내기를 한 시트에 그대로 유지하고 별도의 시트에서 청소를 수행합니다. 특히 지저분한 데이터 세트로 작업할 때 전체 워크플로가 더 안전해지고, 새로 고치기 쉽고, 훨씬 더 안정적이 됩니다.
다음 데이터 세트부터 작게 시작하면 보고 프로세스가 얼마나 원활해지는지 금방 알 수 있습니다.
솔루션이 포함된 무료 고급 Excel 연습을 받아보세요!