메타데이터라는 용어는 20세기 후반부터 사용되었습니다. 그러나 지난 몇 년 동안 이 개념이 개인 데이터, 개인 정보 보호 및 보안에 대해 의미하는 바를 이해하는 것의 중요성을 강조하면서 기술 헤드라인의 더 큰 부분을 차지했습니다.
메타데이터가 모든 관심을 받을 만한 가치가 있는지 결정하기 전에 먼저 메타데이터가 의미하는 바와 디지털 생활에 어떤 영향을 미칠 수 있는지 이해해야 합니다. 그래서 그것은 무엇입니까? 메타데이터를 통해 나에 대해 무엇을 알 수 있나요? 그리고 당신은 그것에 대해 무엇을 할 수 있습니까?
메타데이터란 무엇입니까?
메타데이터라는 단어를 직역하면 "데이터에 대해"입니다. 메타데이터는 그 자체로 유용한 데이터로 분류되는 경우는 거의 없지만 오디오 파일 및 커뮤니케이션에서 이미지 및 비디오에 이르기까지 훨씬 더 큰 데이터 세트의 요약인 경우가 많습니다. 그러나 메타데이터는 이미 완전한 정보 집합에 단순히 쓸모없는 추가 정보가 아닙니다.
메타데이터는 목차와 함께 책 외부에 있는 정보라고 생각할 수 있습니다. 그들은 전체 책을 망치지 않습니다. 전체 내용을 읽지 않고도 적절하게 분류할 수 있습니다.
유형의 경우 메타데이터는 소스 파일에 대해 공개하는 정보 유형에 따라 분류되는 경우가 많습니다. 단일 파일에는 전자 시스템과 사용자 모두가 파일을 더 잘 구성하고 분류할 수 있도록 2가지 이상의 메타데이터 유형이 포함될 수 있습니다.
설명 메타데이터
이름에서 알 수 있듯이 설명 메타데이터는 해당 파일의 내용을 설명합니다. 설명 메타데이터 내의 정보는 일반적으로 동일한 유형의 대규모 파일 라이브러리를 필터링하고 검색하는 데 사용됩니다.
가장 일반적으로 사용되는 메타데이터 유형입니다. 설명 메타데이터에는 일반적으로 파일 작성자의 이름, 작성 날짜 및 장르, 앨범, 그리고 오디오 파일인 경우 표지 아트 이미지와 같은 기타 중요한 정보와 책의 ISBN 및 저자 이름이 포함됩니다.
구조적 메타데이터
구조적 메타데이터는 특정 파일 내 데이터의 구성 및 레이아웃에 대한 정보를 제공합니다. 이 정보는 필터링에 사용할 수 있지만 파일을 보다 심층적으로 탐색하고 분류하는 데 사용되는 경우가 많습니다.
구조적 메타데이터는 오디오 파일의 길이, 책의 페이지 수, 목차 및 장의 제목과 같은 다양한 유형으로 제공됩니다.
관리 메타데이터
관리 메타데이터는 본질적으로 기술적입니다. 파일 형식과 같은 정보를 포함하여 파일을 열고 실행하는 방법에 대한 정보가 포함되어 있습니다. 이러한 유형의 메타데이터는 거의 모든 파일에 존재하며 파일을 실행하는 데 사용하는 기기와 소프트웨어 또는 앱에서 읽습니다.
경우에 따라 관리 메타데이터는 권한 메타데이터로 분류되어 파일의 지적 재산권 및 파일에 대한 정당한 액세스 권한이 있는 사람에 대한 정보를 포함합니다.
법적 메타데이터
법적 메타데이터는 파일의 법적 상태에 관한 정보를 엄격하게 제공합니다. 여기에는 파일의 저작권이 포함된 공개 또는 비공개 라이선스 유형과 법적 구속력이 있는 추가 계약이 누구에게 또는 무엇에 속하는지 포함됩니다.
메타데이터가 왜 중요한가요?
어떤 파일 형식을 사용하고 있는지, 파일을 만들었는지, 친구에게서 받았는지, 다운로드했는지에 관계없이 메타데이터는 일상적인 디지털 생활에서 중요한 역할을 합니다. 그리고 메타데이터에 포함된 정보는 그 자체로는 짧고 대부분 중요하지 않을 수 있지만, 함께 조작되고 패치되어 개인 정보 및 보안을 침해할 수 있습니다.
하나 이상의 파일에 대한 메타데이터가 노출된 경우 파일의 내용이 노출되지 않습니다. 대신 다음과 같은 기본적인 질문에 답합니다.
- 이 파일은 누구의 것입니까?
- 어떤 유형의 정보가 포함되어 있습니까?
- 어디서 생성되고 저장되었나요?
- 언제 만들어지고 현재 소유자가 편집했습니까?
그러나 이러한 모든 질문에 대한 답변을 결합하면 여전히 의미가 거의 없습니다. 이 표면 수준의 정보가 사람에 대해 얼마나 많은 것을 드러낼 수 있습니까?
메타데이터가 귀하에 대해 무엇을 밝힐 수 있습니까?
그 자체로 소수의 파일과 웹 작업에서 수집된 정보는 극히 적습니다.
그러나 문제는 한 사람에 대한 메타데이터가 수천 개의 소스에서 장기간에 걸쳐 수집될 때 발생합니다. 여기에는 대화 내용에 액세스할 수 없는 경우에도 전화 및 이메일 통신으로 가장 자주 채팅하는 사람이 포함됩니다.
이미지와 같은 새로운 유형의 정보에 대한 메타데이터 추적의 도입으로 귀하에 대한 더 많은 정보가 노출됩니다. Twitter와 Instagram에 업로드되는 저녁 식사의 일반 셀카와 사진은 태그를 지정하지 않아도 가장 자주 방문하는 위치를 드러낼 수 있으므로 카메라 앱에서 사용자의 위치에 대한 액세스를 요청합니다.
노출된 메타데이터는 그 자체로 개인정보 침해입니다. 액세스할 수 있는 모든 사람이 귀하의 움직임과 의사 소통 패턴을 추적할 수 있습니다. 그러나 충분한 정보와 잘 만들어진 AI 시스템이 있으면 다가오는 움직임과 활동을 예측하기 시작할 수도 있습니다.
친구 및 가족과 이야기할 때 추적이 가능하지만 고급 분석 시스템이 도달하는 결론은 더 침습적일 수 있습니다. 결국, 귀하를 추적하는 회사는 귀하가 의료 및 보험 제공자에게 언제 연락했는지, 그리고 귀하가 온라인에서 어떤 유형의 정보를 검색했는지 알게 되었습니다.
Security.org에서 실시한 설문 조사에서는 인터넷에서 가장 큰 웹사이트가 수집할 필요가 없는 경우에도 데이터 유형을 조사했습니다. 설문 조사에는 Facebook, Twitter, 심지어 Google과 같은 소셜 미디어 웹사이트가 포함되어 있으며 대부분이 필요하지 않은 사용자 정보를 보관하고 있는 것으로 나타났습니다.
데이터에는 고유 식별자, 개인 정보, 위치 및 사용자 활동이 포함되었습니다. 꼭 필요한 추적 및 쿠키만 허용하더라도 이러한 유형의 데이터 수집을 거부할 수 없는 경우가 많습니다.
자신을 어떻게 보호합니까?
VPN을 사용하여 온라인에 남겨둘 수 있는 모든 식별자를 마스킹하고, 웹사이트를 방문할 때 가능한 최소한의 쿠키와 추적기를 허용하고, 추적 방지 브라우저 확장을 사용하십시오. 더 많은 개인 정보는 인터넷에 업로드하거나 친구에게 보내기 전에 파일에서 메타데이터를 지워야 합니다.
특히 계정이 있는 웹사이트에서 데이터 추적을 온라인에 남기는 것을 완전히 방지하는 것은 거의 불가능할 수 있지만, 귀하에 대한 정보를 최소화할 수 있습니다.