빅 데이터에서 무엇이 잘못될 수 있습니까?

머신 러닝과 알고리즘을 핵심으로 하는 빅 데이터는 높은 수요와 뛰어난 기능으로 인해 현재 정점에 있습니다. 빅 데이터 분석 솔루션을 확보하기 위해 여러 회사에서 이 분야의 전문 지식을 요구하고 있습니다. 빅 데이터 문화는 현재 세계를 지배하고 있으며 기업이 예측 모델 및 통계 분석을 기반으로 비즈니스 인텔리전스를 달성하기 위해 노력함에 따라 표준을 설정했습니다.

데이터가 기하급수적으로 생성됨에 따라 빅 데이터, IoT 및 클라우드 컴퓨팅과 같은 최첨단 기술에 대한 수요가 증가하고 있습니다. 전문가에 따르면 이러한 기술은 앞으로 모든 비즈니스에서 불가피한 부분이 될 것입니다. 특히 빅데이터를 고려하면 엄청난 수요가 있다. 그들은 방대한 데이터 세트를 사용하여 복잡한 알고리즘을 실행하고 적절한 시기에 광범위한 결과를 제안하는 평결을 내립니다. 하지만 진짜 질문은 미래의 손익을 예측하고 정의하기 위해 기계에만 의존할 수 있느냐는 것입니다.

이 예측 불가능한 경제에서 기업들은 편향된 시장과 신뢰할 수 없는 통계로 어려움을 겪고 있습니다. 이러한 시나리오에서 빅 데이터를 통해 결론을 도출하고 규범적 통계를 활용하여 지능적인 비즈니스 결정을 내릴 수 있습니다. 그렇다면 빅 데이터가 어디에서 잘못될 수 있을까요?

데이터가 비즈니스 소유자를 통제하기 시작하고 창의성이 억제되는 시점입니다. 비즈니스가 실시간 상호 작용 기반 결과 대신 기계 지향 결과를 신뢰하기 시작하는 시점에서. 그리고 기업이 사람이 아닌 기계에 의해 통제되는 시점에서 빅데이터의 힘은 액면 그대로 인정받고 있다. 정보가 기계에서 나오기 때문에 사람들은 정보가 정확해야 한다고 생각하지만 안타깝게도 그렇지 않습니다.

대부분의 분석 모델에는 내재된 오류와 계산 착오가 있으며, 그 예측은 모든 공식 시스템에서 결국 무너지고 빅 데이터로 인해 재앙의 가능성이 비교적 높습니다. 빅 데이터와 관련된 세 가지 가장 일반적인 문제가 무엇인지 알아보겠습니다.

고스트 데이터

일상적인 의사 결정을 공식화하기 위해 일반적으로 접하는 데이터는 복잡한 분석 프로세스를 통해 분석되는 거대한 데이터베이스에서 나옵니다. 그 수치가 정확한지 여부를 판단할 수는 없습니다.

데이터 제조 프로세스에 대해 간략하게 살펴보겠습니다. 대부분의 경우 일선 직원은 인적 오류가 발생할 수 있는 데이터를 기계에 삽입합니다. 다시 말하지만 계산원은 올바른 바코드를 입력해야 하는 반면 재고 담당자는 재고를 정확히 세고 배치해야 합니다. 이러한 작업 책임은 아직 기계에 통합되지 않았으며 현재 인간에게 할당되어 있습니다.

결과적으로 오류가 발생하여 숫자의 불일치가 발생하고 결과적으로 공급자뿐만 아니라 소비자의 구매 및 마케팅 결정에 영향을 미칩니다. 데이터가 수행하는 역할을 이해하는 것이 중요하므로 시스템에 입력되는 숫자를 제어하는 것이 필수적입니다.

데이터를 맹목적으로 신뢰

업무 성과 평가에서 고정된 패러다임에 의존하여 학생의 자질을 평가하는 것까지 데이터는 이제 우리 삶의 일부이자 소포가 되었습니다. 오늘날 우리는 특정 상황에서 데이터에 너무 의존하므로 데이터 없이는 일부 기능을 수행할 수 없습니다. 데이터는 기계에 입력되기 전에 쉽게 조작할 수 있으며 맹목적으로 신뢰하는 단점이 있습니다. 또한 누구나 인간의 판단에 의문을 제기하고 싶어하지만 기계의 경우 데이터 분석 결과가 반대되지 않는 경우가 많습니다. 직접 비교하기 전에 데이터 세트가 어떤 방식으로든 변경되었는지 여부를 고려하는 것이 중요합니다.

통계적 과적합

이해를 돕기 위해 모든 비즈니스 결정은 과거 행동에서 파생된 통계적 추론을 기반으로 합니다. 그러나 이 프로세스는 특히 데이터 세트가 작고 소수의 아웃라이어가 결과를 크게 왜곡하기에 적합한 경우 전체적으로 결함이 있습니다.

모든 데이터 세트에는 예측 모델이 과거 사건에 대해 보다 정확하게 맞춤화될수록 미래의 정확도가 낮아진다고 믿는 임의성 요소가 있습니다.

가장 복잡한 모델이 실패하고 비참한 결과를 제공했을 때 추론이 있었습니다. 예를 들어 사람들이 매일 수십억 달러의 위험을 감수하는 주식 시장 예측 모델이 있습니다. 시장에는 정확한 예측을 제공한다고 주장하지만 때때로 실패하는 응용 프로그램이 있습니다.

이것은 우리가 결정을 내리고 미래를 예측하기 위해 기계를 사용하는 것을 중단해야 한다는 의미는 아닙니다. 기계를 사용하여 정보를 수집하는 동안 다른 출처를 열어두기만 하면 됩니다. 숫자를 맹목적으로 받아들이는 것은 위험하고 위험하므로 데이터 수집 과정과 추론 방법을 고려해야 합니다. 이렇게 하면 정보에 입각한 결정을 내리고 결과적으로 손실을 피할 수 있습니다.