본문으로 건너뛰기

데이터의 가치와 미래

빅데이터의 가치와 영향

빅데이터의 가치

빅데이터의 가치

  • 어떤 인사이트를 발굴하여 어떻게 할용할것인지에 달렸음
  • 중요한것은 빅데이터를 통한 인사이트를 가치 있게 만드는 과정

빅데이터 가치 산정의 어려움 ⭐️

데이터 활용 방식데이터 개발이 인반화 되면서 특정 데이터를 어떻게 어디서 활용하는지 알 수 없게 되었기 때문에 가치 선정이 어렵다.
가치 창출 방식기존에 없던 새로운 가치를 창출함에 따라 가치 선정이 어렵다.
분석 기술의 발전데이터 분석의 발전으로 가치 있는 데이터와 가치 없는 데이터의 경계를 나누기 어렵다.

빅데이터의 영향

빅데이터의 영향

기업소비자 행동 분석, 시장 변동을 예측해 비즈니스 모델을 혁신하거나 신사업을 발굴
정부환경 탐색, 상황 분석, 미래 대응
개인개인의 목적에 따라 빅데이터를 활용하며 스마트라이프

빅데이터가 가치를 만들어내는 5가지 방식(맥킨지의 빅데이터 보고서, 2011)

  • 투명성 제고로 연구개발 및 관리 효율성 제고
  • 시뮬레이션을 통한 수요 포착 및 주요 변수 탐색으로 경쟁력 강화
  • 고객 세분화 및 맞춤 서비스 제공
  • 알고리즘을 활용한 의사결정 보조 혹은 대체
  • 비즈니스 모델과 제품, 서비스의 혁신 등

빅데이터 경영혁식의 4단계

  1. 생산성 향상
  2. 발견에 의한 문제 해결
  3. 의사결정 향상
  4. 새로운 고객가치와 비즈니스 창출

빅데이터와 비즈니스 모델

빅데이터 활용

미래의 빅데이터 활용에 필요한 3요소

요소내용
데이터모든 것의 데이터화
기술진화하는 알고리즘, 인공지능
인력데이터 사이언티스트, 알고리즈미스트

7가지 빅데이터 활용 기본 테크닉 ⭐️⭐️⭐️

연관 규칙 학습(Association rule learning)

  • 어떤 변인 간에 주목할 만한 상관 관계가 있는지를 찾는 방법
  • 연관분석 혹은 장바구니 분석으로도 불리며 고객이 구매한 물품들을 분석하여 품목 사이에 어떠한 규칙이 있는지 찾아내는 분석 기법
  • 장바구니 분석, 상품추천

유형분석(Classification tree analysis)

  • 새로운 사건이 속할 범주를 찾아내는 방법
  • 이 사용자가 어떤 특성을 가진 집단에 속하는가?

유전 알고리즘(Genetic algorithms)

  • 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화시켜 나가는 방법
  • 최대의 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가?

기계학습 = 머신러닝(Machine learning)

  • 컴퓨터가 데이터로부터 규칙을 찾고 이러한 규칙을 활용해 **‘예측’**하는데 초점을 둔 방법
  • 기존 시청 기록을 바탕으로 시청자가 보유한 영화 중 어떤 영화를 가장 보고 싶어 할까?

회귀분석(Regression analysis)

  • 독립변수를 조작하면서 종속변수가 어떻게 변하는지를 보며 수치형으로 이루어진 두 변인의 관계를 파악하는 방법
  • 구매자의 나이가 구매 차량의 타입에 어떤 영향을 미치는가?

감정분석(Sentiment analysis)

  • 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석하는 방법
  • 비정형 데이터 마이닝의 대표적인 기법
  • 새로운 환불 정책에 대한 고객의 평가는 어떤가?

소셜 네트워크 분석(SNS: Social Network Analysis)

  • 사회 관계망 분석으로도 불림
  • 영향력 있는 사람을 찾아낼 수 있으며, 고객 간 소셜 관계를 파악할 수 있다

빅데이터의 위기 요인과 통제 방안

위기요인 ⭐️⭐️⭐️

사생활 침해

  • 개인의 사생활 침해 위협을 넘어 사회, 경제적 위협으로 변형
  • 부족한 익명화 기술, 정보가 오용될때의 위협

책임 원칙 훼손

  • 빅데이터에 의한 정확도 증가로 분석 대상이 되는 사람들이 예측 알고리즘의 희생양이 될 수 있음
  • 시스템에 의해 부당하게 피해 보는 상황을 최소화할 장치 필요

데이터 오용

  • 데이터 과신 또는 잘못된 지표 사용으로 잘못된 인사이트를 얻어 비즈니스에 적용시 직접 손실이 발생
  • 과거의 데이터를 분석하는 것이기에 창조적인 미래 예측의 경우, 과거 데이터를 과신하거나 오용하면서 창조적이 제품 개발의 어려움

통제방안 ⭐️⭐️⭐️

사생활 침해의 통제 방안 → ‘동의’에서 ‘책임’으로

  • 개인정보 제공자의 동의를 통해 해결하기보다 개인정보 사용자의 책임으로 해결

책임 원칙 훼손의 통제 방안 → 결과 기반 책임 원칙 고수

  • 특정인의 성향에 따라 처벌하는 것이 아닌 행동 결과’를 보고 처벌

알고리즘 접근 허용

  • 데이터가 어떻게 사용되어 어떠한 이유로 피해자가 발생하게 되었는지 데이터 활용 로직인 알고리즘 공개

개인정보 비식별 기술 ⭐️

  • 데이터 마스킹 - 기존 형식을 유지한 채 식별할 수 없는 임의의 값으로 대체
  • 가명 처리 - 데이터의 값을 다른 값으로 변경
  • 총계 처리 - 각각의 데이터 값이 아닌 전체 데이터에 대한 총합 또는 평균으로 보여줌
  • 데이터 범주화 - 데이터의 값을 범주화하여 특정 값이 아닌 범위를 제공