빅데이터의 이해
빅데이터의 이해
빅데이터의 정의
일반적 정의
- 큰 용량과 복잡성으로 기존 툴로는 다루기 어려운 데이터셋의 집합
가트너(Gartner) 정의
- 향상된 시사점과 더 나은 의사결정을 위해 사용되는 비용 효율이 높고 혁신적이며 대용량, 고속 및 다양성의 특성을 가진 정보 자산
매킨지(McKinsey) 정의
- 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터
IDC 정의
- 다양한 종류의 대규모 데이터에서 낮은 비용으로 가치를 추출하고, 데이터의 초고속 수집과 발굴을 지원하도록 고안된 차세대 기술 및 아키텍처
더그 래니(Doug Laney)의 정의(3V)
- 양(Volume), 데이터의 유형과 소스의 다양성(Variety), 데이터 수집과 처리 속도(Velocity)가 급격하게 증가하면서 나타나는 현상
빅데이터의 특징
더그 래니의 3V ⭐️⭐️⭐️
![data-adsp_3](https://github.com/DainoJung/docusaurus_blog/assets/117745618/9db83693-281b-410c-bd8a-df3e526a4992)
빅데이터의 새로운 특징 4V ⭐️⭐️⭐️
- Value(가치) - 데이터 전체를 파악하고 패턴을 발견하기가 어렵게 되면서 가치(Value)의 중요성이 강조
- Veracity(정확성) - 빅데이터 기반의 예측 분석 결과에 대한 신뢰성이 중요
빅데이터 출현 배경
빅데이터의 출현 배경 ⭐️
데이터의 양적 증가
산업계의 변화
- 양질 전환의 법칙 - 정보가 지속적으로 축적되면서 거대한 데이터는 새로운 기술을 만나 새로운 가치를 창출할 수 있는 변화의 상태가 됨
학계의 변화
- 거대한 데이터를 다루는 학문 분야가 늘어나면서 필요한 기술 아키텍처 및 통계 도구가 발전
관련 기술의 발전