데이터 형태에 따른 구분
정형 데이터 vs 비정형 데이터 데이터는 형태에 따라 정형 데이터, 반정형 데이터, 비정형 데이터가 있다. 데이터를 구분하는 기준으로 스키마(schema) 형태의 유무, 즉 형태가 있느냐 없느냐가 우선 분류기준이다. 또한 형태가 있으면서 연산가능(calculable)한 것인지, 연산 불가능한 것인지가 그 다음 기준이다. 형태가 있고 연산가능하면 정형 데이터이다. 대표적으로 키와 몸무게가 있다. 형태가 있으나 연산가능하지 않으면 반정형 데이터에 속한다. 로그 등이 대표적이다. 비정형 데이터는 형태도 없고, 연산 가능하지도 않은 것을 말한다. 우리가 흔히 말하는 소셜 데이터가 이에 속하며 텍스트, 영상, 음성 등의 형태로 나타난다. 비정형 데이터를 분석하기 위해서는 비정형화를 정형화로 만드는 정형화 데이터 ..
4차 산업 혁명/빅데이터 Big Data
2018. 1. 21. 16:35
반응형
최근에 올라온 글
최근에 달린 댓글
글 보관함
- Total
- Today
- Yesterday