본문 바로가기
반응형

4차 산업 혁명23

데이터 형태에 따른 구분 정형 데이터 vs 비정형 데이터 데이터는 형태에 따라 정형 데이터, 반정형 데이터, 비정형 데이터가 있다. 데이터를 구분하는 기준으로 스키마(schema) 형태의 유무, 즉 형태가 있느냐 없느냐가 우선 분류기준이다. 또한 형태가 있으면서 연산가능(calculable)한 것인지, 연산 불가능한 것인지가 그 다음 기준이다. 형태가 있고 연산가능하면 정형 데이터이다. 대표적으로 키와 몸무게가 있다. 형태가 있으나 연산가능하지 않으면 반정형 데이터에 속한다. 로그 등이 대표적이다. 비정형 데이터는 형태도 없고, 연산 가능하지도 않은 것을 말한다. 우리가 흔히 말하는 소셜 데이터가 이에 속하며 텍스트, 영상, 음성 등의 형태로 나타난다. 비정형 데이터를 분석하기 위해서는 비정형화를 정형화로 만드는 정형화 데이터 .. 2018. 1. 21.
데이터 분석이란 많은 사람이 오프라인보다 온라인에서 많은 시간과 돈을 사용하고 있다. 오프라인과 달리 온라인은 디지털 로그를 통해 소비자의 행동패턴을 데이터로 분석하는 것이 가능하다. 이에 따라 데이터를 활용할 수 있는 역량은 매우 중요해졌다. 데이터 분석은 분석의 대상에 대한 문제점을 찾고, 해결할 데이터를 수집 분석하여 해결방안을 찾아 이를 업무와 시스템에 도입하는 것을 의미한다. 데이터 분석은 문제의 발견, 데이터 수집 및 가공, 데이터 분석 및 액션의 과정을 통하여 이루어진다. 먼저 문제의 발견은 기업 문제 파악, 문제에 대한 정의, 데이터 분석 문제 전환 과정을 말한다. 다음으로 데이터 수집 및 가공은 데이터 현황 파악, 개인정보보호 검토, 수집방안 검토, 활용타당성 검토, 데이터 전처리, 활용을 위한 품질점검.. 2018. 1. 10.
빅데이터의 이해 빅데이터란 디지털 환경에서 생성되는 대규모 데이터를 말합니다. 빅데이터의 형태는 수치형 데이터부터 텍스트를 포함한 머신데이터 등으로 다양합니다. 시장조사기관 IDC는 2017년 세계 빅데이터 및 분석 시장이 전년대비 12.4% 성장하며 1508억달러(약 171조원) 규모에 달할 것이라고 했습니다. 2017년 빅데이터 및 솔루션에 대한 투자 비중이 높을 것으로 예상되는 산업은 뱅킹, 조립제조, 공정제조, 연방·중앙정부, 전문 서비스 분야입니다. 빅데이터가 등장한 배경으로 첫째, 디지털 환경에서의 지속적으로 축적된 데이터 둘째, 데이터 과학이라는 새로운 학문의 등장 셋째, 대용량 처리를 위한 분산처리 및 저장기술의 등장이 있습니다. 빅데이터의 특징은 규모(Volume), 속도(Velocity), 다양성(Va.. 2018. 1. 9.
반응형