1.데이터표준화란?

1. 데이터 표준화란?

데이터 표준화가 무엇이냐고 묻는다면 좁은 의미로는 “현실 세계의 정보를 컴퓨터로 관리하기 위해 데이터베이스(DB)에 저장하는 정보항목의 종류, 명칭, 형식, 유효값, 관리절차 등을 특정 기준에 따라 표준*을 만드는 일을 데이터 표준화**라고 말할 수 있습니다.

우리가 생활하면서 병과 병마개, 휴대전화 충전기가 안 맞을 때 “이건 표준이 안 되었네” 라고 말하는 것처럼 무엇을 합치거나 연계할 때 표준화 이슈는 발생합니다표준을 준용해야만 여러 부품과 제품을 쉽게 저비용으로 연결하고 통합하여 완성품 만들 수 있기 때문이지요.

정보시스템도 크게 다르지 않습니다. 단순히 급여를 계산하던 시스템이 경영정보를 생산하고 미래를 예측하는 시대입니다. 따라서 수많은 시스템의 데이터를 연결하고 통합하여 융합정보 생산하는 과정에서 비표준화된 데이터는 다양한 사용자간 의사소통 혼란, 부정확한 정보생산, 관리비용의 증가 이어져 자연스럽게 데이터 표준화의 필요성이 대두되었습니다. 즉 멋진 디자인, 빠른 처리속도, 많은 데이터, 현명한 알고리즘도 중요하지만 믿을 수 있는 정보를 만들기 위해서는 데이터 품질 확보가 필요했고 그 근간에 데이터 표준화가 있다는 것을 인식하게 된 것입니다.

기업에서 업무시스템(계정계)에서 분석시스템(정보계) 시스템을 구축하거나 여러 공공기관에서 개방되는 데이터를 모아서 활용하고자 할 경우 생성기준, 정보항목, 데이터유형 등이 제각각 이어서 어려움을 겪는 경우가 있습니다. 예를 들어 주차장앱을 서비스 하려는 경우를 보더라도 해당기관의 관리목적과 관리수준에 따라 관리하는 정보항목, 명칭, 형식, 유효값이 다를 수 있습니다.

이렇듯 자재든 정보항목이든 관리대상, 명칭, 형식 등을 표준화하고 결정하는 일이 당장은 불필요해 보이고, 비용을 들지 모르지만 표준에 맞게 데이터(DB)를 재구축했을때 향후의 생산성 향상과 표준화된 정보활용을 통한 정책결정의 효과저는  매우 큰 가치로 돌아오게 됩니다. 수많은 데이터가 쌓인 후 이러한 필요성을 인지하는 것은 아쉽지만 지금은 그 가치를 인증하고 자리 잡아 가기에 다행이라 생각합니다. 

 

출처 : https://blog.b2en.com/162

'빅데이터 & 인공지능' 카테고리의 다른 글

MPP(Massivly Parallel Processing Database)  (0) 2022.02.21
파이썬 회귀분석  (0) 2022.02.06
ADP는 무슨 약자일까?  (0) 2021.04.08
스태킹형 스위치(L2)  (0) 2020.05.27
VRRP(Virtual Router Redundancy Protocol)  (0) 2020.05.27