1.데이터를 처리하기 위해 여러 기술을사용함.
그기술의종류만큼데이터를중복한다는의미가될수있으니검토대상이다.
2. Software Developer의Data는Storage, File이다.
Data는Storage, File에저장되는것이지Data = Storage, File은아니다.
Data로현상과사실이설명될수있어야한다.
그사실들을 질의하여 언제든지 답을 얻을 수 있도록 정규화해놓은것이바로Database 다!
3. 데이터 처리는 SQL이 가장 효율적인데, SQL을 잘 사용하지 않는다.
이유는Data Engineer가SQL 구사능력이부족하기때문이라고생각한다. (My Personal Opinion)
4. Requirement Analysis를하지않고Design 부터한다.
비즈니스용어, 단어에대한고민은없고현재Hot한기술용어에만광적으로집착한다.
5. 그 어느 누구도 데이터의 의미를 찾고 해석하지 않는다.
이쁜포장지(Data Visualization) 와 내용물을 만든공장에서 쓰인기술(Big Data Storage)만 관심있지 내용물
(데이터-> 정보-> 지식)에관심이없다. 그래서데이터를보지않는다.
* 이렇게해도돌아가긴한다단지돈과인력이더많이들뿐이다.
'데이터 아키텍처 & 처리기술 & DBMS > Data Preprocessing' 카테고리의 다른 글
데이터 전 처리 단계 활용 전략 (0) | 2023.12.24 |
---|---|
데이터를 바라보는 관점(Views) (0) | 2023.12.24 |
데이터 전처리의 정의 (0) | 2023.12.24 |