본문 바로가기
회사 생활

[데이터분석 준전문가] 데이터의 이해

by Power platform 2020. 8. 8.
반응형

Chapter 1. 데이터의 이해

1. 데이터의 정의

1) 데이터의 정의

데이터(data)라는 용어는 1646년 영국 문헌에 처음 등장 하였다. "라틴어인 dare(주다)의 과거분사형으로 주어진 것"

2)데이터의 특성

구분 특성
존재적 특성 객관적 사실
당위적 특성 추론, 예측, 전망, 추정을 위한 근거

3)데이터의 유형

구분 형태
정성적 데이터 언어, 문자 등 형식이 정해 지지 않는 데이터 오늘 밥이 맛있었다
정량적 데이터 수치, 도형, 기호 등 수치로 표현되는 데이터 나이, 키, 주가, 가격

4) 지식의 구분 

구분 의미 특징 상호작용
암묵지 오랜 기간 축적된 경험과 학습을 통해 개인에게 체화되어 있는 주관적 지식 손맛,솜씨 중요하지만 다른 사람에게 공유되기 어려움 공통화, 내면화
형식지 문서 등에 의해 밖으로 표출되는 지식 교과서,동영상 전달과 공유가 용이함 표출화, 연결화

데이터와 정보의 관계

1) DIKW 피라미드

2)정의

구분 내용
지혜 정의 지식의 축적과 아이디어가 결합된 창의적 산물
L전자에서 전자 제품을 구입한다.
지식 정의 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것
L전자의 제품들의 가성비가 좋다.
정보 정의 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출된 것
 L전자 제품들이 S전자 제품 보다 싸다.
데이터 정의 개별 데이터 자체로는 의미가 중요하지 않는 객관적 사실
L전자 세탁기가  S전자 세탁기 보다 튼튼하다.

데이터베이스 개념의 발전 

  • 1950년대 : 미군에서 군비 상황의 집중 관리를 위한 컴퓨터 도서관 구현하면서 Data의 base 기지라는 뜻의 데이터 베이스가 탄생
  • 1960년대 : 미국 SDC(System Development Corporation)가 주최 심포지엄에서 데이터베이스라는 용어 공식 사용
    •  GE C. 바크만 데이터베이스 관리시스템 IDS(Integrated Data Store) 개발 
    •  SDC 2차 심포지엄에서 시스템 기반의 체계적 관리와 저장의 의미를 포함하는 '데이터베이스 시스템'
  • 1970년대 : 미국의 CAC가 KORSTIC를 통해 서비스되면서 우리나라에서 데이터베이스 이용
  • 1980년대 : KORSTIC이 해외 전문 데이터베이스를 확충하여 "TECHNOLINE'이라는 온라인 정보검색 서비스 개시
    • 국내의 데이터베이스 관련 기술 연구 개발 시작연구 개발 시작

데이터베이스의 정의

▷ 단순 저장소 개념이 아닌 첨단 정보기술을 바탕으로 데이터를 저장·검색할 수 있는 복합체

   EU의 「데이터베이스의 법적 보호에 관한 지침」

      - “체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로개별적으로 접근할 수 있는 독립된 저작물

         데이터 또는 기타 소재의 수집물

  ② 국내 저작권법

      - “소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로 그소재에 접근하거나 그 소재를 검색할

         수 있도록 한 것

  ③ 컴퓨터 용어사전 등

      - “동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의요구에 대응해서 데이터를 받아들이고 저장, 

         공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합

  ④데이터분석 전문가 가이드드

      - “문자, 기호, 음성, 화상, 영상 등상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로

         수집·축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의집합체

     ▷ 데이터베이스 시스템 : 데이터베이스 + DBMS(Database Management System)

 

데이터베이스의 특징

 ① 일반적인 특징

데이터베이스 특징 설명
통합된 데이터(integrateddata) 동일한 내용의 데이터 중복 X의미
저장된 데이터(storeddata) 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것 의미
공용 데이터(shareddata) 여러 사용자가 서로 다른 목적으로 공동으로 이용 (일반적으로 대용량, 구조복잡)
변화되는 데이터 데이터 삽입, 삭제, 갱신 등으로 변화하면서도 정확성 유지

② 다양한 측면에서 특성

측면 특성
정보의 축적 
 전달 측면
기계가독성 : 대량의정보를 일정한 형식에 따라 컴퓨터가 읽고 쓸 수 음
검색가독성 : 다양한 방법으로 필요한 정보 검색 가능
원격조작성 : 인터넷을 통해 원거리에서도 즉시 이용 가능
정보 이용 측면 요구에 따라 다양한 정보를 신속 정확하고 경제적으로 찾아낼 수 있는 특성
정보 관리 측면 정보를 일정한 규칙과 구조에 다라 정리, 저장, 검색, 고나리 할 수 있도록 하여 방대한 양의 정보를 체계적으로 축적하고 새로이 구성 가능
정보기술
발전 측면
데이터 베이스는 정보처리, 검색,관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한
네트워크 기술의 발전을 견인
경제,산업 측면 인프라적인 특성으로 인해 경제,산업,사회 활동의 효율성을 제고하고 국민의 편의 증진

 

데이터베이스 활용

1. 기업내부 데이터베이스

정보통신망 구축이 가속화되면서 1990년대에는 기업내부 데이터베이스는 기업 경영 전반에 관한 인사, 조직, 생산, 영업 활동을 포함한 모든 자료를 연계하여 일관된 체계로 구축, 운영하는 경영 호라동의 기반이 되는 전사 시스템으로 확대

 - OLTP, OLAP, CEM, SCM, ERP, RTE, BI, EAI, EDW, KMS

 

2. 사회기반구조로서의 데이터베이스

 - 90년대 사회 각 부분의 정보화가 본격화되면서 데이터베이스 구축이 활발하게 추진

 - 정부를 중심으로 무역, 통관, 물류, 조세, 국세, 조달 등 사회간접자본 차원에서 EDI를 활용하여

   부가가치통신망을 통해 정보망이 구축되기 시작

 - 90년대 후반 지리, 교통부문 데이터베이스가 구축되기 시작해 `00년대에  고도화

   1) 물류 : COV, PORT-MIS

   2) 지리 : GIS, RS, GPS, ITS, LBS, SIM

   3) 의료 : PACS, U헬스

   4) 교육부문 : NEIS

반응형

'회사 생활' 카테고리의 다른 글

통계 Tool.  (0) 2020.07.21
통계란?  (0) 2020.07.21