1. 데이터베이스의 필요성
데이터, data
현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실(fact)이나 값(value)
정보, information
의사 결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물
정보 처리, information processing
데이터에서 정보를 추출하는 과정 또는 방법
지식 피라미드, DIKW 체계
정보 시스템, information system
조직 운영에 필요한 데이터를 수집하여 저장해두었다가 필요할 때 유용한 정보를 만들어 주는 수단
데이터베이스, database
정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할을 담당
2. 데이터베이스의 정의와 특징
데이터베이스의 정의
특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장한 운영 데이터의 집합
통합 데이터, integrated data
중복을 최소화하고 통제 가능한 중복만 허용하는 데이터
공유 데이터, shared data
특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터
저장 데이터, stored data
컴퓨터가 접근할 수 있는 매체에 저장된 데이터
운영 데이터, operational data
조직의 주요 기능을 수행하기 위해 지속적으로 유지해야 하는 데이터
데이터베이스의 특징
실시간 접근성, real-time accessibility
사용자의 데이터 요구에 실시간으로 응답
내용 기반 참조, contents reference
데이터가 저장된 주소나 위치가 아닌 데이터의 내용(content), 값(value)으로 참조
계속 변화, continuous evolution
데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지
동시 공유, concurrent sharing
여러 사용자의 서로 다른 데이터의 동시 사용뿐만 아니라 같은 데이터의 동시 사용도 지원
3. 데이터 과학 시대의 데이터
형태에 따른 데이터 분류
정형 데이터, structured data
미리 정해진 데이터의 구조(스키마)에 따라 저장된 데이터
반정형 데이터, semi-structured data
구조에 따라 저장된 데이터지만 정형 데이터와 달리 데이터 내용 안에 구조에 대한 설명이 함께 존재
구조를 파악하는 파싱(parsing) 과정이 필요
비정형 데이터, unstructured data
정해진 구조가 없이 저장된 데이터
특성에 따른 데이터 분류
명목형 데이터, nominal data
서열이 없는 값을 가지는 데이터
순서형 데이터, ordinal data
서열이 있는 값을 가지는 데이터
이산형 데이터, discrete data
단절된 숫자 값을 가지는 데이터
연속형 데이터, continuous data
연속적으로 이어진 숫자 값을 가지는 데이터
'CS > Database' 카테고리의 다른 글
[데이터베이스 개론] 데이터베이스 관리 시스템 (0) | 2022.05.30 |
---|