본문 바로가기

데이터베이스

[Database] 데이터베이스(DB)

 

데이터(Data)

현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실(fact)이나 값(value)으로 자료라고도 한다.

정보(Information)

데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물

정보처리(Inforamation processing)

데이터에서 정보를 추출하는 과정 또는 방법

데이터를 상황에 맞게 분석하거나 해석하여 데이터 간의 의미 관계를 파악하는 것

정보 시스템(Information System)

조직운영에 필요한 데이터를 수집하여 저장하였다가 의사결정이 필요할 때 처리하여 유용한 정보를 만드는 수단

// 정보 시스템 안에서 데이터를 보관 후 필요할 때 제공하는 핵심 역할은 DataBase (데이터 베이스)가 담당한다.


데이터 베이스DB; DataBase

특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장''운영'데이터의 집합

1. 공유 데이터 (shared data)

특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있어야하는 공유데이터이다.

2. 통합데이터 (intergrated data)

DB는 데이터 중복성을 허용하지 않는다.

따라서 통합 데이터는 데이터의 중복을 최소화하고 가능한 죽복만 허용하는 데이터이다.

3. 저장데이터 (stored data)

데이터는 컴퓨터가 처리하므로, 컴퓨터가 접근할 수 있는 매체에 DB를 저장해야한다.

4. 운영데이터 (operational data)

DB는 조직 운영과 주요기능 수행을 위해 꼭 필요하므로, 지속적으로 운영해야하는 데이터이다.


데이터베이스의 특징

1. 데이터베이스는 실시간 접근(read-time accessibility)이 가능하다.

DB는 사용자의 데이터 요구에 실시간으로 응답할 수 있어야 하며,

서비스에 유형에 따라 다르지만 평균적으로 몇 초를 넘지 않는 시간 내에 데이터를 제공할 수 있어야한다.

2. 데이터베이스는 계속 변화(continuous evolution)한다.

DB는 끊임없이 변화하는 현실 세계의 상태를 정확히 반영해야 의미가 있다.

따라서, DB는 동적인 특직이 있어 데이터를 계속 삽입, 삭제, 수정하여 현재의 정확한 데이터를 유지해야 한다.

3. 데이터베이스는 동시 공유(concurrent sharing)가 가능하다.

DB는 여러 사용자가 동시 이용이 지원해야 하며,

서로 다른 데이터를 동시에 사용하는 것 뿐만 아니라, 같은 데이터를 동시에 사용하는 것도 모두 지원해야한다.

4. 데이터베이스는 내용으로 참조(content reference)가 가능하다.

DB는 저장된 주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있어야한다.

 


데이터의 형태

1. 정형 데이터(structured data)

구조화된 데이터, 미리 정해진 데이터에 따라 저장된 데이터

ex) 엑셀의 스프레드시트, 관계 데이터베이스의 테이블 등

2. 반정형 데이터(semi-structured data)

구조에 따라 저장된 데이터이지만, 정형데이터와 달리 데이터 내용 안에 구조에 대한 설명이 함께 존재

즉 구조를 파악하는 파싱(passing)과정이 필요하고, 보통 파일 형태로 저장된다.

ex) HTML, XML, JSON 문서나 웹 로그, 센서 데이터 등

3. 비정형 데이터(unstructured data)

정해진 구조가 없이 저장된 데이터

ex) 소설 데이터의 텍스트, 영상, 이미지, 워드나 PDF 문서와 같은 멀티디미어 데이터

스키마(schema)

미리 정해진 데이터 구조, 행렬의 조합으로 이루어진 구조를 스키마라 한다.

내용과 함께 설명된 데이터 구조도 스키마라고 하지만 메타 데이터(metedata)라고도 한다.

'데이터베이스' 카테고리의 다른 글

[SQL] 뷰 view  (0) 2021.01.17
[Database] 데이버베이스 설계  (6) 2021.01.17
[Database] 정규화  (0) 2021.01.17
[참관기] 2019 대한민국 ICT융합 엑스포  (0) 2021.01.17
[Oracle] ORA-01950 오류  (0) 2020.11.03