전처리(Pre-processing): 데이터를 분석하기 위해 데이터를 수집하여 가공하고 처리하는 과정
정형데이터(Structured Data)
- 틀이 잡혀있는 데이터, 체계화된 데이터
- 높은 안정성, 유연하지 못한 구조
- 금융, 제조 등 대부분 기업의 업무용 데이터베이스
비정형 데이터(Unstructured Data)
- 틀이 잡혀있지 않고, 사전 정의가 없는 데이터
- 다양하고 방대한 양의 데이터, 별도의 분석처리 기술이 필요
- 텍스트, 이미지, 음원 데이터, 빅데이터
관계형 데이터베이스
- 열과 행을 갖는 2차원 테이블을 중심으로 설계된 데이터베이스
- 데이터를 ‘키(key)’와 ‘관계’라는 연결고리로 연결하여 원하는 데이터를 조회하고 가공하는 방식의 데이터베이스
계층형 데이터베이스
- 가장 오래된 형태의 데이터베이스
- 개인 컴퓨터의 저장장치에서 주로 사용하는 방식
객체지향 데이터베이스
- 객체 지향 데이터 모델을 지원하는 데이터베이스
XML 데이터베이스
- XML 표준 문서 구조를 계층형 트리 형태로 저장하거나 관리하기 위해 만든 데이터베이스
- 데이터 중심 기반, XML 문서 중심 데이터베이스
- XML 문서 형태로 저장/검증, 문서/요소단위 검색기능, 검색어 색인 저장기술을 활용
- XQuery라는 언어 사용
SQL 언어
- 관계형 데이터베이스를 조작하기 위해 만들어진 표준 언어로, DBMS와 통신하기 위한 언어
- 특징
- 사용하기 쉬움: 구조와 문법 체계가 직관적
- 절차가 없는 비절차적 언어: 실행 순서와 관계없이 처리 내용 기술
- 관계형 데이터베이스의 데이터 조작 가능: 정의, 검색, 조작
- 표준 언어: 다양한 분야에서 응용 가능
관계형 데이터베이스 모델(RDM, Relational Database Model)
- 관계로 데이터를 표현하는 모델
- 데이터 설계가 유연하고, 사용하기 쉬워 빠르게 대중화됨
- 구성요소
- 테이블, 뷰, 인덱스 등의 객체로 구성
- 데이터를 저장하는 개체(entity)와 관계(relation)들의 집합
- 일관성, 정확성, 신뢰성을 위한 트랜잭션, 무결성, 동시성 제어 등의 개념이 존재
테이블
- 역할
- 데이터 저장, 관리
- 데이터의 접근 통제, 검색/삽입/수정/삭제를 위한 체계 제공
- 관계형 데이터베이스에서 가장 기본이 되는 저장구조
- 행과 열로 구성
- 열: 데이터의 속성을 대표하는 한 종류의 데이터 타입(자료형)만을 가짐
- 행: 각 항목의 개별 값 저장
모두의 SQL | 김도연 - 교보문고
모두의 SQL | 난생처음 SQL로 데이터를 분석하고 가공해야 한다면? 초보자와 비전공자를 위한 가장 쉬운 SQL 입문서 인터넷이 발전하고 페이스북과 같은 소셜 미디어가 활성화되면서 데이터로 모
product.kyobobook.co.kr
'Dev Books Review > 모두의 SQL' 카테고리의 다른 글
[모두의 SQL] 7장. 서브쿼리: SELECT 문 안에 있는 SELECT 문 (0) | 2023.01.11 |
---|---|
[모두의 SQL] 6장. 조인과 집합 (0) | 2023.01.11 |
[모두의 SQL] 5장. ERD: 데이터베이스 개체 설계도 (0) | 2023.01.11 |
[모두의 SQL] 4장. 함수: 함수로 데이터 가공 (0) | 2023.01.11 |
[모두의 SQL] 3장. SELECT: 데이터 조회의 기본 (0) | 2023.01.11 |