📚FOS Study
홈카테고리
홈카테고리

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • agents 페이지로 이동
    • langgraph 페이지로 이동
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
  • architecture 페이지로 이동
    • 캐시 설계 전략 총정리
    • 디자인 패턴
    • 분산 트랜잭션
  • css 페이지로 이동
    • FlexBox 페이지로 이동
  • database 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • 커넥션 풀 크기는 얼마나 조정해야할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • monitoring 페이지로 이동
    • Envoy Proxy
    • Graceful Shutdown
  • go 페이지로 이동
    • Go 언어 기본 학습
  • http 페이지로 이동
    • HTTP Connection Pool
  • interview 페이지로 이동
    • 210812 페이지로 이동
    • 뱅크샐러드 AI Native Server Engineer
    • CJ 올리브영 커머스플랫폼유닛 Back-End 개발 지원 자료
    • 마이리얼트립 - Platform Solutions실 회원주문개발 Product Engineer
    • NHN 서비스개발센터 AI서비스개발팀
    • nhn gameenvil console backend 직무 인터뷰 준비
    • 면접을 대비해봅시다
    • 토스증권 Server Developer (Platform) 지원 자료
    • 토스증권 Server Developer (Product) 지원 자료
    • 토스뱅크 Server Developer (Product) 지원 자료
    • Tossplace Node.js Developer
    • 토스플레이스 Node.js 백엔드 컬처핏
  • java 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • OpenTelemetry 란 무엇인가?
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • Data_Structures_and_Algorithms 페이지로 이동
    • Heap 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node.js
    • npm vs pnpm 선택기준은 무엇인가요?
    • `setImmediate()`
  • kafka 페이지로 이동
    • Kafka 기본
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • 메시지 전송 신뢰성
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • react 페이지로 이동
    • JSX 페이지로 이동
    • VirtualDOM 페이지로 이동
    • v16 페이지로 이동
  • resume 페이지로 이동
    • CJ 올리브영 지원 문항
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
📚FOS Study

개발 학습 기록을 정리하는 블로그입니다.

바로가기

  • 홈
  • 카테고리

소셜

  • GitHub
  • Source Repository

© 2025 FOS Study. Built with Next.js & Tailwind CSS

목록으로 돌아가기
🗄️database/ 김영한의-실전-데이터베이스-설계

1장. 데이터베이스 설계의 중요성

약 4분
2026년 2월 10일
2026년 4월 2일 수정
GitHub에서 보기

1장. 데이터베이스 설계의 중요성

Java나 Python 같은 애플리케이션 코드는 상대적으로 수정하기 쉽다. 최신 프레임워크와 아키텍처 패턴 덕분에 기능 개선이나 코드 리팩토링이 과거보다 훨씬 유연해졌다. 하지만 데이터베이스 스키마, 즉 테이블의 구조는 한번 잘못 만들어지면 바로잡는 데 엄청난 비용과 시간이 소요된다.

1. 잘못된 설계가 부르는 재앙

'나쁜 설계'가 실제로 어떤 재앙을 불러오는지 구체적인 사례를 통해 알아보자. 이제 막 시작한 스타트업 '쇼핑몰'이 있다고 가정하자. 빠르게 서비스를 출시하기 위해 고객과 주문 정보를 관리하기 위해 다음과 같이 orders 테이블 하나에서 모든 정보를 관리하고 있다.

orders 테이블 구조

  • order_id : 주문 번호
  • customer_id : 고객 아이디
  • customer_name : 고객 이름
  • customer_address : 고객 주소
  • product_id : 상품 번호
  • product_name : 상품 이름
  • product_price : 상품 가격
  • ordered_at : 주문 날짜

겉보기에는 문제가 없어보인다. 지금부터 이 설계가 어떤 문제를 안고있는지 하나씩 살펴보자.

2. 나쁜 설계의 3대 문재점

바로 데이터 무결성 훼손, 성능 저하, 그리고 유지 보수 비용 증가다.

  • 1. 데이터 무결성 훼손 (신뢰도 하락)

    • 데이터 중복:
      • 주문할 때마다 고객 정보가 반복해서 저장된다.
      • 수백만 건의 주문이 쌓인다면 어떨까? 엄청난 양의 데이터가 불필요하게 중복되어 저장 공간을 낭비하게 된다.
    • 수정 이상 (Update Anomaly):
      • 어느날 고객이 이사를 가서 주소를 변경해달라고 요청한다. 그런데 데이터 변경 중 누락이 발생했다면?
      • 이제 이 데이터는 더 이상 신뢰할 수 없는 상태가 된다.
      • 하나의 정보를 바꾸기 위해 여러 레코드를 수정해야하고, 그 과정에서 일부가 누락될 떄 데이터 불일치가 발생하는 현상이다.
    • 삽입 이상 (Insertion Anomaly):
      • 쇼핑몰이 사업을 확장해서, 아직 주문은 하지 않았찌만 마케팅 수신에 동의한 잠재 고객을 미리 등록하고 싶어졌다.
      • 이 고객은 아직 주문한 적이 없으므로 주문 관련 정보는 없다.
      • 이 테이블 구조에서는 주문을 하지 않으면 고객 정보를 등록할 수 없는 모순이 발생한다.
    • 삭제 이상 (Deletion Anomaly):
      • 시간이 흘러 고객이 탈퇴를 요청했다. 법적인 보관 기간이 지나 그의 주문 기록을 삭제해야하는 상황이다.
      • DELETE 쿼리로 주문정보를 삭제하면 해당 고객이 우리 쇼핑몰을 이용했다는 고객 정보 자체가 시스템에서 완전히 사라져 버린다
      • 이처럼 특정 정보를 삭제했을 뿐인데, 유지되어야 할 다른 중요한 정보까지 연쇄적으로 삭제되는 현상을 삭제 이상이라고 한다.
  • 2. 성능 저하

    • 느려지는 조회 속도:
      • 고객의 주문 목록을 조회하는 간단한 쿼리를 생각해보자.
      • 이 쿼리는 매번 거대한 orders 테이블 전체를 뒤져야 한다. 고객 정보, 상품 정보, 주문 정보가 모두 한 테이블에 섞여 있으니 테이블이 '뚱뚱'해진다.
      • 디스크에서 읽어야 할 데이터 양이 많아지니 당연히 속도가 느려진다.
  • 3. 유지보수 비용 증가(확장성 저하)

    • 작은 변경의 큰 파급효과:
      • 고객별 등급을 관리하고 싶다는 새로운 요구사항을 제시했다. 이 간단한 '등급' 정보를 추가하려면 어떻게 해야할까?
      • orders 테이블에 customer_grade라는 컬럼을 추가해야 한다.

3. 설계의 3단계 - 개념, 논리, 물리

  • 1. 개념적 설계 (Conceptual Design)
    • 목표 : 비즈니스의 아이디어나 요구 사항을 이해하고 밑그림을 그리는 단계.
    • 핵심 질문 : 우리가 다루어야 할 데이터는 무엇이며(Entity), 그 데이터들은 서로 어떤 관계(Relationship)을 맺고 있는가?
    • 산출물 :
      • ERD(Entity-Relationship Diagram) 사람의 눈으로 이해하기 쉬운 형태의 설계도
      • 고객은 주문을 할 수 있고, 주문에는 여러 개의 상품이 포함될 수 있다는 식의 관계를 그림으로 표현한다.
  • 2. 논리적 설계 (Logical Design)
    • 목표 : 개념적 설계에서 만든 밑그림을, RDBMS의 원리에 맞게 구체적인 구조로 다듬는 단계이다.
      • 특정 RDBMS에 종속되지 않는, 순수한 논리적인 데이터 구조를 만든다.
    • 핵심 질문 :
      • "개념 모델의 각 요소들을 어떤 테이블(Table) 구조로 표현할 것인가?"
      • "데이터의 중복을 막고 관계를 명확히 하기 위해 어떤 규칙(정규화)을 적용해야 하는가?"
    • 산출물 : 정규화된 테이블 스키마
      • 각 테이블이 어떤 컬럼들을 가질지, 기본키와 외래키는 무엇을로 할지 등을 명확하게 정의한다.
  • 3. 물리적 설계 (Physical Design)
    • 목표 : 논리적 설계에서 만든 테이블 스키마를, 실제 우리가 사용할 특정 RDBMS의 특성에 맞게 최적화 하여 구현하는 마지막 단계이다.
    • 핵심 질문:
      • "각 컬럼에 어떤 데이터 타입(VARCHAR, INT, DATETIME 등)을 할당해야 가장 효율적일까?"
      • "어떤 컬럼에 인덱스를 설정해야 조회 속도가 빨라질까?"
    • 산출물 : 물리적인 테이블 정의서, SQL 스크립트(CREATE TABLE ...)

용어 정리

개념, 논리, 물리 각각의 설계 모델에서 사용하는 용어

구분개념 모델논리 모델물리 모델액셀 비유쇼핑몰 예시
저장 구조엔티티(Entity)릴레이션(Relation)테이블(Table)시트(Sheet)회원(user)
세부 항목속성(Attribute)속성(Attribute)열, 컬럼(Column)열(Column)회원의 이름, 주소 (user.name)
데이터 단위인스턴스(Instance)튜플(Tuple)행(Row, Record)행(Row)'김병태'회원

각 모델링 단계마다 용어가 다른 이유는 각 단계가 가진 고유한 목표와 바라보는 관점이 다르기 때문이다.


참고:

릴레이션(Relation)

릴레이션은 관계형 데이터 베이스의 이론적 모델에서 '테이블(Table)'을 부르는 공식적인 이름이다.
릴레이션은 데이터가 저장되는 2차원 테이블 그 자체로 수학적 집합 개념을 의뜻한다.
관계형 데이터베이스는 '릴레이션(테이블)의 집합으로 구성된 데이터베이스'를 의미하며, 이 릴레이션들을 이용해 데이터간의 관계(Relationship)를 표현하는 것이다.
database 카테고리의 다른 글 보기수정 제안하기

댓글

댓글을 불러오는 중...
  • 1장. 데이터베이스 설계의 중요성
  • 1. 잘못된 설계가 부르는 재앙
  • 2. 나쁜 설계의 3대 문재점
  • 3. 설계의 3단계 - 개념, 논리, 물리
  • 용어 정리