📊 데이터의 정의 (ADsP 핵심 정리)
💡 **데이터(Data)**란 무엇일까요?
우리가 매일 다루는 숫자, 문자, 기록들이 모두 데이터입니다.
하지만 데이터는 단순한 ‘값’ 이상의 의미를 가집니다.
ADsP 자격시험에서는 이 개념을 **“정보의 원재료”**로 이해하는 것이 핵심이에요.
🧩 1️⃣ 데이터의 어원과 기본 개념
📘 어원
- ‘데이터(Data)’는 **라틴어 dare(주다)**의 과거분사형 datum(주어진 것)에서 유래했어요.
- 즉, 데이터는 **“주어진 사실(Given Fact)”**을 의미합니다.
📊 정의
데이터란 관찰, 측정, 조사 등을 통해 얻어진 **객관적 사실(fact)**로,
의미가 부여되기 전의 값(value) 입니다.
✅ 핵심 키워드
가공 전 / 원시자료(raw data) / 의미 없음 / 정보의 원재료 / 객관적 사실
💡 2️⃣ 데이터의 본질적인 특성
| 구분 | 설명 |
| 존재적 특성 | 데이터는 현실 세계를 반영하는 객관적 사실이다. |
| 당위적 특성 | 데이터는 추론·예측·판단의 근거가 된다. |
| 표현적 특성 | 수치, 문자, 기호 등으로 현실을 표현한다. |
| 의존적 특성 | 맥락(Context)과 목적(Purpose)이 결합되어야 의미가 생긴다. |
💬 즉, 데이터는 “그 자체로 의미가 없고”,
가공되고 해석될 때 비로소 정보로 전환됩니다.
🧮 3️⃣ 데이터의 구성 요소
| 구성요소 | 설명 | 예시 |
| 값(Value) | 실제 측정된 내용 | 23, ‘남성’, ‘서울’ |
| 대상(Unit) | 관측의 단위 | 고객, 제품, 거래 |
| 변수(Attribute) | 측정 항목 | 나이, 매출액, 지역 |
| 단위(Unit of Measure) | 측정 기준 | 원, 개, ℃ |
| 맥락(Context) | 언제·어디서·무엇을 측정했는가 | 2025년 10월, 서울 매장 기준 |
📌 데이터 = 값 + 대상 + 변수 + 단위 + 맥락
📊 4️⃣ 데이터의 분류
✅ (1) 수집 방법 기준
| 구분 | 정의 | 예시 | 특징 |
| 일차 데이터 | 직접 조사·실험으로 얻은 데이터 | 설문, 실험결과 | 목적 적합성 ↑ / 비용·시간 ↑ |
| 이차 데이터 | 기존에 수집된 데이터 활용 | 통계청, 공공데이터, 매출DB | 접근성 ↑ / 정확성 검증 필요 |
🔸 실무 대부분은 이차데이터(Secondary Data) 를 사용합니다.
✅ (2) 형태 기준
| 구분 | 설명 | 예시 |
| 정형(Structured) | 행·열 형태의 구조화 데이터 | 엑셀, DB 테이블 |
| 반정형(Semi-structured) | 부분 구조화 | XML, JSON, 로그 |
| 비정형(Unstructured) | 일정한 형식 없음 | 이미지, 영상, SNS 글 |
📘 시험 포인트: JSON은 반정형 데이터입니다.
✅ (3) 측정 척도 기준
| 척도 | 의미 | 예시 | 연산 가능 |
| 명목척도(Nominal) | 구분만 가능 | 성별, 지역코드 | =, ≠ |
| 서열척도(Ordinal) | 순서 의미 있음 | 만족도, 학년 | >, < |
| 등간척도(Interval) | 간격 일정, 0 없음 | 섭씨온도 | +, − |
| 비율척도(Ratio) | 절대 0 존재 | 매출, 나이, 거리 | ×, ÷ |
💡 암기법: 명–서–등–비 (연산 가능 범위가 점점 커짐)
🔍 5️⃣ 데이터와 정보의 관계 (DIKW 계층)
| 단계 | 설명 | 예시 |
| 데이터(Data) | 의미 부여 전의 사실 | “매출액 500만 원” |
| 정보(Information) | 데이터를 가공해 의미 부여 | “전월 대비 매출 20% 증가” |
| 지식(Knowledge) | 정보를 경험과 결합해 체계화 | “매출 상승 원인은 신규고객 유입” |
| 지혜(Wisdom) | 지식을 기반으로 판단·결정 | “신규고객 유지를 위한 전략 수립” |
📌 핵심:
데이터 → 정보 → 지식 → 지혜 순서로 발전하며,
**데이터는 ‘정보의 원재료’**라는 점이 ADsP 시험의 포인트입니다.
🧭 6️⃣ 데이터의 품질 요소 (Quality Characteristics)
| 요소 | 설명 | 예시 |
| 정확성(Accuracy) | 사실과 일치 | 오류·오타 없음 |
| 일관성(Consistency) | 모순 없음 | 고객ID 중복 X |
| 적시성(Timeliness) | 최신 데이터 반영 | 실시간 업데이트 |
| 완전성(Completeness) | 결측값 없이 충분 | 누락 없는 매출기록 |
| 유효성(Validity) | 형식·규칙에 맞음 | 전화번호 형식 일치 |
💡 암기법: “정·일·적·완·유”
데이터 품질은 분석 신뢰도를 결정하는 가장 중요한 요소입니다.
🧠 7️⃣ 데이터 정의 확장 — 실무 관점에서 보기
| 관점 | 설명 | 예시 |
| 기술적 관점 | 디지털 형태의 저장된 신호 | 0과 1의 비트 |
| 경영적 관점 | 의사결정의 원천 자원 | 고객·매출 데이터 |
| 사회적 관점 | 인간 행동의 흔적 | SNS 게시물, 위치 데이터 |
✅ 데이터는 “현실 세계를 기록한 디지털 자산”이자,
기업의 경쟁력을 좌우하는 핵심 자원입니다.
✨ 한 줄 요약
데이터란 **“의미가 부여되기 전의 객관적 사실로, 정보의 원재료이며 의사결정의 근거가 되는 값”**입니다.
📚 ADsP 시험 포인트 정리
✅ 데이터의 정의 — 의미 부여 전의 객관적 사실
✅ DIKW 계층 — 데이터→정보→지식→지혜
✅ 데이터 품질 요소 — 정·일·적·완·유
✅ 데이터 형태 — 정형·반정형·비정형
✅ 척도 유형 — 명목, 서열, 등간, 비율
✅ 이차데이터 활용 — 실무 중심 출제
💬 Tip:
“데이터는 가공되지 않은 사실, 정보는 가공된 의미”
— 이 문장은 ADsP 서술형에서 그대로 써도 좋은 표현입니다 💯