데이터의 정의_ADsP 1과목

📊 데이터의 정의 (ADsP 핵심 정리)

💡 **데이터(Data)**란 무엇일까요?

우리가 매일 다루는 숫자, 문자, 기록들이 모두 데이터입니다.

하지만 데이터는 단순한 ‘값’ 이상의 의미를 가집니다.

ADsP 자격시험에서는 이 개념을 **“정보의 원재료”**로 이해하는 것이 핵심이에요.


🧩 1️⃣ 데이터의 어원과 기본 개념

📘 어원

  • ‘데이터(Data)’는 **라틴어 dare(주다)**의 과거분사형 datum(주어진 것)에서 유래했어요.
  • 즉, 데이터는 **“주어진 사실(Given Fact)”**을 의미합니다.

📊 정의

데이터란 관찰, 측정, 조사 등을 통해 얻어진 **객관적 사실(fact)**로,

의미가 부여되기 전의 값(value) 입니다.

핵심 키워드

가공 전 / 원시자료(raw data) / 의미 없음 / 정보의 원재료 / 객관적 사실


💡 2️⃣ 데이터의 본질적인 특성

구분설명
존재적 특성데이터는 현실 세계를 반영하는 객관적 사실이다.
당위적 특성데이터는 추론·예측·판단의 근거가 된다.
표현적 특성수치, 문자, 기호 등으로 현실을 표현한다.
의존적 특성맥락(Context)과 목적(Purpose)이 결합되어야 의미가 생긴다.

💬 즉, 데이터는 “그 자체로 의미가 없고”,

가공되고 해석될 때 비로소 정보로 전환됩니다.


🧮 3️⃣ 데이터의 구성 요소

구성요소설명예시
값(Value)실제 측정된 내용23, ‘남성’, ‘서울’
대상(Unit)관측의 단위고객, 제품, 거래
변수(Attribute)측정 항목나이, 매출액, 지역
단위(Unit of Measure)측정 기준원, 개, ℃
맥락(Context)언제·어디서·무엇을 측정했는가2025년 10월, 서울 매장 기준

📌 데이터 = 값 + 대상 + 변수 + 단위 + 맥락


📊 4️⃣ 데이터의 분류

✅ (1) 수집 방법 기준

구분정의예시특징
일차 데이터직접 조사·실험으로 얻은 데이터설문, 실험결과목적 적합성 ↑ / 비용·시간 ↑
이차 데이터기존에 수집된 데이터 활용통계청, 공공데이터, 매출DB접근성 ↑ / 정확성 검증 필요

🔸 실무 대부분은 이차데이터(Secondary Data) 를 사용합니다.


✅ (2) 형태 기준

구분설명예시
정형(Structured)행·열 형태의 구조화 데이터엑셀, DB 테이블
반정형(Semi-structured)부분 구조화XML, JSON, 로그
비정형(Unstructured)일정한 형식 없음이미지, 영상, SNS 글

📘 시험 포인트: JSON은 반정형 데이터입니다.


✅ (3) 측정 척도 기준

척도의미예시연산 가능
명목척도(Nominal)구분만 가능성별, 지역코드=, ≠
서열척도(Ordinal)순서 의미 있음만족도, 학년>, <
등간척도(Interval)간격 일정, 0 없음섭씨온도+, −
비율척도(Ratio)절대 0 존재매출, 나이, 거리×, ÷

💡 암기법: 명–서–등–비 (연산 가능 범위가 점점 커짐)


🔍 5️⃣ 데이터와 정보의 관계 (DIKW 계층)

단계설명예시
데이터(Data)의미 부여 전의 사실“매출액 500만 원”
정보(Information)데이터를 가공해 의미 부여“전월 대비 매출 20% 증가”
지식(Knowledge)정보를 경험과 결합해 체계화“매출 상승 원인은 신규고객 유입”
지혜(Wisdom)지식을 기반으로 판단·결정“신규고객 유지를 위한 전략 수립”

📌 핵심:

데이터 → 정보 → 지식 → 지혜 순서로 발전하며,

**데이터는 ‘정보의 원재료’**라는 점이 ADsP 시험의 포인트입니다.


🧭 6️⃣ 데이터의 품질 요소 (Quality Characteristics)

요소설명예시
정확성(Accuracy)사실과 일치오류·오타 없음
일관성(Consistency)모순 없음고객ID 중복 X
적시성(Timeliness)최신 데이터 반영실시간 업데이트
완전성(Completeness)결측값 없이 충분누락 없는 매출기록
유효성(Validity)형식·규칙에 맞음전화번호 형식 일치

💡 암기법: “정·일·적·완·유”

데이터 품질은 분석 신뢰도를 결정하는 가장 중요한 요소입니다.


🧠 7️⃣ 데이터 정의 확장 — 실무 관점에서 보기

관점설명예시
기술적 관점디지털 형태의 저장된 신호0과 1의 비트
경영적 관점의사결정의 원천 자원고객·매출 데이터
사회적 관점인간 행동의 흔적SNS 게시물, 위치 데이터

✅ 데이터는 “현실 세계를 기록한 디지털 자산”이자,

기업의 경쟁력을 좌우하는 핵심 자원입니다.


✨ 한 줄 요약

데이터란 **“의미가 부여되기 전의 객관적 사실로, 정보의 원재료이며 의사결정의 근거가 되는 값”**입니다.


📚 ADsP 시험 포인트 정리

✅ 데이터의 정의 — 의미 부여 전의 객관적 사실

✅ DIKW 계층 — 데이터→정보→지식→지혜

✅ 데이터 품질 요소 — 정·일·적·완·유

✅ 데이터 형태 — 정형·반정형·비정형

✅ 척도 유형 — 명목, 서열, 등간, 비율

✅ 이차데이터 활용 — 실무 중심 출제


💬 Tip:

“데이터는 가공되지 않은 사실, 정보는 가공된 의미”

— 이 문장은 ADsP 서술형에서 그대로 써도 좋은 표현입니다 💯