카테고리 없음

IT직종의 데이터 분석에서 많이 사용하는 용어 정리

게임취업하고싶은 사람 2024. 12. 18. 16:32

1. 데이터 수집 및 저장

  • ETL (Extract, Transform, Load)
    데이터를 추출(Extract), 변환(Transform), 적재(Load)하여 데이터베이스 또는 데이터 웨어하우스에 저장하는 프로세스.
  • 데이터 웨어하우스 (Data Warehouse)
    대규모 데이터를 저장하고 분석하기 위해 설계된 중앙 저장소.
  • 데이터 레이크 (Data Lake)
    정형, 반정형, 비정형 데이터를 원래 형태 그대로 저장하는 시스템.

2. 데이터 처리 및 분석

  • EDA (Exploratory Data Analysis)
    데이터를 탐색하고 이해하며, 주요 특징과 패턴을 파악하는 과정.
  • 피처 엔지니어링 (Feature Engineering)
    머신러닝 모델의 성능을 향상시키기 위해 데이터의 주요 특징(피처)을 생성하고 변환하는 작업.
  • 모델링 (Modeling)
    데이터를 기반으로 예측, 분류, 또는 군집화하는 통계적 또는 머신러닝 모델을 생성하는 과정.

3. 데이터 시각화

  • 대시보드 (Dashboard)
    데이터를 그래프, 차트 등으로 시각화하여 의사결정자가 한눈에 이해할 수 있도록 제공하는 인터페이스.
  • BI (Business Intelligence)
    데이터를 분석 및 시각화하여 비즈니스 의사결정을 지원하는 기술과 도구.

4. 빅데이터와 관련된 용어

  • 빅데이터 (Big Data)
    크기(Volume), 속도(Velocity), 다양성(Variety) 등으로 기존 데이터 처리 도구로는 분석하기 어려운 대규모 데이터.
  • 분산 처리 (Distributed Processing)
    대규모 데이터를 처리하기 위해 여러 컴퓨터에서 작업을 분산 수행하는 기술.
  • Hadoop
    빅데이터 저장 및 처리에 사용되는 오픈소스 프레임워크.
  • Spark
    실시간 데이터 처리와 빠른 빅데이터 처리를 지원하는 클러스터 컴퓨팅 프레임워크.

5. 머신러닝 및 AI

  • 머신러닝 (Machine Learning)
    데이터를 기반으로 시스템이 학습하여 예측이나 의사결정을 수행하는 기술.
  • 딥러닝 (Deep Learning)
    인공신경망을 사용하여 데이터를 분석하고 학습하는 머신러닝의 하위 분야.
  • 훈련 데이터 (Training Data)
    모델을 학습시키기 위해 사용하는 데이터.

6. 데이터 품질 및 관리

  • 결측치 (Missing Values)
    데이터 세트에서 누락된 값으로, 분석 결과에 영향을 미칠 수 있음.
  • 정규화 (Normalization)
    데이터 범위를 일정하게 조정하거나, 데이터의 분포를 일정하게 만드는 작업.
  • 데이터 클렌징 (Data Cleansing)
    데이터에서 오류, 중복, 결측치를 제거하거나 수정하는 과정.

7. 클라우드 및 데이터 분석 플랫폼

  • AWS (Amazon Web Services)
    클라우드 기반의 데이터 저장, 분석, AI 서비스 등을 제공하는 플랫폼.
  • Google BigQuery
    대규모 데이터를 쿼리하고 분석할 수 있는 Google 클라우드 기반 데이터 웨어하우스 서비스.
  • Azure Synapse Analytics
    Microsoft Azure의 데이터 통합, 분석 및 관리 플랫폼.

8. 기타 데이터 분석 용어

  • SQL (Structured Query Language)
    데이터베이스에서 데이터를 쿼리하고 조작하기 위한 언어.
  • API (Application Programming Interface)
    데이터와 기능을 다른 애플리케이션에 제공하는 인터페이스.
  • A/B 테스트
    두 가지 옵션을 비교하여 최적의 결과를 찾기 위한 실험 방법.
  • RFM 분석 (Recency, Frequency, Monetary)
    고객 행동을 분석하기 위해 최근성(Recency), 빈도(Frequency), 금액(Monetary)을 기반으로 한 분석.