2025/02 20

9주차 TIL - 그래서 가설이 뭐여

데이터셋에는 총 1005개의 항목과 31개의 열이 포함되어 있습니다. 주요 열은 다음과 같습니다:지역(Region), 국가(Country.of.Origin), 고도(Altitude), 연도(Harvest.Year) 등과 같은 커피 생산과 관련된 메타데이터.그라인딩 점수(Aroma, Flavor, Aftertaste, Acidity 등), 전체 컵 점수(Cupper.Points, Total.Cup.Points) 등과 같은 품질 관련 지표.**결함(Category.One.Defects, Category.Two.Defects, Quakers)**과 같은 품질 문제.이 데이터를 바탕으로 설정할 수 있는 구체적인 가설 몇 가지는 다음과 같습니다:고도가 커피 품질에 미치는 영향고도가 높은 지역에서 재배된 커피가 더..

카테고리 없음 2025.02.28

9주차 TIL - 아라비카 커피에 대한 도메인 지식

저희가 다루게 된 데이터에는 아라비카 커피와 관련된 품질 및 생산 정보를 포함하고 있고주요 컬럼을 분석한 결과, 다음과 같은 정보를 포함하고 있어용.생산 관련 정보Species: 커피 품종Owner, Company, Producer: 소유자 및 생산자 정보Country.of.Origin, Region, Farm.Name: 생산 국가 및 지역 정보Altitude, altitude_low_meters, altitude_high_meters, altitude_mean_meters: 재배지의 해발 고도Processing.Method: 가공 방법 (예: Washed, Natural 등)품질 평가 관련 정보Aroma, Flavor, Aftertaste, Acidity, Body, Balance: 커피의 주요 관능적..

카테고리 없음 2025.02.27

9주차 TIL - 태블로 지도 시각화

1. 지도 시각화 개요태블로에서 지도(Map) 시각화는 위도(Latitude)와 경도(Longitude) 데이터를 사용해 공간 데이터를 시각적으로 표현하는 기능입니다. 국가, 도시, 우편번호, 주소, 위경도 좌표 등의 위치 데이터를 활용해 다양한 형태의 지도를 만들 수 있습니다.2. 지도 시각화 기본 과정1) 데이터 불러오기태블로를 실행하고 Connect 패널에서 CSV, Excel, 데이터베이스 등의 파일을 불러옵니다.데이터에 위치 정보(예: 나라, 도시, 위경도 좌표)가 포함되어 있어야 합니다.2) 지도에서 사용할 필드 지정Data 패널에서 위도(Latitude)와 경도(Longitude) 필드가 자동으로 지리적 역할(Geographical Role) 로 인식되는지 확인합니다.만약 자동으로 인식되지 ..

카테고리 없음 2025.02.26

9주차 TIL - 실전 프로젝트 시작

Kaggle의 "Smart Logistics Supply Chain Analysis" 노트북으로, 물류 및 공급망 데이터를 분석하는 과정을 담고 있습니다. 이 노트북은 Python을 사용하여 데이터 전처리, 탐색적 데이터 분석(EDA), 시각화, 그리고 머신러닝 모델링을 수행합니다.1. 데이터 로드 및 라이브러리 임포트: 분석을 시작하기 위해, pandas, numpy, matplotlib, seaborn 등 필수 라이브러리를 임포트하고, 데이터를 pandas의 DataFrame으로 로드합니다.2. 데이터 전처리: 결측치 처리, 중복 데이터 제거, 데이터 타입 변환 등의 작업을 통해 데이터를 분석에 적합한 형태로 정제합니다.3. 탐색적 데이터 분석(EDA): 데이터의 분포, 상관관계 등을 파악하기 위해 ..

카테고리 없음 2025.02.25

9주차 TIL - 스트림릿이 뭐야?

1. 개발 환경 준비VS Code 설치: VS Code가 설치되어 있지 않다면 VS Code 공식 사이트에서 설치하세요.Python 설치 및 확장 프로그램: Python이 설치되어 있는지 확인하고, VS Code 내 Python 확장을 설치하세요.가상 환경 설정: 프로젝트 폴더에서 가상 환경을 만들어 관리하면 좋습니다. 예를 들어, 터미널에서 아래와 같이 실행할 수 있습니다. Windows: venv\Scripts\activatemacOS/Linux: source venv/bin/activate2. 스트림릿 설치3. 스트림릿 앱 파일 생성프로젝트 폴더 내에 app.py 파일을 생성하고, 아래 예시와 같이 기본 코드를 작성합니다.4. 스트림릿 앱 실행VS Code 터미널 사용: VS Code 내 터미널을 ..

카테고리 없음 2025.02.24

8주차 TIL - 태블로 매개변수, 계산된 필드 만들기

대시보드에서 시계열 그래프가 특정 날짜로 이동하면계속 제자리에 머무는 경우가 있는데그럴 경우에는 매개 변수와 계산된 필드를 이용해서 해결하시면 됩니다!✅ 1. '선택 날짜' 매개변수 생성"선택 날짜"는 사용자가 직접 선택할 수 있는 **매개변수(Parameter)**입니다.칼럼이 아니라, 새롭게 만들어야 하는 사용자 지정 값입니다.📌 '선택 날짜' 매개변수 만들기데이터 패널에서 마우스 우클릭 → "매개변수 생성(Create Parameter)" 선택매개변수 설정:이름: 선택 날짜데이터 유형: 날짜(Date)허용값: 모든 값(All Values)기본값: 2022-11-07 (예제 값)확인(OK) 클릭하여 매개변수 생성 ✅ 2. '선택 날짜' 매개변수를 계산된 필드에서 사용매개변수가 만들어졌다면, 이제 계..

카테고리 없음 2025.02.21

8주차 TIL - 스마트팜 대시보드 만들기~(트리맵)

Tableau에서 "일자별 에너지 사용량 Tree Map"을 만드는 방법Tree Map은 각 항목의 상대적인 크기를 면적으로 표현하는 시각화 방법으로, 에너지 사용량을 직관적으로 비교하는 데 적합합니다.아래 단계대로 진행하면 Tableau에서 원하는 Tree Map을 만들 수 있다.1. Tableau에서 Tree Map 만들기① 새로운 워크시트(Sheet) 추가Tableau에서 새로운 워크시트(Sheet) 를 생성합니다.② 데이터 필드 추가"측정일"을 행(Columns) 선반에 추가시간에 따른 에너지 사용량을 확인할 수 있도록 함."CO2사용량(L)", "물사용량(L)", "비료사용량(L)"을 "Measure Values(측정값)"로 추가"Measure Values"는 여러 측정값을 하나의 차트에서 표현..

카테고리 없음 2025.02.20

8주차 TIL - 실무에서 대시보드 활용 방법

1. 학습 목표실습을 마친 후, 실무에서 활용하는 대시보드의 종류와 지속적인 운영 방법을 학습데이터 기반 의사결정을 돕기 위한 데이터 스토리텔링 기법 소개2. 실무 대시보드 종류다양한 비즈니스 영역에서 활용되는 대시보드 유형과 그 역할을 설명합니다.매출 대시보드OKR 체크, 매출 현황 분석, 매출 증감 원인 파악주요 KPI(매출, 비용, 순이익 등) 시각화프로덕트(Product) 대시보드AARRR 프레임워크, 퍼널 분석, 코호트 분석 등 사용자 행동 데이터 기반 분석마케팅 프로모션 대시보드캠페인 성과 분석, ROI(투자 대비 수익) 측정, 시즌별 프로모션 비교실험 대시보드A/B 테스트 결과 비교 (CVR, CTR 등)실험군과 대조군 비교 및 세그먼트별 분석머신러닝 모델 모니터링 대시보드머신러닝 모델 A/..

카테고리 없음 2025.02.19

8주차 TIL - 태블로 대시보드 구성 요소

대시보드 설계와 구성 요약1. 학습 목표대시보드의 목적과 지표를 설정하는 방법을 익히고, 전체적인 설계 프로세스를 학습.2. 대시보드 구축 프로세스대시보드 뷰어 및 목적 선정 – 대상 사용자와 목적을 정의.문제 정의 – 해결하려는 문제와 대시보드의 활용 목적을 명확히 설정.데이터 선정 및 데이터 마트 구축 – 필요한 데이터(매출, 고객 등)를 선택.지표 선정 – 핵심 성과 지표(KPI)를 결정.스케치 – 레이아웃 및 색상 강조 방안 설정.시각화 – 적절한 그래프 및 시각적 요소 적용.대시보드 완성 – 최종 구성 완료.의사결정 및 액션 도출 – 대시보드 활용 방안 도출.배포 및 권한 설정 – 뷰어 권한 관리 및 대시보드 공유.3. 지표 정의 및 선정산업별로 적합한 지표 선정이 중요(예: 이커머스, 모빌리티..

카테고리 없음 2025.02.18

8주차 TIL - 태블로의 계산식 활용

Tableau의 작동 원리 및 LOD (Level of Detail) 계산식 학습실습 데이터: Superstore 예제 데이터 (2020~2023년 커머스 데이터)2. 텍스트 테이블 (데이터 형태)Wide Format Table: 가로로 확장되는 데이터 형태, 비교 및 시각화에 적합Long Format Table: 세로로 길어지는 데이터 형태, 시간에 따른 변화 분석에 적합총계 계산: 열과 행의 합계를 분석 탭에서 표시 가능3. Tableau 필터 작동 원리필터 종류: 추출 필터, 데이터 원본 필터, 컨텍스트 필터, 차원 필터, 측정값 필터, 테이블 계산 필터필터 실행 순서: 특정 순서대로 실행됨 (필터 추가 시 순서 고려 필요)4. 필터 활용법Top N 필터 vs 차원 필터: Top N 필터가 차원 필..

카테고리 없음 2025.02.17