카테고리 없음

4주차 TIL - 타이타닉 복습

게임취업하고싶은 사람 2025. 1. 3. 20:48

이번엔 좌석등급별 생존자 시각화 데이터를 만들어보았다 

 

# 필요한 라이브러리 임포트
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 타이타닉 데이터 로드
df = sns.load_dataset('titanic')

# 결측값 제거
df_clean = df.dropna(subset=['pclass', 'survived'])

# Pclass별 생존율 계산
pclass_survival_rate = df_clean.groupby('pclass')['survived'].mean()

# 시각화
plt.figure(figsize=(8, 6))
sns.barplot(x=pclass_survival_rate.index, y=pclass_survival_rate.values, palette='viridis')

# 그래프 설정
plt.title('Survival Rate by Pclass', fontsize=16)
plt.xlabel('Passenger Class (Pclass)', fontsize=12)
plt.ylabel('Survival Rate', fontsize=12)
plt.xticks([0, 1, 2], ['1st Class', '2nd Class', '3rd Class'], fontsize=10)
plt.ylim(0, 1)
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.show()