7주차 TIL - 변수와 가설을 넘어서~
해당 환경정보의 최적조건을 찾기 위해 머신러닝을 실시
결론적으로 최적조건을 적용하면 1등급 토마토 생산량이 늘어날 것이다.
라는 가설을 토대로 프로젝트 데이터 분석
📌 과실 생장(frtstGrupp)과 출하량(outtrn)의 관계 분석 결과
- 시각적 분석: 과실 생장(frtstGrupp)이 증가할수록 출하량(outtrn)도 증가하는 경향이 뚜렷하게 나타남.
- 상관계수: 0.6421 (강한 양의 상관관계)
→ 과실 생장이 활발할수록 출하량이 증가할 가능성이 높음.
# 다시 데이터 불러오기
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 데이터 로드
prod_df = pd.read_csv(prod_path, encoding="cp949")
grow_df = pd.read_csv(grow_path, encoding="cp949")
eguse_df = pd.read_csv(eguse_path, encoding="cp949")
# 데이터 병합
merged_df = prod_df.merge(grow_df, on=["measDate", "farm_cde"], how="left")
merged_df = merged_df.merge(eguse_df, on=["measDate", "farm_cde"], how="left")
# '1등급' 품질만 필터링
df = merged_df[merged_df["itemGrade"] == "1등급"]
# ------------------------------
과실 생장(frtstGrupp)과 출하량(outtrn)의 관계 분석
# ------------------------------
plt.figure(figsize=(8, 5))
sns.scatterplot(x=df["frtstGrupp"], y=df["outtrn"], color="purple", alpha=0.5)
plt.xlabel("과실 생장 (frtstGrupp)")
plt.ylabel("출하량 (outtrn)")
plt.title("과실 생장(frtstGrupp)과 출하량(outtrn)의 관계")
plt.grid()
plt.show()
# 상관관계 분석
frtstGrupp_corr = df[["frtstGrupp", "outtrn"]].corr().iloc[0, 1]
frtstGrupp_corr
✅ 결론
- 과실 생장(frtstGrupp)이 출하량(outtrn)에 중요한 영향을 미친다는 증거가 강함.
- 추가 분석 가능: 특정 시점에서 과실 생장이 급격히 증가하는 패턴이 존재하는지 확인할 수도 있음.