프로젝트5 사무실 내 전력량 예측 - (4) 2022.07.12 - [프로젝트] - 사무실 내 전력량 예측 - (3) 사무실 내 전력량 예측 - (3) 2022.03.24 - [프로젝트] - 사무실 내 전력량 예측 - (2) 사무실 내 전력량 예측 - (2) 2022.03.15 - [프로젝트] - 사무실 내 전력량 예측 (1) 사무실 내 전력량 예측 (1) 2주간 인턴을 하게 된 회사에서 작은 프 studydaily.tistory.com 드디어 분석에 들어간다! 학습을 시키기 위해 Train, Test dataset을 설정한다. 시계열 데이터를 어떻게 하면 잘 나눌 수 있을까 많은 고민을 했지만, 결국 가장 단순한 방법으로 시도해 보았다. sktime library으로 마지막 일주일을 validation set으로 설정 y = data.metera.. 2022. 7. 12. 사무실 내 전력량 예측 - (3) 2022.03.24 - [프로젝트] - 사무실 내 전력량 예측 - (2) 사무실 내 전력량 예측 - (2) 2022.03.15 - [프로젝트] - 사무실 내 전력량 예측 (1) 사무실 내 전력량 예측 (1) 2주간 인턴을 하게 된 회사에서 작은 프로젝트를 진행했었다. 주제는 사무실에서 사용되고 있는 전력량을 예측하는 studydaily.tistory.com 의미 있는 변수 추가하기 요일별, 시간별 전력량 평균 변수 생성 power_mean = pd.pivot_table(train_f, values = 'meterage', index = ['hour', 'day'], aggfunc = np.mean).reset_index() tqdm.pandas() train_f['day_hour_mean'] = trai.. 2022. 7. 12. 사무실 내 전력량 예측 - (2) 2022.03.15 - [프로젝트] - 사무실 내 전력량 예측 (1) 사무실 내 전력량 예측 (1) 2주간 인턴을 하게 된 회사에서 작은 프로젝트를 진행했었다. 주제는 사무실에서 사용되고 있는 전력량을 예측하는 프로젝트! 사무실에서 사용하고있는 전기를 측정해둔 데이터가 있었고 이를 studydaily.tistory.com 결측치 처리하기 그 후, 데이터의 결측치를 확인해 보았다. train.isna().sum() 가장 중요한,, 종속변수 meterage에 결측치가 있었다,,! 종속변수의 결측치를 어떻게 처리할까 많은 고민을 했다. 어디에서 결측치가 있는지 먼저 확인을 해보았다. train[train['meterage'].isnull()] ' 왜 저기에 결측치가 있을까? 이 결측치를 어떻게 처리하지? ' .. 2022. 3. 24. 사무실 내 전력량 예측 (1) 2주간 인턴을 하게 된 회사에서 작은 프로젝트를 진행했었다. 주제는 사무실에서 사용되고 있는 전력량을 예측하는 프로젝트! 사무실에서 사용하고있는 전기를 측정해둔 데이터가 있었고 이를 활용해 앞으로의 전력량을 예측하는 프로젝트였다. 시계열 데이터를 실제데이터로 활용해 보는 것은 처음이라 설레었다,,! 먼저, 1. 언제부터 언제까지의 데이터로? 2. 언제의 데이터로 확인해볼 것인가? 를 정했다. DATA SET : 2개월(=61일=1464시간) 2개월 정도의 데이터를 받았고, 처음에는 Train과 Test data를 어떻게 나누어야 할지 고민스러웠다. 왜냐하면 시계열 데이터였기 때문! 시계열 데이터를 나누는 방법을 많이 탐색해보았고 아래와 같은 방법이 있었다. 시계열 데이터의 경우 랜덤성을 부여하면 안 되고.. 2022. 3. 15. 따릉이 대여량 예측-(1) 데이콘에서 주최하는 학습을 위한 경진대회인 따릉이 대여량 예측을 분석해보자! 주제 서울의 일별 온도, 습도, 강수량 등 일기 예보 데이터를 통해 따릉이 대여량을 예측해보세요. 서울의 2018~2021년 4년 동안의 날씨 데이터와 2018~2020년의 따릉이 대여량 데이터가 주어집니다. 이 데이터를 이용해 2021년의 따릉이 대여량을 예측해보세요. 주어진 데이터 이외의 데이터는 사용 금지입니다! 2018년 4-6월, 2019년 4-6월, 2020년 4-6월 데이터를 바탕으로 2021년 데이터를 예측해야 하는 문제이다. 데이터에 결측치는 없었기 때문에 결측치 걱정은 없어서 좋았다. train_df.isna().sum() test_df.isna().sum() 변수들 date_time : 일별 날짜 wind_d.. 2021. 11. 23. 이전 1 다음