본문 바로가기

오류모음집/pandas

Pandas concat -> Groupby 이후 KeyError: 'columns'

반응형

판다가 2마리 있으니 pandas... 

 

 

 

 

  1. 발생경위
    1. 2개의 데이터프레임을 concat 하고 groupby -> mean 이후 컬럼 접근 
  2. 대처방안
    1. timestamp 열이 index로 설정되어 있기 때문 그렇기에 timestamp는 column이 아닌 index로 잡히기 때문에 접근이 불가함 
      1. 대처법은 reset_index() 함수를 사용하여 열로 변환 하면 됨 

 

import pandas as pd 


import pandas as pd

# 첫 번째 데이터프레임 생성
df1 = pd.DataFrame({'일자': ['2020-01-01', '2020-01-02', '2020-01-03'],
                    '값1': [10, 20, 30]})

# 두 번째 데이터프레임 생성
df2 = pd.DataFrame({'일자': ['2020-01-03', '2020-01-04', '2020-01-05'],
                    '값2': [40, 50, 60]})

# 데이터프레임 병합
merged_df = pd.concat([df1, df2])

# 중복된 데이터의 값 평균 계산
merged_df = merged_df.groupby(['일자']).mean().reset_index()  # 요롷게 해주기 

# 결과 확인
print(merged_df)

 

반응형