본문 바로가기

Pandas 기초

[pandas] dataframe에 column 추가 하기, insert 함수

반응형

pandas column 추가: insert 함수

 

 

안녕하세요. 오늘은 pandas를 이용하여 dataframe에 column을 추가해 보겠습니다. dataframe에 column을 추가하기 위해서는 insert 함수를 사용합니다. insert 함수의 기본 문법은 다음과 같습니다. 

 

data.insert(loc, column, value)

 

insert 함수 속에 기입하는 parameter의 의미는 다음과 같습니다. 

loc: 삽입될 열의 위치

column: 삽입될 열의 이름

value: 삽입될 열의 값

 

그럼 실습을 해 보겠습니다.

키와 몸무게가 있는 csv 파일을 가져와 bmi를 계산하여 WEIGHT(몸무게) 다음 열에 bmi 열을 추가하는 예제를 해 보겠습니다. 

 

import pandas as pd
data = pd.read_csv("파일 경로") # 실제 파일 경로를 입력하세요.
data.head()

 

결과)

 

pandas를 이용하여 키와 몸무게 데이터가 포함된 csv 파일을 불러 옵니다. 이 데이터는 HEIGHT(키), WEIGHT(몸무게), WAIST(허리둘레)가 column으로 구성되어 있음을 확인할 수 있습니다. 그럼 이 데이터의 키, 몸무게 를 이용하여  bmi를 구하여 WEIGHT 열 옆에 BMI 열을 추가하는 작업을 해 보겠습니다. 

 

먼저 bmi를 구하는 공식은

bmi = 몸무게(kg)  / 키(m)^2 입니다. 

 

본 data의 키는 cm 이므로 HEIGHT/100을 해 주어야 m 단위로 형성이 됩니다. 따라서 본 data를 이용하여 BMI를 구하기 위해서는 다음과 같은 코드를 작성해 주어야 합니다. 

 

bmi = data["WEIGHT"]/((data["HEIGHT"]/100)**2)

 

그럼 bmi를 구하여  bmi 열을 WEIGHT 열 옆에 추가하는 코드를 작성해 보겠습니다. 

 

data.insert(2, "bmi", data["WEIGHT"]/((data["HEIGHT"]/100)**2))
# WEIGHT 옆의 열은 2열이 될 것이므로 loc을 2로 기입해 준다. 
# Column 이름을 "bmi"로 기입해 준다. 
# value 값에 bmi를 구하는 코드를 넣어 준다. 
data.head()

 

결과)

 

결과를 보면 HEIGHT(키), WEIGHT(몸무게) 데이터를 이용하여 bmi를 구하여 WEIGHT 열 옆에 bmi 열이 추가된 것을 확인할 수 있습니다. 

반응형

'Pandas 기초' 카테고리의 다른 글

리스트(list)를 데이터 프레임(dataframe) 만들기  (0) 2024.05.10
Data indexing  (0) 2023.08.08
[pandas]CSV 파일 불러오기  (0) 2023.08.06
[pandas]데이터 생성  (0) 2023.08.05