반응형
In [1]:
import pandas as pd
데이터 파일 불러오기
CSV 파일 불러오기
임의로 생성한 exercise_1.csv 파일을 현재 노트북 파일과 같은 위치에 업로드 한 뒤 그 파일을 불러 오겠다.
파일을 불러오는 명령어는 read_csv(파일경로) 이다
In [9]:
df = pd.read_csv("exercise_1.csv")
In [10]:
df
Out[10]:
번호 | 국어 | 영어 | 수학 | 과학 | 국사 | |
---|---|---|---|---|---|---|
0 | 0 | 95 | 50 | 80 | 84 | 90 |
1 | 1 | 80 | 74 | 62 | 77 | 92 |
2 | 2 | 95 | 94 | 96 | 97 | 99 |
3 | 3 | 80 | 60 | 65 | 75 | 77 |
4 | 4 | 75 | 95 | 85 | 74 | 64 |
5 | 5 | 64 | 55 | 66 | 96 | 74 |
6 | 6 | 60 | 75 | 85 | 65 | 74 |
7 | 7 | 75 | 85 | 95 | 77 | 71 |
8 | 8 | 77 | 74 | 75 | 75 | 84 |
9 | 9 | 79 | 77 | 95 | 84 | 85 |
노트북 파일과 CSV 데이터 파일이 같은 폴더 위치에 있어 파일명을 작성하면 파일을 불러 올 수 있다.
In [11]:
df.shape
Out[11]:
(10, 6)
df.shape 명령어를 통해 data의 형태를 확인할 수 있다
이 데이터는 10개의 row와 6개의 column으로 구성되어 있다
In [12]:
df.head()
Out[12]:
번호 | 국어 | 영어 | 수학 | 과학 | 국사 | |
---|---|---|---|---|---|---|
0 | 0 | 95 | 50 | 80 | 84 | 90 |
1 | 1 | 80 | 74 | 62 | 77 | 92 |
2 | 2 | 95 | 94 | 96 | 97 | 99 |
3 | 3 | 80 | 60 | 65 | 75 | 77 |
4 | 4 | 75 | 95 | 85 | 74 | 64 |
df.head() 명령어를 통해 data의 처음 5개의 행을 확인할 수 있다.
index column 지정하기
In [13]:
df = pd.read_csv("exercise_1.csv", index_col="번호")
df.head()
Out[13]:
국어 | 영어 | 수학 | 과학 | 국사 | |
---|---|---|---|---|---|
번호 | |||||
0 | 95 | 50 | 80 | 84 | 90 |
1 | 80 | 74 | 62 | 77 | 92 |
2 | 95 | 94 | 96 | 97 | 99 |
3 | 80 | 60 | 65 | 75 | 77 |
4 | 75 | 95 | 85 | 74 | 64 |
read_csv 명령어에 index_col = "번호"라는 parameter를 설정하였다.
이를 통해 "번호" column이 index column으로 설정되었다.
이 내용은 kaggle의 pandas tutorial을 바탕으로 제가 공부한 내용을 필기한 내용입니다.
반응형
'Pandas 기초' 카테고리의 다른 글
리스트(list)를 데이터 프레임(dataframe) 만들기 (0) | 2024.05.10 |
---|---|
[pandas] dataframe에 column 추가 하기, insert 함수 (0) | 2023.11.04 |
Data indexing (0) | 2023.08.08 |
[pandas]데이터 생성 (0) | 2023.08.05 |