데이터프레임을 살펴보는 다양한 함수

바로 head( )와 tail( )입니다.
이 두 함수는 기본적으로 5줄만 출력합니다. 더 많거나 적은 줄을 출력하려면 괄호 안에 원하는
숫자를 넣어주면 됩니다.

sample.head()

sample.tail()

sample.info()

1 데이터 행 수(19)와 인덱스(0 to18)를 보여줍니다.
2 컬럼 개수를 보여줍니다.
3 데이터가 가지고 있는 컬럼명을 보여줍니다.
4 Non-Null Count는 Null이 아닌 데이터 수입니다. 여기서 Null이란 데이터가 비어 있다는
뜻입니다. 이 데이터에는 비어 있는 값이 없으므로 Var_1과 Var_2 모두에서 19를 출력합니다.
5 자료형을 의미합니다. Var_1과 Var_2 모두 int64라는 자료형입니다.

sample.describe()

이 함수는 각 변수(컬럼)별로 통계적 정보를 요약해 보여줍니다.

count : 데이터 개수를 보여줍니다.
mean : 각 변수에 속하는 데이터의 평균값입니다.
std : 각 변수에 속하는 데이터의 표준편차입니다.
min, max :각 변수에 속하는 최솟값과 최댓값입니다.
25%, 50%, 75% : 각 변수의 사분위수입니다. 사분위수란 데이터를 오름차순으로 정리해 25%, 50%, 75%가 되
는 지점을 의미합니다.

저작자표시 비영리 변경금지 (새창열림)

'백엔드 프레임워크 & 언어 > Pandas & numpy' 카테고리의 다른 글

마크다운 생성기 (MarkDown Generator) (0)	2023.07.09
jupyter notebook 단축키 모음 (0)	2023.07.09
판다스로 csv 파일 불러오기 (0)	2023.07.02
Pandas DataFrame (0)	2023.07.01
데이터 분석 라이브러리-Pandas를 사용하는 이유 (0)	2023.07.01

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

데이터프레임을 살펴보는 다양한 함수

'백엔드 프레임워크 & 언어 > Pandas & numpy' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역