백엔드 프레임워크 & 언어/Pandas & numpy

데이터프레임을 살펴보는 다양한 함수

anodos 2023. 7. 2. 08:16

바로 head( )와 tail( )입니다.
이 두 함수는 기본적으로 5줄만 출력합니다. 더 많거나 적은 줄을 출력하려면 괄호 안에 원하는
숫자를 넣어주면 됩니다. 

sample.head()

sample.tail()

sample.info()

 

1 데이터 행 수(19)와 인덱스(0 to18)를 보여줍니다.
2 컬럼 개수를 보여줍니다.
3 데이터가 가지고 있는 컬럼명을 보여줍니다.
4 Non-Null Count는 Null이 아닌 데이터 수입니다. 여기서 Null이란 데이터가 비어 있다는
뜻입니다. 이 데이터에는 비어 있는 값이 없으므로 Var_1과 Var_2 모두에서 19를 출력합니다.
5 자료형을 의미합니다. Var_1과 Var_2 모두 int64라는 자료형입니다.

 

sample.describe()

이 함수는 각 변수(컬럼)별로 통계적 정보를 요약해 보여줍니다. 

count  : 데이터 개수를 보여줍니다.
mean  : 각 변수에 속하는 데이터의 평균값입니다.
std  :  각 변수에 속하는 데이터의 표준편차입니다.
min, max  :각 변수에 속하는 최솟값과 최댓값입니다.
25%, 50%, 75% :  각 변수의 사분위수입니다. 사분위수란 데이터를 오름차순으로 정리해 25%, 50%, 75%가 되
는 지점을 의미합니다.

반응형