바로 head( )와 tail( )입니다.
이 두 함수는 기본적으로 5줄만 출력합니다. 더 많거나 적은 줄을 출력하려면 괄호 안에 원하는
숫자를 넣어주면 됩니다.
sample.head()
sample.tail()
sample.info()
1 데이터 행 수(19)와 인덱스(0 to18)를 보여줍니다.
2 컬럼 개수를 보여줍니다.
3 데이터가 가지고 있는 컬럼명을 보여줍니다.
4 Non-Null Count는 Null이 아닌 데이터 수입니다. 여기서 Null이란 데이터가 비어 있다는
뜻입니다. 이 데이터에는 비어 있는 값이 없으므로 Var_1과 Var_2 모두에서 19를 출력합니다.
5 자료형을 의미합니다. Var_1과 Var_2 모두 int64라는 자료형입니다.
sample.describe()
이 함수는 각 변수(컬럼)별로 통계적 정보를 요약해 보여줍니다.
count : 데이터 개수를 보여줍니다.
mean : 각 변수에 속하는 데이터의 평균값입니다.
std : 각 변수에 속하는 데이터의 표준편차입니다.
min, max :각 변수에 속하는 최솟값과 최댓값입니다.
25%, 50%, 75% : 각 변수의 사분위수입니다. 사분위수란 데이터를 오름차순으로 정리해 25%, 50%, 75%가 되
는 지점을 의미합니다.
반응형
'백엔드 프레임워크 & 언어 > Pandas & numpy' 카테고리의 다른 글
마크다운 생성기 (MarkDown Generator) (0) | 2023.07.09 |
---|---|
jupyter notebook 단축키 모음 (0) | 2023.07.09 |
판다스로 csv 파일 불러오기 (0) | 2023.07.02 |
Pandas DataFrame (0) | 2023.07.01 |
데이터 분석 라이브러리-Pandas를 사용하는 이유 (0) | 2023.07.01 |