- 수학적 연산 및 다차원 배열연산을 가능하게 해주는 라이브러리
▶ .where() – 조건에 맞는 데이터의 위치(index)를 알려줌
▶ .array() || .ndarray() – 배열을 생성하는 함수 (append 됨)
▶ .shape - 데이터의 전체적인 차원을 볼 수 있게 해줌
▶ .transpose() – 데이터를 전치시킴
▶ .reshape() – 데이터의 차원을 다시 조정할 수 있음
▶ .concatenate() – 데이터를 붙일 수 있음
- 데이터 분석에 사용되는 tool, 정형데이터 처리의 대표적인 tool
▶ .loc(), iloc() –위치에 맞는 데이터의 부분만을 보여줌, 데이터 전처리과정에서 많이 활용
▶ .head(), .tail() – 데이터의 맨 앞, 맨 뒤의 부분만을 잘라서 보여줌
▶ .describe(), .info() – 데이터의 전체적인 정보를 보여줌
▶ .drop() – 원하는 row나 column의 데이터를 삭제함
▶ .concat() - 데이터를 붙일 수 있음
▶ .read_csv() – 경로에 있는 .csv 파일을 읽어옴
▶ .to_csv() – 데이터를 원하는 파일 경로에 .csv 파일로 저장함
특히나 iloc은 정말 많이 사용되니 사용법을 작 익혀놔야 한다.
※ 설치방법[command 창]
$ pip3 install numpy pandas tqdm sklearn matplotlib
!pip3 install numpy pandas tqdm sklearn matplotlib