- 수학적 연산 및 다차원 배열연산을 가능하게 해주는 라이브러리

.where() – 조건에 맞는 데이터의 위치(index)를 알려줌

.array()  || .ndarray() – 배열을 생성하는 함수 (append 됨)

.shape - 데이터의 전체적인 차원을 볼 수 있게 해줌

.transpose() – 데이터를 전치시킴

.reshape() – 데이터의 차원을 다시 조정할 수 있음

.concatenate() – 데이터를 붙일 수 있음

 

 

 

 

 

 

 

 

 

 

 

- 데이터 분석에 사용되는 tool,  정형데이터 처리의 대표적인 tool

.loc(), iloc() –위치에 맞는 데이터의 부분만을 보여줌, 데이터 전처리과정에서 많이 활용

.head(), .tail() – 데이터의 맨 앞, 맨 뒤의 부분만을 잘라서 보여줌

.describe(), .info() – 데이터의 전체적인 정보를 보여줌

.drop() – 원하는 row나 column의 데이터를 삭제함

.concat() - 데이터를 붙일 수 있음

.read_csv() – 경로에 있는 .csv 파일을 읽어옴

.to_csv() – 데이터를 원하는 파일 경로에 .csv 파일로 저장함

 

 

 

특히나 iloc은 정말 많이 사용되니 사용법을 작 익혀놔야 한다.

 

 

 

 

 

 

 

 

 

 

 

 

 

scikit learn에 저장된 preprocessing의 LabelEncoder로도 가능함.

 

 

 

 

 

 

 

 

 

 

 

 

 

※ 설치방법[command 창]

$ pip3 install numpy pandas tqdm sklearn matplotlib

!pip3 install numpy pandas tqdm sklearn matplotlib

 

 

 

 

 

+ Recent posts