본문 바로가기

AI/Python Module

Module #pandas

Pandas (Python Data Analysis Library)


파이썬을 통해 데이터 분석을 할 때, Pandas를 빼놓고 이야기할 수 없다. 온전히 통계 분석을 위해 고안된 R 과는 다르게 python은 일반적인 프로그래밍 언어(general purpose programming language) 이며, 데이터 분석을 하기 위해서는 여러가지 라이브러리를 사용할 수 밖에 없다. 이 패키지들 중 R의 dataframe 데이터 타입을 참고하여 만든 것이 바로 pandas dataframe이다. pandas는 dataframe을 주로 다루기 위한 라이브러리이며, dataframe을 자유롭게 가공하는 것은 데이터 과학자들에게 중요하다. 물론 pandas의 문법을 외우지 않고, 필요할 때마다 책이나 웹에서 찾아가면서 해도 좋지만 자주 사용하는 조작법을 외운다면 안 그래도 귀찮은 데이터 핸들링 작업을 빠르게 할 수 있다.

출처: https://3months.tistory.com/292 [Deep Play]

 

import pandas as pd
df1 = pd.DataFrame([[20, 'ICT', '남'],
                    [21, '영문', '여']],
                   index = ['홍길동', '홍길순'],
                   columns = ['나이', '학과', '성별'])
print(df1)

>>>

     나이   학과 성별
홍길동  20  ICT  남
홍길순  21   영문  여
반응형

'AI > Python Module' 카테고리의 다른 글

Module #matplotlib, #urllib, #BeautifulSoup  (0) 2021.07.26
Module #sklearn  (0) 2021.07.26
Module #numpy  (0) 2021.07.26
Module  (0) 2021.07.26
Module #matplotlib  (0) 2021.07.26