본문 바로가기

Python/Data Analysis Library

Part03 Chapter.02 데이터 분석 라이브러리 05. Pandas DataFrame

Pandas DataFrame


Pandas DataFrame : pandas 라이브러리가 사용하는 기본 자료구조.

Source : https://www.geeksforgeeks.org/creating-a-pandas-dataframe/

  • DataFrame은 2차원 테이블 구조를 말한다.
  • 1차원 구조인 Series 도 있다. (1 row, 1 column)
  • row, column으로 모든 원소를 구분한다. (indexing)
  • index, columns, values라는 객체 변수를 가지고 있다.
  • Relational DB와 완전히 호환됩니다.
  • 하나의 column을 기준으로 모든 원소의 data type이 동일합니다. (모두 numpy array가 가지는 data type과 동일)
  • DataFrame은 numpy array를 상위 호환하는 개념으로 universal function이 사용 가능합니다.
    → 내부 구현체로 numpy array를 사용하기 때문에!