본문 바로가기

Dev/Python

[Python/Pandas] DataFrame

📁 DataFrame

행과 열로 이루어진 2차원 데이터 구조

열(Column): 서로 다른 유형의 데이터를 담을 수 있는 시리즈로 구성

행(Row): 데이터프레임의 하나의 레코드, 고유한 인덱스를 가짐

 

📁 인덱싱

  • 레이블 기반 인덱싱(Label-based Indexing)
    • 특정 행/열을 선택하는 방법 중 하나
    • 인덱스의 라벨을 사용해 데이터에 접근
    • loc[row_label, col_label]
      • 데이터프레임에서 특정 행/열을 선택하는 메서드
      • 반환된 값은 시리즈 혹은 데이터프레임 형태로 나타남
    • 레이블 기반 인덱싱이 유용한 경우
      • 인덱스가 숫자가 아닌 경우
      • 특정 번위의 행 또는 열을 선택 시
      • 다중 레벨 인덱스에서 선택 시
      • 라벨이나 조건을 기반으로 선택 시
      • 특정 부분 집합 선택 시
  • 정수 위치기반 인덱싱(Integer-location based Indexing)
    • 특정 행/열을 선택하는 방법 중 하나
    • 인덱스를 사용해 데이터에 접근
    • iloc[row_index, col_index]
      • 데이터프레임에서 특정 행/열 선택 메서드
      • 반환된 값은 시리즈 혹은 데이터프레임 형태로 나타남
    • 정수 위치 기반 인덱싱이 유용한 경우
      • 특정 행/열 선택
      • 조건에 따른 선택
      • 일부 데이터만 선택
      • 데이터 수정
      • 새로운 행/열 추가