본문 바로가기

Dev/Python

[Python/Pandas] 데이터 변환

📁 apply( )

  • 판다스의 시리즈, 데이터프레임에 함수를 적용하는 메소드
  • 각 요소에 대해 사용자 정의 함수, 내장 함수 적용 가능
  • 시리즈 내의 각 요소에 함수를 적용해 반환된 결과를 새로운 시리즈로 반환
  • 사용자 정의 함수 작성 가능, lambda 함수를 사용해 간단한 연산 적용 가능

 

📁 map( )

시리즈 내의 각 요소에 함수를 적용하여 반환된 결과를 새로운 시리즈로 반환

사용자 정의 함수 작성 가능, lambda 함수를 사용해 간단한 연산 적용 가능

 

📁 apply( )와 map( )

  • apply는 데이터프레임/시리즈 객체에 사용, map은 시리즈 객체에서만 사용
  • apply는 각 행/열에 함수 적용 시 axis를 통해 축 지정 가능, map은 시리즈의 각 요소에 함수 적용
  • apply는 반환값을 모아 새로운 시리즈/데이터프레임 생성, map은 요소에 대한 결과를 모아 새로운 시리즈 생성

 

📁 replace( )

replace('대체할 값', '변경할 값')

 

시리즈 내의 값을 다른 값으로 대체하는데 사용

새로운 시리즈를 반환하므로, 원본 시리즈를 변경하지 않음

 

정규표현식을 이용해 패턴에 일치하는 문자열을 찾아내고, 미리 설정해둔 문자열로 데이터 변경 가능

regex = True 옵션 설정해야 정규표현식 사용 가능

 

📁 cut( )

cut(x, bins, labels=None, right=True, include_lowest=False, ...)

  • x: 나눌 대상 시리즈/배열
  • bins: 나눌 구간의 경계값
  • labels: 나눈 각 구간에 대응하는 레이블
  • right: 구간의 오른쪽 경계 포함 여부
  • include_lowest: 가장 낮은 값의 첫 번째 구간 포함 여부

 

연속적인 값을 이산적인 구간으로 나눌 수 있음

주로 연속형 데이터를 카테고리형 데이터로 변환 시 활용

'Dev > Python' 카테고리의 다른 글

[Python/Pandas] DataFrame  (1) 2023.11.15
[Python/Pandas] 결측치와 중복값  (0) 2023.11.15
[Python/Pandas] Series  (0) 2023.11.14
[Python/Pandas] Pandas  (0) 2023.11.14
[Python] 집합  (0) 2023.11.14