본문 바로가기
Data Science/Python

판다스 자주쓰는 명령어4

by 로떡 2022. 10. 14.
# 특정 조건 만족하는 데이터 마스킹

import numpy as np

df.mask(df["Salary"] < 6000, np.nan) # salary가 6000 미만인 데이터 nan으로 마스킹

 

# 특정 조건 만족하지 못하는 데이터 마스킹

df.where(df["Salary"] < 6000, np.nan)

 

# 데이터 필터링하기
# df.loc[<조건>]

df.loc[df["Salary"] >= 5000]

salary가 5000 이상인 데이터만 필터링

 

# & | 써서 조건 결합

df.loc[ (df["Salary"] >= 5000) & (df["Salary"] < 7000) ]

# 인덱스 기준 정렬

df.sort_index()

 

# 인덱스 기준 정렬(내림차순)

df.sort_index(ascending=False)

 

# 컬럼 기준 정렬

df.sort_values("Salary", ascending = False)
df.sort_values(["WeeklyExercise", "WeeklyDrink"], ascending=False)

 

# 컬럼 기준으로 그룹화

df.groupby(["Gender"]).mean()

출처 : https://sjquant.tistory.com/57?category=898782 님 포스트 연습