# 특정 조건 만족하는 데이터 마스킹
import numpy as np
df.mask(df["Salary"] < 6000, np.nan) # salary가 6000 미만인 데이터 nan으로 마스킹
# 특정 조건 만족하지 못하는 데이터 마스킹
df.where(df["Salary"] < 6000, np.nan)
# 데이터 필터링하기
# df.loc[<조건>]
df.loc[df["Salary"] >= 5000]
# & | 써서 조건 결합
df.loc[ (df["Salary"] >= 5000) & (df["Salary"] < 7000) ]
# 인덱스 기준 정렬
df.sort_index()
# 인덱스 기준 정렬(내림차순)
df.sort_index(ascending=False)
# 컬럼 기준 정렬
df.sort_values("Salary", ascending = False)
df.sort_values(["WeeklyExercise", "WeeklyDrink"], ascending=False)
# 컬럼 기준으로 그룹화
df.groupby(["Gender"]).mean()
출처 : https://sjquant.tistory.com/57?category=898782 님 포스트 연습
'Data Science > Python' 카테고리의 다른 글
[Python] replace, 합집합/교집합/차집합, 리스트 문자열 합치기 (0) | 2022.10.20 |
---|---|
맨날 헷갈리는 정규표현식 (문자열에서 숫자만 추출) (1) | 2022.10.15 |
판다스 자주쓰는 명령어3 - 결측값 대체 (0) | 2022.10.14 |
판다스 자주쓰는 명령어2 - pd.merge(df, df2, on = " ", how= " ") (0) | 2022.10.14 |
판다스 자주쓰는 명령어 (0) | 2022.10.14 |