100 個 Pandas 函數(shù)匯總,建議收藏
來源:
奇酷教育 發(fā)表于:
100 個 Pandas 函數(shù)匯總,建議收藏
100個Pandas常用的函數(shù),分別分為6類:統(tǒng)計匯總函數(shù)、數(shù)據(jù)清洗函數(shù)、數(shù)據(jù)篩選、繪圖與元素級運(yùn)算函數(shù)、時間序列函數(shù)和其他函數(shù)。
統(tǒng)計匯總函數(shù)
函數(shù)
含義
min()
計算最小值
max()
計算最大值
sum()
求和
mean()
計算平均值
count()
計數(shù)(統(tǒng)計非缺失元素的個數(shù))
size()
計數(shù)(統(tǒng)計所有元素的個數(shù))
median()
計算中位數(shù)
var()
計算方差
std()
計算標(biāo)準(zhǔn)差
quantile()
計算任意分位數(shù)
cov()
計算協(xié)方差
corr()
計算相關(guān)系數(shù)
skew()
計算偏度
kurt()
計算峰度
mode()
計算眾數(shù)
describe()
描述性統(tǒng)計(一次性返回多個統(tǒng)計結(jié)果)
groupby()
分組
aggregate()
聚合運(yùn)算(可以自定義統(tǒng)計函數(shù))
argmin()
尋找最小值所在位置
argmax()
尋找最大值所在位置
any()
等價于邏輯“或”
all()
等價于邏輯“與”
value_counts()
頻次統(tǒng)計
cumsum()
運(yùn)算累計和
cumprod()
運(yùn)算累計積
pct--_change()
運(yùn)算比率(后一個元素與前一個元素的比率)
數(shù)據(jù)清洗函數(shù)
函數(shù)
含義
duplicated()
判斷序列元素是否重復(fù)
drop_duplicates()
刪除重復(fù)值
hasnans()
判斷序列是否存在缺失(返回TRUE或FALSE)
isnull()
判斷序列元素是否為缺失(返回與序列長度一樣的bool值)
notnull()
判斷序列元素是否不為缺失(返回與序列長度一樣的bool值)
dropna()
刪除缺失值
fillna()
缺失值填充
ffill()
前向后填充缺失值(使用缺失值的前一個元素填充)
bfill()
后向填充缺失值(使用缺失值的后一個元素填充)
dtypes()
檢查數(shù)據(jù)類型
astype()
類型強(qiáng)制轉(zhuǎn)換
pd.to_datetime
轉(zhuǎn)日期時間型
factorize()
因子化轉(zhuǎn)換
sample()
抽樣
where()
基于條件判斷的值替換
replace()
按值替換(不可使用正則)
str.replace()
按值替換(可使用正則)
str.split.str()
字符分隔
數(shù)據(jù)篩選函數(shù)
函數(shù)
含義
isin()
成員關(guān)系判斷
between()
區(qū)間判斷
loc()
條件判斷(可使用在數(shù)據(jù)框中)
iloc()
索引判斷(可使用在數(shù)據(jù)框中)
compress()
條件判斷
nlargest()
搜尋最大的n個元素
nsmallest()
搜尋最小的n個元素
str.findall()
子串查詢(可使用正則)
繪圖與元素級運(yùn)算函數(shù)
函數(shù)
含義
hist()
繪制直方圖
plot()
可基于kind參數(shù)繪制更多圖形(餅圖,折線圖,箱線圖等)
map()
元素映射
apply()
基于自定義函數(shù)的元素級操作
時間序列函數(shù)
函數(shù)
含義
dt.date()
抽取出日期值
dt.time()
抽取出時間(時分秒)
dt.year()
抽取出年
dt.mouth()
抽取出月
dt.day()
抽取出日
dt.hour()
抽取出時
dt.minute()
抽取出分鐘
dt.second()
抽取出秒
dt.quarter()
抽取出季度
dt.weekday()
抽取出星期幾(返回數(shù)值型)
dt.weekday_name()
抽取出星期幾(返回字符型)
dt.week()
抽取出年中的第幾周
dt.dayofyear()
抽取出年中的第幾天
dt.daysinmonth()
抽取出月對應(yīng)的最大天數(shù)
dt.is_month_start()
判斷日期是否為當(dāng)月的第一天
dt.is_month_end()
判斷日期是否為當(dāng)月的最后一天
dt.is_quarter_start()
判斷日期是否為當(dāng)季度的第一天
dt.is_quarter_end()
判斷日期是否為當(dāng)季度的最后一天
dt.is_year_start()
判斷日期是否為當(dāng)年的第一天
dt.is_year_end()
判斷日期是否為當(dāng)年的最后一天
dt.is_leap_year()
判斷日期是否為閏年
其它函數(shù)
函數(shù)
含義
append()
序列元素的追加(需指定其他序列)
diff()
一階差分
round()
元素的四舍五入
sort_values()
按值排序
sort_index()
按索引排序
to_dict()
轉(zhuǎn)為字典
tolist()
轉(zhuǎn)為列表
unique()
元素排重