Python pandas库中的isnull()详解
问题描述
python的pandas库中有一个十分便利的isnull()函数,它可以用来判断缺失值,我们通过几个例子学习它的使用方法。
首先我们创建一个dataframe,其中有一些数据为缺失值。
importpandasaspd importnumpyasnp df=pd.DataFrame(np.random.randint(10,99,size=(10,5))) df.iloc[4:6,0]=np.nan df.iloc[5:7,2]=np.nan df.iloc[7,3]=np.nan df.iloc[2:3,4]=np.nan
得到的结果如下所示
01234 063.08958.094.010.0 144.07766.054.014.0 225.04193.056.0NaN 343.02627.053.044.0 4NaN9845.032.045.0 5NaN28NaN72.010.0 669.092NaN24.061.0 751.02235.0NaN72.0 883.03293.062.025.0 948.05483.030.079.0
我们先来运行以下isnull()看会出现什么结果
df.isnull()
01234 0FalseFalseFalseFalseFalse 1FalseFalseFalseFalseFalse 2FalseFalseFalseFalseTrue 3FalseFalseFalseFalseFalse 4TrueFalseFalseFalseFalse 5TrueFalseTrueFalseFalse 6FalseFalseTrueFalseFalse 7FalseFalseFalseTrueFalse 8FalseFalseFalseFalseFalse 9FalseFalseFalseFalseFalse
可见程序返回了布尔值,该处为缺失值,返回True,该处不为缺失值,则返回False
其它
直接使用isnull()并不能很直观的反应缺失值的信息。
我们再调用其他命令进行尝试。
df.isnull().any()
0True 1False 2True 3True 4True dtype:bool
可见df.isnull().any()会判断哪些列包含缺失值,该列存在缺失值则返回True,反之False。
df.isnull().sum()
02 10 22 31 41 dtype:int64
isnull().sum()就更加直观了,它直接告诉了我们每列缺失值的数量。
以上这篇Pythonpandas库中的isnull()详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。