python 筛选数据集中列中value长度大于20的数据集方法

如果我有一个数据集,他的某个列名下面的value很长,我们需要筛选出,所有列名中value值字符串大于20的数据集。

其实比较简单啦,一句代码就可以搞定

#对该列进行强制的字符类型转换
df["token"] = df["token"].astype(str)
#筛选df这个数据集下,token这个字段下面的value字符串长度大于20的
df= df[df['token'].str.len() >20]

相关推荐