这个问题源于在训练机器学习的一个模型时,使用训练数据时提示prepare的数据中存在np.nan
报错信息如下:
ValueError: np.nan is an invalid document, expected byte or unicode string.
刚开始不知道为什么会有这个,后来发现是list中存在nan值
下面是找到nan值的方法:
简单找到:
import numpy as npx = np.array([2,3,np.nan,5, np.nan,5,2,3])for item in x: if np.isnan(item): print('yes')
拿到index数组:
x = np.array([[1,2,3,4], [2,3,np.nan,5], [np.nan,5,2,3]])print(np.argwhere(np.isnan(x)))
output: array([[1, 2], [2, 0]])
然而实际上,有些时候,如果是用pandas读出的数据,在list中print时提示为nan,但用isnan方法却并不能正确判断,会提示TypeError,此时需要用pandas.isnull()判断该值是否为空
下面是numpy.isnan()的文档
以上这篇Python Numpy:找到list中的np.nan值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持武林站长站。
新闻热点
疑难解答