首页 > 编程 > Python > 正文

python处理csv中的空值方法

2020-02-15 21:58:41
字体:
来源:转载
供稿:网友

如下所示:

# -*- coding: UTF-8 -*-import jieba.possegimport tensorflow as tfimport pandas as pdimport csvimport math"""1.必須獲取CSV文件夾(ID:文本)2.返回(ID:分词后的文本)"""flags = tf.app.flagsflags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加训练数据文件")flags.DEFINE_string("result_file_address","D:/NLPWORD/cut_word_test/hzytest_result.csv","生成结果数据文件")FLAGS = tf.app.flags.FLAGSdef cut_word(train_data): """ 把数据按照行进行遍历,然后把结果按照行写在csv中 :return:分词结果list """ jieba.load_userdict("newdict.txt") with open(FLAGS.result_file_address, "w", encoding='utf8') as csvfile: writer = csv.writer(csvfile) for row in train_data.index:  datas = train_data.loc[row].values[1]  if isinstance(datas,str) or not math.isnan(datas):  words = jieba.posseg.cut(datas)  line = ''  for word in words:   line = line + word.word + " "  writer.writerow([train_data.loc[row].values[0], line])def main(_): data = pd.read_csv(FLAGS.train_file_address) cut_word(data)if __name__ == "__main__": tf.app.run(main)

以上这篇python处理csv中的空值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持武林站长站。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表