python处理csv中的空值方法

2023-09-11 06:45:05 131

#-*-coding:UTF-8-*- importjieba.posseg importtensorflowastf importpandasaspd importcsv importmath """ 1.必須獲取CSV文件夾（ID：文本） 2.返回(ID：分词后的文本) """ flags=tf.app.flags flags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加训练数据文件") flags.DEFINE_string("result_file_address","D:/NLPWORD/cut_word_test/hzytest_result.csv","生成结果数据文件") FLAGS=tf.app.flags.FLAGS defcut_word(train_data): """ 把数据按照行进行遍历，然后把结果按照行写在csv中 :return:分词结果list """ jieba.load_userdict("newdict.txt") withopen(FLAGS.result_file_address,"w",encoding='utf8')ascsvfile: writer=csv.writer(csvfile) forrowintrain_data.index: datas=train_data.loc[row].values[1] ifisinstance(datas,str)ornotmath.isnan(datas): words=jieba.posseg.cut(datas) line='' forwordinwords: line=line+word.word+"" writer.writerow([train_data.loc[row].values[0],line]) defmain(_): data=pd.read_csv(FLAGS.train_file_address) cut_word(data) if__name__=="__main__": tf.app.run(main)

python处理csv中的空值方法

热门推荐

随机推荐