代码拉取完成,页面将自动刷新
import pandas
import random
import json
random.seed(233)
def save_data(path, data_list):
json_list = []
for stc, label in data_list:
sample = {}
sample['text'] = stc
sample['label'] = label
json_list.append(json.dumps(sample))
json_list = '\n'.join(json_list)
with open(path, 'w') as w:
w.write(json_list)
datas = pandas.read_csv('weibo_senti_100k.csv')
label_list = datas['label'].tolist()
stc_list = datas['review'].tolist()
c = list(zip(stc_list, label_list))
random.shuffle(c)
stc_list[:], label_list[:] = zip(*c)
train_len = int(0.5 * len(stc_list))
test_len = int(0.8 * len(stc_list))
train_data = c[:train_len]
valid_data = c[train_len:test_len]
test_data = c[test_len:]
save_data('data/train.txt', train_data)
save_data('data/valid.txt', valid_data)
save_data('data/test.txt', test_data)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。