加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
csv_reader.py 857 Bytes
一键复制 编辑 原始数据 按行查看 历史
不愿意丝丝点点些些 提交于 2019-04-22 15:08 . first commit
import pandas
import random
import json
random.seed(233)
def save_data(path, data_list):
json_list = []
for stc, label in data_list:
sample = {}
sample['text'] = stc
sample['label'] = label
json_list.append(json.dumps(sample))
json_list = '\n'.join(json_list)
with open(path, 'w') as w:
w.write(json_list)
datas = pandas.read_csv('weibo_senti_100k.csv')
label_list = datas['label'].tolist()
stc_list = datas['review'].tolist()
c = list(zip(stc_list, label_list))
random.shuffle(c)
stc_list[:], label_list[:] = zip(*c)
train_len = int(0.5 * len(stc_list))
test_len = int(0.8 * len(stc_list))
train_data = c[:train_len]
valid_data = c[train_len:test_len]
test_data = c[test_len:]
save_data('data/train.txt', train_data)
save_data('data/valid.txt', valid_data)
save_data('data/test.txt', test_data)
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化