自然语言处理数据集-52万件商品一千多个类目,近150 万用户,近800 万条评论评分数据
52万件商品一千多个类目近150 万用户近800 万条评论评分数据自然语言处理数据集的网盘链接.docx
(67.58 KB, 需要: RMB 59 元)
(近1GB的csv格式的数据文件)
包含的数据内容CSV格式如下:
产品.csv
"## 字段说明\n",
"\n",
"| 字段 | 说明 |\n",
"| ---- | ---- |\n",
"| productId | 产品 id (从 0 开始,连续编号) |\n",
"| name | 产品名称 |\n",
"| catIds | 类别 id(从 0 开始,连续编号,从左到右依次表示一级类目、二级类目、三级类目) |"
" productId name catIds\n",
"331420 331420 欧意金狐狸 女式 皮手套 QT602 802,143,996\n",
"130945 130945 YESO TOT 中性 单肩包/斜挎包 均码 9411 1111,864,781\n",
种类.csv'
"## 字段说明\n",
"\n",
"| 字段 | 说明 |\n",
"| ---- | ---- |\n",
"| catId | 类别 id (从 0 开始,连续编号) |\n",
"| category | 类别名称 |"
" catId category\n",
"947 947 理发器\n",
"818 818 电脑硬件\n",
评论.csv
"## 字段说明\n",
"\n",
"| 字段 | 说明 |\n",
"| ---- | ---- |\n",
"| userId | 用户 id (从 0 开始,连续编号) |\n",
"| productId | 即 产品.csv 中的 productId |\n",
"| rating | 评分,[1,5] 之间的整数 |\n",
"| timestamp | 评分时间戳 |\n",
"| title | 评论的标题 |\n",
"| comment | 评论的内容 |"
"text/plain": [
" userId productId rating timestamp title comment \n",
"4287636 230944.0 394505 5.0 1393084800 赞! 外观很精致的说 就是外形有点偏大\n",
联系.csv'
"## 字段说明\n",
"\n",
"| 字段 | 说明 |\n",
"| ---- | ---- |\n",
"| productId | 即 产品.csv 和 评论.csv 中的 productId |\n",
"| amazonId | 亚马逊的产品编号 |"
" productId amazonId\n",
"436251 436251 B00F91KYGK\n",
"194578 194578 B00GICSVUK\n",


雷达卡




京公网安备 11010802022788号







