该数据集压缩包是淘宝 2015 年双 11 前 6 个月 ( 包含双 11) 的交易数据 ( 交易数据有偏移,但是不影响实验的结果 ) ,里面包含用户行为日志文件 user_log.csv 下面列出这个文件的数据格式定义: 用户行为日志 user_log.csv ,日志中的字段定义如下: 1. user_id | 买家 id 2. item_id | 商品 id 3. cat_id | 商品类别 id 4. merchant_id | 卖家 id 5. brand_id | 品牌 id 6. month | 交易时间 : 月 7. day | 交易事件 : 日 8. action | 行为 , 取值范围 {0,1,2,3},0 表示点击, 1 表示加入购物车, 2 表示购买, 3 表示关注商品 9. age_range | 买家年龄分段: 1 表示年龄 <18,2 表示年龄在 [18,24] , 3 表示年龄在 [25,29] , 4 表示年龄在 [30,34] , 5 表示年龄在 [35,39] , 6 表示年龄在 [40,49] , 7 和 8 表示年龄 >=50,0 和 NULL 则表示未知 10. gender | 性别 :0 表示女性, 1 表示男性, 2 和 NULL 表示未知 11. province| 收获地址省份 根据上述数据集,完成以下操作,并将6、7、10 前6条结果进行可视化。 1. 计算出表内有多少条行数据购买的数据 2 . 计算出有多少个用户购买了商品 3 . 计算出购买的此品牌 id 为 2661 商品的数量 4. 查询女性购买商品的数量 5 查询购买商品超过 5 次的用户 id 6. 查询 各省购买商品的用户数量 7. 查询 各省购买商品种类数量 8 . 计算出加入购物车的商品的数量 9 . 计算出年龄 25 - 29 用户 , 购买商品的数量 1 0 . 计算出各个年龄段购买商品的数量