某游戏公司,根据收集的2016年上半年的用户行为数据对用户是否会付费进行预测,根据预测结果对可能付费用户进行精准营销。该公司一共收集了用户的编号,以及用户的注册时间和最后一次登录时间,以及用户退出时的等级还有用户是否付费等数据。 user_id install_date last_login_date level_end os is_payer active_days avg_session_cnt 用户编号 游戏安装时间 最后一次登录游戏时间 用户退出时的游戏等级 登录手机系统 是否付费 活跃天数 每天登录频次 数据及数据类型解释: user_id install_date last_login_date level_end os is_payer active_days avg_session_cnt 字符型 日期型 如: 2015/5/4 日期型 数值型 字符型,取值为: Android 和iOS 是否付费 1 代表付费,0代表未付费 数值型 数值型 游戏原始数据.csv( 下载附件 177.57 KB) 游戏预测数据.csv( 下载附件 547 B) 请根据原始数据,对数据进行预处理(包括对类别型变量进行数值化处理、重新构造新的变量),然后根据原始数据,自行选择变量和分析算法进行分析,写出分析过程和思路,并且根据模型进行预测。