library(tidyverse)
library(data.table)
library(e1071)
library(rpart)
library(randomForest)
数据集
# Video Game Sales with Ratings
ratings <- read.csv("Video_Games_Sales_as_at_22_Dec_2016.csv")
summary(ratings)
以下是数据集列的描述。
- Name-游戏名称
- Platform——游戏发布的平台(即PC、PS4等)
- Year 游戏发布的年份
- Genre 游戏类型
- Publisher 出版商-游戏出版商
- NA_Sales——北美销售额(百万)
- EU_Sales——欧洲销售额(百万)
- JP_Sales——在日本的销售额(以百万计)
- Other_Sales——在世界其他地区的销售额(以百万计)
- Global_Sales-全球总销售额。
- Critic_score——元批评工作人员编制的总分
- CriticAccount——提出CriticCore时使用的批评人数
- User_score-Metacritic订户的分数
- Usercount—给出userscore的用户数
- Usercount-负责创建游戏的一方
- Rating——ESRB评级
据观察,发布年份和用户分数为字符,将首先更改为数字。