首页 > 学院 > 开发设计 > 正文

ISLR_chapter2_exercise

2019-11-06 06:24:30
字体:
来源:转载
供稿:网友

第一次接触R,看到一条代码便能画出各式各样的统计图,超级兴奋。拿课后题的college数据集画了画图标,得到一些有趣的小结果。 首先,可以先看看数据集的基本信息

summary(college) pairs(college[, 1:10])

这里写图片描述


习题里提示可以用 Elite = college$Top10perc >50来代表那些精英大学

whether or not the PRoportion of students coming from the top 10% of their high school classes exceeds 50%.

于是我便画了许多以Elite为横坐标, 其他各式各样的指标为纵坐标的箱线图

这里写图片描述

上面的这四张图表容易理解,让我好奇的是下面这一张 这里写图片描述

按(来自top10%高中的)同学超过入学人数的50%为依据,判断为精英大学,个人消费水平明显低一些,尤其是最高的几个消费数据点。难道是大家都在认真学习,不爱出去或者没有时间出去消费?

接着,我把Elite的指标改成了80%来top10,

Elite[college$Top10perc > 80] = “Yes”

这里写图片描述 改成80%后,平均水平反而超过了普通学习,而最高的那一簇不变。


这样子图表看一看数据集的数据还挺有意思的,等下次我用不一样的图表来看哈。

参考

http://www-bcf.usc.edu/~gareth/ISL/


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表