第一次接触R,看到一条代码便能画出各式各样的统计图,超级兴奋。拿课后题的college数据集画了画图标,得到一些有趣的小结果。 首先,可以先看看数据集的基本信息
summary(college) pairs(college[, 1:10])
习题里提示可以用 Elite = college$Top10perc >50来代表那些精英大学
whether or not the PRoportion of students coming from the top 10% of their high school classes exceeds 50%.
于是我便画了许多以Elite为横坐标, 其他各式各样的指标为纵坐标的箱线图
上面的这四张图表容易理解,让我好奇的是下面这一张
按(来自top10%高中的)同学超过入学人数的50%为依据,判断为精英大学,个人消费水平明显低一些,尤其是最高的几个消费数据点。难道是大家都在认真学习,不爱出去或者没有时间出去消费?
接着,我把Elite的指标改成了80%来top10,
Elite[college$Top10perc > 80] = “Yes”
改成80%后,平均水平反而超过了普通学习,而最高的那一簇不变。
这样子图表看一看数据集的数据还挺有意思的,等下次我用不一样的图表来看哈。
http://www-bcf.usc.edu/~gareth/ISL/
新闻热点
疑难解答