按日期分割数据集
-1、 首先我这里的数据集,形式如下图:
这里可以看见第一行为数据的属性,最后一个为时间,格式为.csv文件,我希望按日期(年月日)划分出数据,即按天将数据分割出来。2、由于数据集较大,因次需要导入pandas,利用pandas将csv文件导入到Python中。
3、假设导入的变量为d,那么2014年11月18号这天的数据即可以这样截取:d[d[‘time’].str.contains(r’2014-11-18’)]
4、最后再将结果导出为csv文件即可。
import pandasd = pandas.read_csv('d1828.csv')d1118=d[d['time'].str.contains(r'2014-11-18')]d1119=d[d['time'].str.contains(r'2014-11-19')]d1120=d[d['time'].str.contains(r'2014-11-20')]d1121=d[d['time'].str.contains(r'2014-11-21')]d1122=d[d['time'].str.contains(r'2014-11-22')]d1123=d[d['time'].str.contains(r'2014-11-23')]d1124=d[d['time'].str.contains(r'2014-11-24')]d1125=d[d['time'].str.contains(r'2014-11-25')]d1126=d[d['time'].str.contains(r'2014-11-26')]d1127=d[d['time'].str.contains(r'2014-11-27')]d1128=d[d['time'].str.contains(r'2014-11-28')]d1118.to_csv('d1118.csv')d1119.to_csv('d1119.csv')d1120.to_csv('d1120.csv')d1121.to_csv('d1121.csv')d1122.to_csv('d1122.csv')d1123.to_csv('d1123.csv')d1124.to_csv('d1124.csv')d1125.to_csv('d1125.csv')d1126.to_csv('d1126.csv')d1127.to_csv('d1127.csv')d1128.to_csv('d1128.csv')5、这里d1828.csv文件中含有18号到28号的日期,因此最后导出的文件是2014年11月18号到2014年12月28号的文件。
6、同理,当得到某一天的数据后,如果还想继续按时间(即小时)划分,也是同样的方法。用pandas进行较大数据处理时,速度也很快。
新闻热点
疑难解答