在python之中能够使用pandas库来读取Excel文件之中的数据,但是如果该文件中日期数据的格式没有设置好的话,那么读取到python中就会变为数字或者直接抛出异常。所以这篇文章会来给大家讲解一下,python中pandas库处理Excel文件日期数据的方法。

Pandas处理Excel日期数据怎么做?Python如何使用pandas库处理Excel日期

(1)首先需要了解一下在Excel文件中日期格式的时间数据和常规数据是如何转换的,因为它会从1900的一月一日为最初的开始日期,那么这一天就会被转为一。而往后的每一天都会加上一,那么就可以知道设置好的日期转为常规数据后实际上是时间的天数之差。

那么只需要从这一点就能够去计算出这个数据所对应的时间是多少了,导入模块之后调用对应的方法即可,代码示例如下所示:

import pandas as pd
from pandas.tseries.offsets import Day
df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.apply(lambda x: f"{x.month}月{x.day}日")
df.head()

在以上的代码之中basetime这个变量是用来控制起始日期的,因为Excel内的时间使用1900/1/1开始,而它转为常规数据时为1值。所以就需要使用这个变量来表示偏移日期,否则是无法从零开始计算的。

而这个方法只是将时间之中的月份和天数给输出了,实际上需要使用格式化日期数据的方法来将完成的年月日日期都给输出,代码示例如下:

df.日期 = df.日期.dt.strftime('%Y年%m月%d日')

以上就是关于“Pandas处理Excel日期数据怎么做?Python如何使用pandas库处理Excel日期”的全部内容了,希望对你有所帮助。

更多python相关文章请访问分类:python

【版权声明】本文图文出自大盘站@dapan.cc,转载请注明出处!