Pandas中常用的七个时间戳处理函数是什么


这篇文章主要介绍“Pandas中常用的七个时间戳处理函数是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Pandas中常用的七个时间戳处理函数是什么”文章能帮助大家解决问题。

在零售、经济和金融等行业,数据总是由于货币和销售而不断变化,生成的所有数据都高度依赖于时间。如果这些数据没有时间戳或标记,实际上很难管理所有收集的数据。Python 程序允许我们使用 NumPy timedelta64 和 datetime64 来操作和检索时间序列数据。sklern库中也提供时间序列功能,但 Pandas 为我们提供了更多且好用的函数。

Pandas 库中有四个与时间相关的概念

  • 日期时间:日期时间表示特定日期和时间及其各自的时区。它在 pandas 中的数据类型是 datetime64[ns] 或 datetime64[ns, tz]。

  • 时间增量:时间增量表示时间差异,它们可以是不同的单位。示例:“天、小时、减号”等。换句话说,它们是日期时间的子类。

  • 时间跨度:时间跨度被称为固定周期内的相关频率。时间跨度的数据类型是 period[freq]。

  • 日期偏移:日期偏移有助于从当前日期计算选定日期,日期偏移量在 pandas 中没有特定的数据类型。

时间序列分析至关重要,因为它们可以帮助我们了解随着时间的推移影响趋势或系统模式的因素。在数据可视化的帮助下,分析并做出后续决策。

现在让我们看几个使用这些函数的例子

1、查找特定日期的某一天的名称

importpandasaspdday=pd.Timestamp(‘2023/1/5')day.day_name()

上面的程序是显示特定日期的名称。第一步是导入 panda 的并使用 Timestamp 和 day_name 函数。“Timestamp”功能用于输入日期,“day_name”功能用于显示指定日期的名称。

2、执行算术计算

importpandasaspdday=pd.Timestamp(‘2023/1/5')day1=day+pd.Timedelta(“3day”)day1.day_name()day2=day1+pd.offsets.BDay()day2.day_name()

在第一个代码中,显示三天后日期名称。“Timedelta”功能允许输入任何天单位(天、小时、分钟、秒)的时差。

在第二个代码中,使用“offsets.BDay()”函数来显示下一个工作日。换句话说,这意味着在星期五之后,下一个工作日是星期一。

3、使用时区信息来操作转换日期时间

获取时区的信息

importpandasaspdimportnumpyasnpfromdatetimeimportdatetimedat_ran=dat_ran.tz_localize(“UTC”)dat_ran

转换为美国时区

dat_ran.tz_convert(“US/Pacific”)

代码的目标是更改日期的时区。首先需要找到当前时区。这是“tz_localize()”函数完成的。我们现在知道当前时区是“UTC”。使用“tz_convert()”函数,转换为美国/太平洋时区。

4、使用日期时间戳

importpandasaspdimportnumpyasnpfromdatetimeimportdatetimedat_ran=pd.date_range(start=‘1/1/2023',end=‘1/5/2023',freq=‘Min')print(type(dat_ran[110]))

5、创建日期系列

importpandasaspdimportnumpyasnpfromdatetimeimportdatetimedat_ran=pd.date_range(start=‘1/1/2023',end=‘1/5/2023',freq=‘Min')print(dat_ran)

上面的代码生成了一个日期系列的范围。使用“date_range”函数,输入开始和结束日期,可以获得该范围内的日期。

6、操作日期序列

importpandasaspdfromdatetimeimportdatetimeimportnumpyasnpdat_ran=pd.date_range(start='1/1/2023',end='1/08/2023',freq='Min')df=pd.DataFrame(dat_ran,columns=[‘date'])df[‘data']=np.random.randint(0,100,size=(len(dat_ran)))print(df.head(5))

在上面的代码中,使用“DataFrame”函数将字符串类型转换为dataframe。最后“np.random.randint()”函数是随机生成一些假定的数据。

7、使用时间戳数据对数据进行切片

importpandasaspdfromdatetimeimportdatetimeimportnumpyasnpdat_ran=pd.date_range(start='1/1/2023',end='1/08/2023',freq='Min')df=pd.DataFrame(dat_ran,columns=[‘date'])df[‘data']=np.random.randint(0,100,size=(len(dat_ran)))string_data=[str(x)forxindat_ran]print(string_data[1:5])

上面代码是是第6条的的延续。在创建dataframe并将其映射到随机数后,对列表进行切片。

关于“Pandas中常用的七个时间戳处理函数是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注主机评测网行业资讯频道,小编每天都会为大家更新不同的知识点。


上一篇:SpringBoot的EnvironmentPostProcessor怎么用

下一篇:vue中不同情况下如何进行通讯


Copyright © 2002-2019 测速网 www.inhv.cn 皖ICP备2023010105号
测速城市 测速地区 测速街道 网速测试城市 网速测试地区 网速测试街道
温馨提示:部分文章图片数据来源与网络,仅供参考!版权归原作者所有,如有侵权请联系删除!

热门搜索 城市网站建设 地区网站制作 街道网页设计 大写数字 热点城市 热点地区 热点街道 热点时间 房贷计算器