教你用python从日期中获取年、月、日和星期等30种信息
作者:python技巧(数据分析及可视化) 发布时间:2023-05-06 22:32:38
标签:python,日期,年月日
这次介绍日期数据处理。
用python中的方法对日期数据进行处理, 我们可以获取很多有用的信息, 比如年月日,星期,周次,季度等, 这里分享工作和数据竞赛30余种常用的转换方法。
1 计算日期的年月日时分秒,星期,周次…
用pandas的read_excel()方法读取excel表数据,将表格中"日期"列转日期格式
import pandas as pd
import numpy as np
import datetime
df = pd.read_excel('./日期问题.xlsx')
#将日期列转成日期格式
df['日期'] = pd.to_datetime(df['日期'])
dt模块可轻松获取日期基本属性
# 转年月日格式(字符串文本)
df['年月日'] = df['日期'].apply(lambda x: x.strftime('%Y%m%d'))
df['年']=df['日期'].dt.year
df['季度']=df['日期'].dt.quarter
df['月']=df['日期'].dt.month
df['日']=df['日期'].dt.day
df['星期几']=df['日期'].dt.dayofweek
df['周次']=df['日期'].dt.week
df['时']=df['日期'].dt.hour
df['分']=df['日期'].dt.minute
df['秒']=df['日期'].dt.second
2计算一年中的第几天, 第几个10分钟, 日期转数值
通过对天, 时,分的四则运算将日期转为序列数值数据
df['一年中的第几天']=df['日期'].dt.dayofyear
df['一天中的第几分钟']=df['日期'].apply(lambda x: x.minute + x.hour*60)
df['一天中的第几个10分钟'] = df['时'] * 6 + df['分'] // 10
df['数值'] = df["日期"].values.astype(np.int64) // 10 ** 9
# 转年月(数值)
df['年月'] = df['日期'].dt.year * 100 + df['日期'].dt.month
3判断日期是否闰年,年初年末,月初月末…
apply() 和lambda()方法使用. python中2个强大的高阶函数.
df['是否闰年'] = df['日期'].apply(lambda x: x.is_leap_year) # 是否闰年
df['是否月初'] = df['日期'].apply(lambda x: x.is_month_start) # 是否月初
df['是否月末'] = df['日期'].apply(lambda x: x.is_month_end) # 月末
df['是否季节初'] = df['日期'].apply(lambda x: x.is_quarter_start) # 季度初
df['是否季节末'] = df['日期'].apply(lambda x: x.is_quarter_end) # 季度末
df['是否年初'] = df['日期'].apply(lambda x: x.is_year_start) # 年初
df['是否年尾'] = df['日期'].apply(lambda x: x.is_year_end) # 年内末
df['是否周末'] = df['日期'].apply(lambda x: True if x.dayofweek in [5, 6] else False) # 是否周末
df.loc[((df['时'] >= 8) & (df['时'] < 22)), '是否营业时间'] = True
4字符串时段,季节
构造字典, 用map方法进行替换.
period_dict ={
23: '深夜', 0: '深夜', 1: '深夜',
2: '凌晨', 3: '凌晨', 4: '凌晨',
5: '早晨', 6: '早晨', 7: '早晨',
8: '上午', 9: '上午', 10: '上午', 11: '上午',
12: '中午', 13: '中午',
14: '下午', 15: '下午', 16: '下午', 17: '下午',
18: '傍晚',
19: '晚上', 20: '晚上', 21: '晚上', 22: '晚上',
}
df['时间段']=df['时'].map(period_dict)
# 一年中的哪个季度
season_dict = {
1: '春季', 2: '春季', 3: '春季',
4: '夏季', 5: '夏季', 6: '夏季',
7: '秋季', 8: '秋季', 9: '秋季',
10: '冬季', 11: '冬季', 12: '冬季',
}
df['季节']=df['月'].map(season_dict)
5for循环快捷计算
python中的getattr()方法
time_features = ['year', 'month', 'quarter', 'week', 'day', 'dayofweek', 'dayofyear']
dtype = np.int16
for time_feature in time_features:
df[time_feature] = getattr(df['日期'].dt, time_feature).astype(dtype)
6时间间隔天数计算
日期与一指定日期或者今天日期相比, 计算间隔天数
# 设置初始的时间
base_time = datetime.datetime.strptime('2021-06-01', '%Y-%m-%d')
# 计算时间差
df['时间差'] = df['日期'].apply(lambda x: x-base_time).dt.days
# 距离今天天数
df['间隔天数'] = list(map(lambda x: x.days, pd.to_datetime('today') - df['日期']))
补充:Python日期获取今天及昨天的年月日等信息
import time
from datetime import datetime, date, timedelta
# 当前日期
now_date = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
print("now_date: {}".format(now_date))
# 当前时间的年月日
year = datetime.now().year
month = datetime.now().month
day = datetime.now().day
print(f"year: {year}, month: {month}, day: {day}")
# 昨天
month_yesterday = (date.today() + timedelta(days=-1)).month
day_yesterday = (date.today() + timedelta(days=-1)).day
print(f"month_yesterday: {month_yesterday}, day_yesterday: {day_yesterday}")
输出结果:
now_date: 2022-06-01 11:22:11
year: 2022, month: 6, day: 1
month_yesterday: 5, day_yesterday: 31
来源:https://blog.csdn.net/muyashui/article/details/122562058
0
投稿
猜你喜欢
- 概述要访问一个变量的内容,可以直接使用其名称。如果该变量是一个数组,可以使用变量名称和关键字或索引的组合来访问其内容。像其他变量一样,使用运
- 这是 小马 在交流会中的分享,可能有些朋友还不曾了解,同时也为了自己温故而知新,就整理下。多种方式可以想像得到,有很多方法立即执行匿名函数,
- PDOStatement::bindValuePDOStatement::bindValue — 把一个值绑定到一个参数(PHP 5 >
- 背景:之前写的接口测试一直没有支持无限嵌套对比key,上次testerhome逛论坛,有人分享了他的框架,看了一下,有些地方不合适我这边自己
- 如下所示:from pymongo import MongoClient#建立和数据库系统的连接,指定host及port参数client =
- 都知道django每次请求都会连接数据库和释放数据库连接。Django为每个请求使用新的数据库连接。一开始这个方法行得通。然而随着服务器上的
- 本文为大家分享了virtualenv建立多个Python独立虚拟开发环境,供大家参考,具体内容如下1、安装virtualenv:pip in
- PHP sessionphp session 反序列化漏洞存在的原因:当序列化session和读取反序列化字符时采用的序列化选择器不一样时,
- 目录1、设定答题卡模板2、读取答题卡图像并对图像进行灰度化处理3、高斯模糊图像去噪点4、使用大津法二值分割图像5、使用开运算去噪点6、使用c
- 一、创建和管理表 1、创建表语法 create table 表名(column datatype [default expr][,colum
- 1、说明关键词传递以“形参变量名=实参”的形式参与实参关联,根据形参的名称进行参数传递,使实参和形参的顺序不一致。不用担心定义函数时参数的顺
- 问题描述先说明一下问题的由来:Django的模型中经常会用ForeignKey来关联其他表格数据class MeasureTask(mode
- 简单邮件传输协议(SMTP)是一种协议,用于处理在电子邮件服务器之间发送电子邮件和路由电子邮件。Python提供了smtplib模块,该模块
- 我设计第一篇网页的时候,就遇到了字体的设置问题。我发现如果用软件约定的字体大小,则显示效果会很难看的。我是用FrontPage2000作网页
- 之前一直在windows环境使用pycharm加上virtualenv方式开发,最近由于本地多个virtualenv比较混乱,所以尝试切换a
- 朴素贝叶斯(Naive Bayes,NB):朴素贝叶斯分类算法是学习效率和分类效果较好的分类器之一。朴素贝叶斯算法一般应用在文本分类,垃圾邮
- 简单低级的爬虫速度快,伪装度低,如果没有反爬机制,它们可以很快的抓取大量数据,甚至因为请求过多,造成服务器不能正常工作。而伪装度高的爬虫爬取
- 简要pyinstaller模块主要用于python代码打包成exe程序直接使用,这样在其它电脑上即使没有python环境也是可以运行的。用法
- 介绍matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方
- 本文实例讲述了Python实现的合并两个有序数组算法。分享给大家供大家参考,具体如下:思路按位循环比较两个数组,较小元素的放入新数组,下标加