#####计算前一个月的第一天与最后一天
time = datetime.date(2017, 7, 20) #年,月,日 #求该月第一天 first_day = datetime.date(time.year, time.month-3, 1)
print(first_day) #求前一个月的第一天 #前一个月最后一天 pre_month = first_day - datetime.timedelta(days = 1) #timedelta是一个不错的函数
d1 = datetime.datetime(2015,7,5)
d2 = datetime.datetime(2015,7,4)
(d1-d2).total_seconds()
/
/
结果
86400s
# 计算两个时间的间隔天数
# 注意:输入月份和天时,不能输入08,09等,会被识别为 8 进制而出错!(8进制是不超过07的)
# 解决办法:要把月份和天前面的0去掉。
将字符串时间转化成时间戳
st = datetime.datetime.strptime(START_TIME, "%Y-%m-%d %H:%M:%S")
将时间戳转化成字符串
day = Today.strftime("%Y-%m-%d")
计算两个时间戳之间相隔多少秒
(today1-Today).total_seconds()
根据时间戳来创建文件
import os import datetime # 年-月-日 时:分:秒 nowTime=datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S') # 年-月-日 dayTime = datetime.datetime.now().strftime('%Y-%m-%d') # 时:分:秒 hourTime = datetime.datetime.now().strftime('%H:%M:%S') print(nowTime + ' ' + dayTime + ' ' + hourTime) mobile = 176 pwd = os.getcwd() + '\' + dayTime + '\' + str(mobile) # print(pwd) # 判断文件夹是否已存在 isExists = os.path.exists(pwd) if not isExists: os.makedirs(pwd)
字符串格式更改
#a = "2019-12-17 23:40:00",想改为 a = "2019/12/17 23:40:00" #方法:先转换为时间数组,然后转换为其他格式 timeArray = time.strptime(a, "%Y-%m-%d %H:%M:%S") otherStyleTime = time.strftime("%Y/%m/%d %H:%M:%S", timeArray)
创建指定的时间戳
from datetime import datetime datetime_now = datetime.now() # 创建当前时间的 datetime 对象 print(datetime_now) # 2018-08-07 15:11:44.255590 print(type(datetime_now)) # <class 'datetime.datetime'> dt = datetime(2018, 8, 3, 15, 30) # 用指定日期时间创建 datetime 对象 print(dt) # 2018-08-03 15:30:00 print(type(dt)) # <class 'datetime.datetime'> # 计算机起点时间的 datetime 对象 datetime(1970, 1, 1) # 1970-01-01 00:00:00 datetime.utcfromtimestamp(0) # 1970-01-01 00:00:00 datetime.fromtimestamp(0) # 1970-01-01 08:00:00
数据清洗
1.首先观察数据
#### pandas内置函数
data.info()
info()函数,这个函数会输出DataFrame里存放的数据信息。
2.将object数据转化成float数据
data = data.apply(pd.to_numeric, errors='coerce')
3.调用describe()函数
A = data.describe().T IQR = A['75%'] - A['25%']
为模型选取特征数据
data.corr()[['列名']].sort_values('列名')
在选择包括在这个线性回归模型中的特征时,我想在包含具有中等或较低相关系数的变量时略微宽容一些。 所以我将删除相关值的绝对值小于0.6的特征。