本文主要是介绍python 数据清洗之提取字符串中的日期,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
import re
import numpy as np
from dateutil import parser
def get_std_timeformater(val:str)->str:
if val != val:
return None # 当np.nan时,给出空值
val = re.sub(r'\s', '',val)
pattern = re.compile('\d{4}[\.\/年-]{,3}\d{1,2}[\.\/月-]{,3}\d{1,2}[\.\/日-]{,3}'
val_list = re.findall(pattern, val)
if val_list:
val = val_list[0] # 若字符串有多个日期 ,则只取第0个
if re.search(r'年|月|日', val):
val = re.sub('[年月日]', '', val)
if re.search(r"\/{2,}",val):
val = re.sub("\/{2,}", '/', val)
return parser.parse(val, yearfirst=True)
else:
return None #不能解析,则给出None
这篇关于python 数据清洗之提取字符串中的日期的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!