EOF 经验正交函数 分解原理及用法:
https://wenku.baidu.com/view/93bc8a9b680203d8ce2f2468.html
import numpy as np from scipy import linalg # 生成数据并打乱 np.random.seed(9) data = np.random.randint(low=1, high=50, size=600).reshape(20, 30) * 10 # 时间距平 mean = np.repeat(data.mean(axis=1), 30).reshape(20, 30) data = data - mean # 交叉积 C = np.dot(data, data.T) / 30 print(C) # 求特征值和特征向量 (空间模态) eigh求实对称矩阵的特征值 向量 la, v = linalg.eigh(C) # 空间模态矩阵 行代表着某个站点, 列代表第几空间模态 # 根据特征值对特征向量升序排序 index = np.argsort(la)[::-1] v = v[:, index] # 计算时间系数矩阵 第i行代表i-th时间模态 第k列代表k时刻时间系数 # 理论上这里就是pca, np.dot(v.T[0:2, :], data) 取前三个主成分 # 如果用sklearn 的PCA API 要先将 data 转成特征成列分布的,而不是成行分布,结果差不多, # 可能符号有区别 此外,sklearn的PCA考虑了计算成本是使用SVD分解实现的 # from sklearn.decomposition import PCA # pca_sk = PCA(n_components=2).fit_transform(data.T) PC = np.dot(v.T, data) # 证明PC具有正交性 pcpcpc = np.around(np.dot(PC, PC.T) / 30, 5) vvv = np.around(np.dot(v, v.T), 5) vvv_ = np.around(np.dot(v.T, v), 5) # 还原数据 data_reverse = np.dot(v, PC)