相关性是指涉及两个数据集之间相关性的一些统计关系。 依赖现象的简单例子包括父母与其后代的外表之间的相关性,以及产品价格与其供应量之间的相关性。
以在seaborn python库中提供的虹膜数据集为例。 其中我们试图建立三种鸢尾花的萼片和花瓣的长度和宽度之间的相关性。 根据发现的相关性,可以创建一个强大的模型,从而就能容易地区分一个物种与另一个物种。
import matplotlib.pyplot as plt import seaborn as sns df = sns.load_dataset('iris') #without regression sns.pairplot(df, kind="scatter") plt.show()
执行上面示例代码,得到以下结果 -