from functools import reduce import pandas as pd import statsmodels.api as sm import numpy as np from scipy.optimize import minimize df = pd.read_csv("pheno.asd", sep="\s+", header=0) gmat = np.loadtxt("test.agrm.mat_fmt") X = np.array(df.loc[:, 'mean':'sex'], dtype=np.float64) y = np.array(df.loc[:, 'trait'], dtype=np.float64) logit = sm.Logit(y, X)
前几日,当我在调试这个程序的时候突然爆出了一个错误
我对 statsmodels 这个库使用的不多并没有反应出这个错误是什么
于是我问了神奇的度娘
我发现,并没有什么能一下子让我明白错误在哪的文章
于是我参照 python - 值错误 : endog must be in the unit interval - IT工具网 https://www.coder.work/article/1270243
这篇文章的一个解答其实是问题所在,但是我当时并不知道错在哪里,并没有找到很好的解决的办法
于是我去用excel分析了一下我的数据
他出现了0 1 之外的数字
我使用 statsmodels 这个库是为了拟合逻辑回归的初值
我筛选查看的这一列是放入的表型
也就是 y = np.array(df.loc[:, 'trait'], dtype=np.float64)
当使用函数 logit = sm.Logit(y, X) 拟合的时候便会出现错误,当修改数据使其不会出现除了0 1 之外的数据,报错解决