python线性回归实验--688IT编程网

实验算法python线性回归实验

【实验名称】

Python线性回归实验

【实验要求】

掌握Python线性回归模型应用过程，根据模型要求进行数据预处理，建模，评价与应用；

【背景描述】

线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。其表达形式为y = w'x+e，e为误差服从均值为0的正态分布。

【知识准备】

了解线性回归模型的使用场景，数据标准。了解Python/Spark数据处理一般方法。了解spark模型调用，训练以及应用方法

【实验设备】

Windows或Linux操作系统的计算机。部署Python，本实验提供centos6.8环境。

【实验说明】

采用成绩数据集作为算法数据，对模型进行训练和回归。

【实验环境】

Pyrhon3.X，实验在命令行python中进行，或者把代码写在py脚本，由于本次为实验，以学习模型为主，所以在命令行中逐步执行代码，以便更加清晰地了解整个建模流程。

【实验步骤】

第一步：启动python：

命令行键入python,启动python终端

第二步：导入用到的包，并读取数据：

(1).导入包:

import numpy as np

import pandas as pd

import statsmodels.formula.api as smf

import scipy

(2).读取数据并随机打乱,文件路径为:/opt/algorithm/

ad_csv("/opt/algorithm/",index_col=0,header=0).sample(frac=1)

(3).展示数据

df.head()

第三步：数据预处理

说明,数据集包含25门已修学科,以及一门目标学科

(1).划分训练集,测试集

PP = 0.8

df_train = df.iloc[:il(len(df) * PP))]

df_test = df.iloc[il(len(df) * PP)):]

(2).数据标准化,获取每列均值,标准差

avg_col = an()

td_col = df_train.std()

(3).标准化结果

df_train_norm = (df_train - avg_col) / td_col

df_train_norm.head()

第四步：特征提取及线性回归模型训练

基于F检验的特征选择

(1).由于建模需要标准化字符串,故需重命名表头

list_columns_to_train = df_lumns

change_columns = ['A' + str(zr + 1) for zr in np.arange(len(list_columns_to_train))]

df_lumns = change_columns

python怎么读取py文件co = dict(zip(change_columns, list_columns_to_train))

def R_transform(data=[], k=0):

r_L = data[k][k]

shape = np.mat(data).shape

R_t = np.zeros(shape)

for i in np.arange(shape[0]):

for j in np.arange(shape[1]):

if (i == k) & (j != k):

R_t[i][j] = data[k][j] / r_L

elif (i != k) & (j == k):

R_t[i][j] = -1 * data[i][k] / r_L

elif (i == k) & (j == k):

R_t[i][j] = 1.0 / r_L

elif (i != k) & (j != k):

R_t[i][j] = data[i][j] - data[i][k] * data[k][j] / r_L

return R_t

def forward_step(data, response="", F_in=0.01, F_out=0.5):

remaining = lumns)

last_drop = ""

Vld = "mark"

n = len(data)

# 因变量选择列

selected = []

l = len(selected)

# 计算相关系数矩阵

corr_R = ()

mark = 1

while (mark):

# 首次变量选择

if l != (lumns) - 1):

r_taget = pd.Series(np.diagonal(np.mat(corr_R)))

r_taget.index = remaining

Vi = corr_R[response] ** 2 / r_taget

Vc = Vi.drop(selected + [response], axis=0).sort_values()[-1]

Vl = Vi.drop(selected + [response], axis=0).sort_values().index[-1]

688IT编程网

python线性回归实验

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法

正则匹配c语言中8进制

fortran数据格式

python中文本转数字用的公式

gh 文本变数值

js判断输入是否为正整数、浮点数等数字的函数代码

qt浮点数正则表达式

QT正则表达式限制输入值

手机号码和电话号码的正则表达式

str转浮点-概述说明以及解释

英豪结尾的诗句

Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果

machinebuilder使用手册

ASP.NET网站建设基本常用代码

LCD显示实时时钟

经纬度正则表达式解析

前端科学计数法转数字

python正则表达式re之compile函数解析

pythonunittest之断言及示例

[lua]lua中匹配字符串小数

最新文章

nginx map用法正则

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

python中re.findall函数实例用法

nginx url表达式

nginx 正则匹配参数

标签列表

688IT编程网

python线性回归实验

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法

正则匹配c语言中8进制

fortran数据格式

python中文本转数字用的公式

gh 文本变数值

js判断输入是否为正整数、浮点数等数字的函数代码

qt浮点数正则表达式

QT正则表达式限制输入值

手机号码和电话号码的正则表达式

str转浮点-概述说明以及解释

英豪结尾的诗句

Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果

machinebuilder使用手册

ASP.NET网站建设基本常用代码

LCD显示实时时钟

经纬度正则表达式解析

前端科学计数法转数字

python正则表达式re之compile函数解析

pythonunittest之断言及示例

[lua]lua中匹配字符串小数

最新文章

nginx map用法 正则

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

python中re.findall函数实例用法

nginx url表达式

nginx 正则匹配参数

标签列表

nginx map用法正则

nginx map用法正则