100天搞定机器学习|Day2简单线性回归分析
第一天机器学习100天|Day1数据预处理,我们学习了数据预处理。知道了,数据预处理是机器学习中最基础和最麻烦,未来占用时间最长的一步操作。数据预处理一般有六个步骤,导入库、导入数据集、处理缺失值、分类数据转化、分出训练集和测试集、特征缩放等。在处理数据过程中,必须得两个库是numpy和pandas,也用到sklearn.preprocessing中的Imputer,LabelEncoder,OneHotEncoder,StandardScaler。 算法本身很简单,之前也有文章做过算法的解读,有兴趣的同学请移步: 机器学习算法Python实现--线性回归分析 很早之前还用R做过一个R语言教程之-线性回归 下面开始,四步搞定简单线性回归分析 第一步:数据预处理 import pandas as pd from sklearn.linear_model import LinearRegression Sklearn包含的常用算法 LinearRegression(fit_intercept=True,normalize=False,copy_X=True,n_jobs=1) fit_intercept:是否计算截距。 LinearRegression官网有具体用法,比较简单,不想移步的同学只需知道下面几个用法即可 fit(X,y,sample_weight=None):X,y以矩阵的方式传入,而sample_weight则是每条测试数据的权重,同样以array格式传入。 Y_pred = regressor.predict(X_test) 训练集结果可视化 plt.scatter(X_train,color = 'red') 测试集结果可视化 plt.scatter(X_test,Y_test,color = 'red') (编辑:北几岛) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |