-
《统计学习方法》极简笔记P2:感知机数学推导
所属栏目:[大数据] 日期:2021-05-21 热度:152
感知机模型 输入空间是$chisubseteqmathbb{R}^n$,输出空间是$y={+1,-1}$@H_404_3@感知机定义为:$f(x)=sign(wx+b)$ 感知机学习策略 输入空间任一点$x_0$到超平面S的距离:@H_404_3@$frac{1}{||w||}|wx_0+b|$@H_404_3@误分类数据$(x_i,y_i)$,有$-y_i(wx_i[详细]
-
100天搞定机器学习|Day23-25 决策树及Python实现
所属栏目:[大数据] 日期:2021-05-21 热度:196
算法部分不再细讲,之前发过很多: 【算法系列】决策树 决策树(Decision Tree)ID3算法 决策树(Decision Tree)C4.5算法 决策树(Decision Tree)CART算法 ID3、C4.5、CART三种决策树的区别 实验: 导入需要用到的python库 import numpy as npimport matpl[详细]
-
100天搞定机器学习|Day13-14 SVM的实现
所属栏目:[大数据] 日期:2021-05-21 热度:166
昨天我们学习了支持向量机基本概念,重申数学推导原理的重要性并向大家介绍了一篇非常不错的文章。今天,我们使用Scikit-Learn中的SVC分类器实现SVM。我们将在day16使用kernel-trick实现SVM。 导入库 import numpy as np import matplotlib.pyplot as plt im[详细]
-
100天搞定机器学习|Day9-12 支持向量机
所属栏目:[大数据] 日期:2021-05-21 热度:139
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|Day7 K-NN 100天搞定机器学习|Day8 逻辑回归的数学原理 第九天直观了解SVM是什么以及如何[详细]
-
100天搞定机器学习|day39 Tensorflow Keras手写数字识别
所属栏目:[大数据] 日期:2021-05-21 热度:108
提示:建议先看day36-38的内容 TensorFlow? 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种[详细]
-
100天搞定机器学习|Day22 机器为什么能学习?
所属栏目:[大数据] 日期:2021-05-21 热度:96
前情回顾 机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|Day7 K-NN 100天搞定机器学习|Day8 逻辑回归的数学原理 100天搞定机器学习|Day9-[详细]
-
100天搞定机器学习|Day17-18 神奇的逻辑回归
所属栏目:[大数据] 日期:2021-05-21 热度:198
前情回顾 机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|Day7 K-NN 100天搞定机器学习|Day8 逻辑回归的数学原理 100天搞定机器学习|Day9-[详细]
-
100天搞定机器学习|Day35 深度学习之神经网络的结构
所属栏目:[大数据] 日期:2021-05-21 热度:139
100天搞定机器学习|Day1数据预处理@H_403_1@ 100天搞定机器学习|Day2简单线性回归分析@H_403_1@ 100天搞定机器学习|Day3多元线性回归@H_403_1@ 100天搞定机器学习|Day4-6 逻辑回归@H_403_1@ 100天搞定机器学习|Day7 K-NN@H_403_1@ 100天搞定机器学习|Day8 逻[详细]
-
100天搞定机器学习|day37 无公式理解反向传播算法之精髓
所属栏目:[大数据] 日期:2021-05-21 热度:188
?100天搞定机器学习(Day1-34) 100天搞定机器学习|Day35 深度学习之神经网络的结构 100天搞定机器学习|Day36?深度学习之梯度下降算法 本篇为100天搞定机器学习之第37天,亦为3Blue1Brown《深度学习之反向传播算法》学习笔记。 上集提到我们要找到特定权重和[详细]
-
哈佛大学《CS50 Python人工智能入门》公开课 (2020)
所属栏目:[大数据] 日期:2021-05-21 热度:136
课程介绍 本课程探讨现代人工智能基础上的概念和算法,深入探讨游戏引擎、手写识别和机器翻译等技术的思想。通过实践项目,学生在将图形搜索算法、分类、优化、强化学习以及其他人工智能和机器学习的主题融入到他们自己的Python程序中,从而获得图形搜索算法[详细]
-
机器学习160道面试题
所属栏目:[大数据] 日期:2021-05-21 热度:122
数据科学职位的典型面试过程会有很多轮,其中通常会涉及理论概念,目的是确定应聘者是否了解机器学习的基础知识。 在这篇文章中,我想总结一下我所有的面试经历(面试or被面试)并提出了160多个数据科学理论问题的清单。 其中包括以下主题: 线性回归 模型验[详细]
-
Python分析大数据,推荐四款加速器
所属栏目:[大数据] 日期:2021-05-21 热度:64
在数据科学计算、机器学习、以及深度学习领域,Python 是最受欢迎的语言。Python 在数据科学领域,有非常丰富的包可以选择,numpy、scipy、pandas、scikit-learn、matplotlib。 但这些库都仅仅受限于单机运算,当数据量很大时,比如50GB甚至500GB的数据集,[详细]
-
100天搞定机器学习
所属栏目:[大数据] 日期:2021-05-21 热度:50
100天搞定机器学习 大家好,100天搞定机器学习前54天是对Avik-Jain开源项目100-Days-Of-ML-Code的翻译+自己的理解 https://github.com/Avik-Jain/100-Days-Of-ML-Code 但是这个项目到54天就鸽掉了,十分可惜。 从第55天开始,我将续写这个栏目。 由于之前的[详细]
-
台大李宏毅机器学习公开课2020版登陆B站
所属栏目:[大数据] 日期:2021-05-21 热度:151
课程简介: 真正大师的课程往往都是免费的,诸如吴恩达,李飞飞等。不过大家应该对李宏毅老师也不陌生吧?很多机器学习初学者,首选李宏毅老师。毕竟中文授课,而且他讲课通俗易懂、课程案例生动有趣(还记得宝可梦和帝国时代)。 近期,他的《机器学习2020[详细]
-
众所周知,B站并不是个学习网站
所属栏目:[大数据] 日期:2021-05-21 热度:90
立了一个Flag鸽鸽鸽鸽 我喜立Flag,9月份说要做点视频,不知不觉已经鸽了俩月了。中间就零星时间学了一些剪辑方面的知识,工作太忙,视频一直没有实质进展。视频的灵魂其实是脚本,到现在还没写好。我还是稍微擅长点技术创作,但是纯技术的视频肯定没有市场,[详细]
-
【转】 分类模型评估指标汇总
所属栏目:[大数据] 日期:2021-05-21 热度:88
作者:努力的孔子 https://www.cnblogs.com/yanshw/p/10735079.html 对模型进行评估时,可以选择很多种指标,但不同的指标可能得到不同的结果,如何选择合适的指标,需要取决于任务需求。 正确率与错误率 正确率 :正确分类的样本数/总样本数,accuracy 错误[详细]
-
机器学习怎么入门?这有一套完整的入门到精通路线图
所属栏目:[大数据] 日期:2021-05-21 热度:58
前天推送了一篇学习路线图的文章《Awesome!超详细的人工智能专家路线图,GitHub数天获2.1k星》 该路线图几乎涵盖了 AI 领域所有的知识点,并且每个知识点都有详细的文档。有了这个路线图的指导,或许能帮助你快速入门乃至成为 AI 领域的佼佼者。该项目上线[详细]
-
100天搞定机器学习|day44 k均值聚类数学推导与python实现
所属栏目:[大数据] 日期:2021-05-21 热度:163
[如何正确使用「K均值聚类」? 1、k均值聚类模型 给定样本 ,每个样本都是m为特征向量,模型目标是将n个样本分到k个不停的类或簇中,每个样本到其所属类的中心的距离最小,每个样本只能属于一个类。用C表示划分,他是一个多对一的函数,k均值聚类就是一个从[详细]
-
北京大学公开课《数据结构与算法Python版》
所属栏目:[大数据] 日期:2021-05-21 热度:147
之前我分享过一个数据结构与算法的课程,很多小伙伴私信我问有没有Python版。 看了一些公开课后,今天特向大家推荐北京大学的这门课程:《数据结构与算法Python版》。 课程概述 很多同学想要转行机器学习,也确实掌握了一些机器学习模型原理并具备基础的编程[详细]
-
Python数据预处理:彻底理解标准化和归一化
所属栏目:[大数据] 日期:2021-05-21 热度:146
数据预处理 数据中不同特征的量纲可能不一致,数值间的差别可能很大,不进行处理可能会影响到数据分析的结果,因此,需要对数据按照一定比例进行缩放,使之落在一个特定的区域,便于进行综合分析。 常用的方法有两种: 最大 - 最小规范化:对原始数据进行线[详细]
-
机器学习基础:台大李宏毅的线性代数视频公开课
所属栏目:[大数据] 日期:2021-05-21 热度:51
大家应该对李宏毅老师不陌生吧?李宏毅现任国立台湾大学电气工程系助理教授,研究重点是机器学习(尤其是深度学习方向)、口语理解和语音识别。他的人工智能系列公开课是Youtube上最火的人工智能系列课程。很多机器学习初学者都学习过他的《机器学习》公开课[详细]
-
100天搞定机器学习|day43 几张GIF理解K-均值聚类原理
所属栏目:[大数据] 日期:2021-05-21 热度:164
前文推荐 如何正确使用「K均值聚类」? KMeans算法是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 K个初始聚类中心[详细]
-
机器学习最好的入门课程是什么?
所属栏目:[大数据] 日期:2021-05-21 热度:164
最近老胡不太忙了,项目告一段落,摸鱼时间多了一些。 昨天我翻译了一个思维导图《超详细的人工智能专家路线图》 强烈建议没有看的同学看一看,查漏补缺必备 机器学习从 入 门 到 精 通 路 线 图 https://mp.weixin.qq.com/s?__biz=MzA4MjYwMTc5Nw==mid=2648[详细]
-
《统计学习方法》极简笔记P5:决策树公式推导
所属栏目:[大数据] 日期:2021-05-21 热度:126
《统计学习方法》极简笔记P2:感知机数学推导 《统计学习方法》极简笔记P3:k-NN数学推导 《统计学习方法》极简笔记P4:朴素贝叶斯公式推导[详细]
-
Pandas切片操作:很容易忽视的SettingWithCopyWarning
所属栏目:[大数据] 日期:2021-05-21 热度:71
Pandas是一个强大的分析结构化数据的工具集,主要用于数据挖掘和数据分析,同时也提供数据清洗功能。 很多初学者在数据的选取,修改和切片时经常面临一些困惑。这是因为Pandas提供了太多方法可以做同样的事情,方法选择不当,可能导致一些意想不到的错误。 P[详细]