[W10]大数据学习

大数据学习 我的学习算法有时候会面对大数据的考验,我们需要做一些优化才能保证速度 随机梯度下降 传统的梯度下降法每次会遍历整个集合,效率较低,随机梯度下降不必每次都遍历,效率较高 首先引入几个公式 算法步骤 1.随机排序数据集合 2.遍历随机的数据,使用如下公式进行学习 [……] Read mo...

[W9]异常检测

异常检测动机 当我们有新的数据样本的时候,我们希望通过一个模型p(x)以及一个门槛值ϵ来判定这个样本是否是异常的。 高斯分布 高斯分布是一种可以被描述为的类钟型线。 具体公式是 其中几个参数的计算如下 普遍公式 只有公式部分不同,其余部分均与高斯分布相同 [……] Read more

[W8]聚集

非监督学习:介绍 非监督学习和监督学习相反,是一种无标签学习。 换而言之,我们不知道y的具体分类。 非监督学习适用于: 1.市场分割 2.社交网络分析 3.组织电脑集群 4.天文数据分析 K-Means算法 K-Means算法是最广泛应用的自动分类算法。 具体过程如下 1.随机在数据集合中初始[…̷...

[W7]支持向量机SVM

SVM支持向量机 支持向量机是一种监督学习算法,有时比现有算法更加简洁高效。 回顾一下逻辑回归的代价函数 注意展开后的第一项 当 θTx远远大于1的时候,此项接近于0 当 θTx远远小于1的时候,我们可以用一条直线来替代sigmoid曲线,最终图形如下 对于第[……] Read more

[W6]机器学习应用建议

采取什么措施来进一步优化 主要有五种措施 1.获取更多训练样本 2.尝试使用更小规模的特称 3.尝试增加特征 4.尝试使用多项式特征 5.增加或者减小正则参数λ 评估假设 我们如何评估一个已经做出的假设是否合理呢?也许我们的假设在训练集合上面有较好的表现,但是对于其他的数据却表现得不好。 这[……...

[W5]神经网络的学习

代价函数 首先需要定义几个变量 L = 这个神经网络的总层数 sl= 第L层的单元数量 K = 输出层的单元数量 在神经网络中,我们的输出节点不止一个,我们用hΘ(x)k 来表示第k个输出 还记得逻辑回归的代价函数吗? 对于神经网络来说,代价函数更加复杂一些 反向传播算法 [……] Read m...

[W4]神经网络的表示

非线性假设 前面我们提到过线性假设,我们可以理解为在这种情况下,我们的函数在平面上的图形是一条直线 而非线性假设的函数表达,并非直线,其中一个例子如下 我们大脑中的神经元 在我们大脑中,有许多叫做神经元的神奇的小东西,它有多个输入,多个输出,一个个的联结起来,构成了我们的神经系统。[……] Re...

[W3]逻辑回归以及正则化

布尔分类 在这样的分类种,只有两种情况,0或者1,类似于计算机中常用的布尔变量 逻辑回归 前面已经提到过线性回归,那么什么是逻辑回归呢,其实是一个关于自然底数e的函数,其定义和图像如下图 决策边界 有了上面两个部分的介绍,我们可以引出一个新的概念——决策边界 当一个数大于我们的[……] Read...

[W2]多参数线性回归相关问题

多参数线性回归 通过第一周的学习,我们知道了什么是单参数线性回归,那么多参数线性回归也就不难理解了,就是一个含多个参数的一阶函数,定义公式如下图 这个公式又可以表示为两个矩阵的乘积,如下图 代价函数 类似单变量的代价函数,同样是测量值与实际值之差的平方和的平均值 [……] Read more