机器学习算法性能的检测和调优方法【方法+代码】

常见的几种方法

1.收集更多样本
2.使用更小规模的方法
3.增加方法的规模
4.使用多项式
5.增加正则化参数λ

如何判断下一步该采用什么方法

引入概念,误差(error),可用下面公式求得

对于线性回归:

对于分类算法:

如何划分我们的样本

按照比例6:2:2划分为三个样本,训练集,验证集,测试集
训练集:找到方法参数theta
验证集:确定方法多项式的度数d
测试集:确定正则化参数λ

通过学习曲线来确定高方差/高偏差

[W6]机器学习应用建议

根据学习曲线来选择要使用哪种优化方法

同上

代码部分

1.error的计算代码

2.选取不同的正则化参数
一般使用的集合为 [0 0.001 0.003 0.01 0.03 0.1 0.3 1 3 10]

完整代码和pdf

这里

u3coding
A software developer

Leave a Comment

Your email address will not be published. Required fields are marked *

*