机器学习

什么是机器学习?

Two definitions of Machine Learning are offered. Arthur Samuel described it as: “the field of study that gives computers the ability to learn without being explicitly programmed.” This is an older, informal definition.”

Tom Mitchell provides a more modern definition: “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

Example: playing checkers.

E = the experience of playing many games of checkers

T = the task of playing checkers.

P = the probability that the program will win the next game.

In general, any machine learning problem can be assigned to one of two broad classifications:

Supervised learning(监督学习) and Unsupervised learning(无监督学习).

监督学习

在监督学习中,我们获得了一个数据集,并且已经知道我们正确的输出应该是什么样子的,这意味着输入和输出之间有一个关系。

受监督的学习问题分为“回归”和“分类”问题。在回归问题中,我们试图在连续输出中预测结果,这意味着我们正在尝试将输入变量映射到一些连续函数。在分类问题中,我们试图用离散输出来预测结果。换句话说,我们正在尝试将输入变量映射到离散类别。

Example1:

根据房地产市场规模的数据,尝试预测房价。价格作为大小的函数是连续的输出,所以这是一个回归问题。

我们可以将这个例子变成一个分类问题,而不是让我们的产出是关于房子“卖出多于或者低于要价”。在这里,我们将房价分为两类。

Example2:

回归 - 鉴别一个人的图片,我们必须根据给定的图片来预测他们的年龄.

分类 - 鉴别肿瘤患者,我们必须预测肿瘤是恶性还是良性。

无监督学习

无监督学习使我们能够很少或不知道我们的结果应该如何处理问题。我们可以从数据中导出结构,我们不一定知道变量的影响。

我们可以通过基于数据中的变量之间的关系对数据进行聚类来导出该结构。

通过无监督的学习,基于预测结果没有反馈。

Example:

聚类:收集100万个不同的基因,并找到一种自动将这些基因组合成不同变量(如生命周期,位置,作用等)相似或相关的组。

非聚类:“鸡尾酒会算法”,让您在混乱的环境中找到结构。 (即,从鸡尾酒会的声音网格中识别个体声音和音乐)。

代价函数

我们可以使用代价函数来衡量我们的假设函数的准确性。这取决于x的输入和实际输出y的假设的所有结果的平均差异(实际上是平均值的平均值)。



此功能也称为“平方误差函数”或“均方误差”。平均值减半(12)作为计算梯度下降的便利,因为平方函数的导数项将抵消12项。以下图片总结了成本函数的作用:



轮廓图是包含许多轮廓线的图形。两个可变函数的轮廓线在同一行的所有点都具有一个恒定值。这样的图表的例子是下面的图。



采取任何颜色,沿着“圆”走,人们期望得到相同的成本函数值。例如,上面绿线上发现的三个绿点与J(θ0,θ1)具有相同的值,因此它们沿同一行找到。当θ0= 800和θ1= -0.15时,圆圈x显示左侧图形的成本函数值。再取另一个h(x)并绘制其轮廓图,得到以下图形:



当θ0= 360和θ1= 0时,轮廓图中J(θ0,θ1)的值越接近中心,从而降低成本函数误差。现在给出我们的假设函数稍微正斜率导致更好的数据拟合。



上面的图表尽可能地最小化了成本函数,因此θ1和θ0的结果分别为0.12和250左右。将图表上的这些值绘制到右边似乎将我们的观点置于内部最“圆”的中心。