6个步骤从头开始编写机器学习算法：感知器案例研究

weiweipig

2018-11-12

关注关注

摘要： 通用版学习机器学习算法的方法，你值得拥有！

6个步骤从头开始编写机器学习算法：感知器案例研究

从0开始编写机器学习算法是一种非常好的体验

当你点击之后你会感到压力，因为其中有些算法比其他算法更复杂，所以我建议你从一些简单甚至更简单的算法开始，比如单层感知器。

以感知器为例从头开始编写算法,主要为以下6个步骤：

1.对算法有一个基本的了解；

2.找到一些不同的学习来源；

3.将算法分解成块；

4.从一个简单的例子开始；

5.使用可行的实现进行验证；

6.写下你的过程。

1、对算法进行基本的了解

如果你不了解基础知识，不要从零开始编写算法。

至少，你应该能够回答以下问题:

1.它是什么?

2.它的典型用途是什么?

3.使用条件是什么?

对于感知器，至少能够回答以下问题:

1.单层感知器是最基本的神经网络。它通常用于二分类问题(1或0，“是”或“否”)。

2.一些简单的用法可能是情绪分析(积极或消极反应)或贷款违约预测(“将违约”或“将不违约”)。对于这两种情况，决策边界都必须是线性的。

3.如果决策边界是非线性的，你就不能用感知器。对于这些问题，需要使用其他不同的方法。

6个步骤从头开始编写机器学习算法：感知器案例研究

2、使用不同的学习资源

在你对模型有了基本的了解之后，这个时候可以开始你的研究了。

有些人用教材学得更好，有些人用视频学得更好。我个人喜欢到处转转，使用各种各样的资源。

对于数学细节，教材讲的比较详细，但对于更实际的例子，我更喜欢博客帖子和视频。

对于感知器，这里有一些很好的学习资源:

教材

统计学习基础

机器学习理解:从理论到算法

博客

如何在Python中从Scratch开始实现感知器算法，Jason Brownlee

单层神经网络与梯度下降，Sebastian Raschka

视频

感知器训练

感知器算法的原理

3、将算法分解成块

现在我们已经收集了各种学习资源，是时候开始学习了。

与其从头到尾读一篇博客文章，不如先浏览一下章节标题和其他重要信息，写下要点，并试着概述算法。

在浏览了这些资料之后，我将感知器分为以下5个部分:

1.初始化权重；

2.将权重乘以输入，然后求和；

3.将结果与阈值进行比较以计算输出(1或0)；

4.更新权重；

5.重复以上步骤；

让我们详细讨论每一个部分。

1.初始化权重

首先初始化权重向量。权重的数量需要与特征的数量匹配。假设我们有三个特征，则权重向量如下所示：

6个步骤从头开始编写机器学习算法：感知器案例研究

权重向量通常被初始化为0，在本文中我们将继续使用它。

2.将权重乘以输入，然后求和

接下来，我们将权重乘以输入，然后求和。为了更容易理解，我在第一行中对权重及其对应的特征进行了着色。

6个步骤从头开始编写机器学习算法：感知器案例研究

在权重乘以特征之后，我们把它们加起来，这也被称为点积。

6个步骤从头开始编写机器学习算法：感知器案例研究

最后的结果为0，将这个零时的结果设为f。

3.和阈值进行比较

在计算出点积之后，我们需要将它与阈值进行比较。

这里选择用0作为阈值，但也可以用其他值作为阈值。

6个步骤从头开始编写机器学习算法：感知器案例研究

由于我们计算出来的点积f不大于我们的阈值(0)，所以估计值等于0。

我将估计值表示为带帽的y(又名“y hat”)，下标0表示第一行，也可以用1表示第一行，这无所谓。这里选择从0开始。

如果我们将这个结果与实际值进行比较，可以看到当前的权重没有正确地预测实际输出。

6个步骤从头开始编写机器学习算法：感知器案例研究

因为我们的预测不正确，所以进行下一步来更新权重。

4.更新权重

接下来更新权重，以下是要使用的方程：

6个步骤从头开始编写机器学习算法：感知器案例研究

基本原理是在迭代“n”处调整当前权重，以便在下一个迭代中得到一个新的权重“n+1”。

为了调整权重，我们需要设置一个“学习率”。这是用希腊字母“eta”表示。

这里选择用0.1表示学习率，也可以用其他值表示学习率，就像阈值的设置一样。

以下是到目前为止的总结:

6个步骤从头开始编写机器学习算法：感知器案例研究

继续计算在n=2时的权重。

6个步骤从头开始编写机器学习算法：感知器案例研究

我们已经成功地完成了感知器算法的第一次迭代。

5.重复以上步骤

由于算法没有计算出正确的输出，我们需要继续。通常需要多次迭代，遍历数据集中的每一行来更新权重。对数据集的一次完整遍历称为“epoch”。

因为数据集有3行，我们需要3次迭代才能完成1个epoch。

我们可以设置总的迭代次数或epoch来继续执行算法，比如指定30次迭代(或10个epochs)。

与阈值和学习率一样，epoch的数量是一个可以随意使用的参数。

在下一个迭代中，我们将继续讨论第二行特征。

6个步骤从头开始编写机器学习算法：感知器案例研究

这里不一一重复每一步了，以下是下一个点积的计算。

6个步骤从头开始编写机器学习算法：感知器案例研究

接下来，将点积和阈值进行比较，以计算新的估计值，更新权重，然后继续。如果数据是线性可分的，感知器就会收敛。

4、从一个简单的例子开始

现在我们已经手工将算法分解成块，现在用代码开始实现它。为了简单起见，从一个非常小的“玩具数据集”开始。对于这种类型的问题，一个好的小的线性可分离数据集是NAND门。这是数电中常用的逻辑门。

6个步骤从头开始编写机器学习算法：感知器案例研究

因为这是一个非常小的数据集，我们可以手动将其输入到Python中。

为了让模型计算偏差项，添加一个虚拟的特征“x0”表示第一列。

可以将偏差看作是截距项，模型可以正确地分离这两个类。

以下是输入数据的代码:

# Importing libraries
# NAND Gate
# Note: x0 is a dummy variable for the bias term
# x0 x1 x2
x = [[1., 0., 0.],
 [1., 0., 1.],
 [1., 1., 0.],
 [1., 1., 1.]]
y =[1.,
 1.,
 1.,
 0.]

与前一节一样，我将逐步详细介绍算法，编写代码并测试它。

1．初始化权重

第一步是初始化权重

# Initialize the weights
import numpy as np
w = np.zeros(len(x[0]))
Out:[ 0. 0. 0.]

请记住，权重向量的长度需要与特征的数量相匹配。对于这个NAND门的例子，长度是3。

2．将权重乘以输入，然后求和

接下来，我们将权重乘以输入，然后求和(即点积)。

同样，我们可以使用Numpy的dot()函数轻松地执行此操作。

我们从权重向量和第一行特征的点积开始。

# Dot Product
f = np.dot(w, x[0])
print f
Out:0.0

正如预期的那样，结果是0。

为了与上一节保持一致，我将点积赋给变量f。

3.与阈值进行比较

在计算了点积之后，将结果与阈值进行比较，从而对输出进行预测。

设定阈值z等于0。如果点积f大于0，我们的预测是1。否则，它就是零。

记住，这个预测通常是用一克拉的顶部来表示的，也被称为“帽子”，把预测值赋给变量yhat。

# Activation Function
z = 0.0
if f &gt; z:
 yhat = 1.
else:
 yhat = 0.
print yhat
Out:0.0

正如预期的那样，预测为0。

在上面的注释中，将这些代码称为“激活函数”，是更正式的名称。

查看NAND输出的第一行，可以看到实际值是1，由于我们的预测是错误的，所以需要继续更新权重。

4．更新权重

现在已经得出了预测值，准备更新权重。

我们需要设定一个学习率才能做到这一点。为了与前面的例子保持一致，将学习率“eta”赋值为0.1。

我将对每个权重的更新进行硬编码，使其更容易阅读。

# Update the weights
eta = 0.1
w[0] = w[0] + eta*(y[0] - yhat)*x[0][0]
w[1] = w[1] + eta*(y[0] - yhat)*x[0][1]
w[2] = w[2] + eta*(y[0] - yhat)*x[0][2]
print w
Out:[ 0.1 0. 0. ]

可以看到权重现在已经更新了，继续下去。

5．重复以上步骤

现在我们已经完成了每一个步骤，现在是时候把所有的东西放在一起了。

最后一个还没有讨论的是损失函数，即实现最小化的函数。在例子中，这将是平方和(SSE)误差。

6个步骤从头开始编写机器学习算法：感知器案例研究

这就是我们用来计算误差的方法，看看模型是如何运行的。

把所有这些都联系起来，完整的函数如下所示:

import numpy as np
# Perceptron function
def perceptron(x, y, z, eta, t):
 '''
 Input Parameters:
 x: data set of input features
 y: actual outputs
 z: activation function threshold
 eta: learning rate
 t: number of iterations
 '''
 # initializing the weights
 w = np.zeros(len(x[0])) 
 n = 0 
 # initializing additional parameters to compute sum-of-squared errors
 yhat_vec = np.ones(len(y)) # vector for predictions
 errors = np.ones(len(y)) # vector for errors (actual - predictions)
 J = [] # vector for the SSE cost function
 
 while n &lt; t: for i in xrange(0, len(x)): # dot product f = np.dot(x[i], w) # activation function if f &gt;= z: 
 yhat = 1. 
 else: 
 yhat = 0.
 yhat_vec[i] = yhat
 
 # updating the weights
 for j in xrange(0, len(w)): 
 w[j] = w[j] + eta*(y[i]-yhat)*x[i][j]
 
 n += 1
 # computing the sum-of-squared errors
 for i in xrange(0,len(y)): 
 errors[i] = (y[i]-yhat_vec[i])**2
 J.append(0.5*np.sum(errors))
 
 return w, J

现在已经编写了感知器的所有代码，开始运行它：

# x0 x1 x2
x = [[1., 0., 0.],
 [1., 0., 1.],
 [1., 1., 0.],
 [1., 1., 1.]]
y =[1.,
 1.,
 1.,
 0.]
z = 0.0
eta = 0.1
t = 50
print "The weights are:"
print perceptron(x, y, z, eta, t)[0]
print "The errors are:"
print perceptron(x, y, z, eta, t)[0]
Out:The weights are:
[ 0.2 -0.2 -0.1]
The errors are:
[0.5, 1.5, 1.5, 1.0, 0.5, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]

看一看上方的误差，可以看到误差在第6次迭代时趋于0，对于之后的迭代，始终为0。当误差趋于0时，表示模型收敛了。也就是说模型已经正确地“学习”了适当的权重。

在下一节中，我们将在更大的数据集上使用计算过的权重来做预测。

5、使用可行的实现进行验证

到目前为止，我们已经找到了不同的学习资源，手动完成了算法，并通过一个简单的例子在代码中测试了它。

现在是时候将结果与可行的实现进行比较了。为了比较，我们将使用scikit-learn中的感知器。

步骤如下：

1.导入数据；

2.将数据分成训练/测试集；

3.训练我们的感知器；

4.测试感知器；

5.和scikit-learn的感知器相比；

1．导入数据

从导入数据开始，可以在这里获得数据集的副本。

为了确保感知器能够正常工作，所创建的数据集是线性可分的。为了验证，继续绘制数据。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.read_csv("dataset.csv")
plt.scatter(df.values[:,1], df.values[:,2], c = df['3'], alpha=0.8)

6个步骤从头开始编写机器学习算法：感知器案例研究

上图很容易看出数据集轻易地被一条直线分开。

在继续之前，先来解释绘制数据的代码。

使用panda导入csv，它自动将数据放入dataframe中。

为了绘制数据，必须从dataframe中提取值，所以使用了.values方法。

特征在第1和第2列中，所以在散点图函数中使用了这些特征。第0列是包含1的虚拟特征，这样就能计算出截距。这与我们在前一节中对NAND gate所做的事情相似。

最后，在scatterplot函数中使用c = df['3']和alpha = 0.8为两个类着色。输出是第3列(0或1)中的数据，因此告诉函数使用第3列为两个类着色。

你可以在这里找到关于Matplotlib的散点函数的更多信息。

2．将数据分成训练/测试集

既然我们已经确认了数据可以线性分离，那么现在就该分离数据了。在单独的数据集上训练模型和测试数据集是很好的实践，能够避免过拟合。分离数据有不同的方法，但为了简单起见，这里使用一个训练集和一个测试集。

我先整理一下我的数据。如果查看原始文件，你会看到数据是按输出(第三列)中0的行进行分组的，然后是所有的1。我想要改变一下，增加一些随机性，所以我要洗牌。

df = df.values 
np.random.seed(5)
np.random.shuffle(df)

我首先将数据从dataframe改为numpy数组。这将更容易地使用许多numpy函数，例如.shuffle。

为了让结果重现，我设置了一个随机种子(5)。完成后，尝试改变随机种子，看看结果如何变化。

接下来把70%的数据分成训练集，30%分成测试集。

train = df[0:int(0.7*len(df))]
test = df[int(0.7*len(df)):int(len(df))]

最后一步是分离训练和测试集的特征和输出。

x_train = train[:, 0:3]
y_train = train[:, 3]
x_test = test[:, 0:3]
y_test = test[:, 3]

我选择了70%/30%作为训练/测试集，只是为了这个示例，但我希望你研究其他方法，比如k-fold交叉验证。

3.训练感知器

接下来，我们要训练感知器。

这非常简单，我们将重用在前一节中构建的代码。

def perceptron_train(x, y, z, eta, t):
 ''' Input Parameters:
 x: data set of input features
 y: actual outputs
 z: activation function threshold
 eta: learning rate
 t: number of iterations
 '''
 # initializing the weights
 w = np.zeros(len(x[0])) 
 n = 0 
 # initializing additional parameters to compute sum-of-squared errors
 yhat_vec = np.ones(len(y)) # vector for predictions
 errors = np.ones(len(y)) # vector for errors (actual - predictions)
 J = [] # vector for the SSE cost function
 
 while n &lt; t: for i in xrange(0, len(x)): # dot product f = np.dot(x[i], w) # activation function if f &gt;= z: 
 yhat = 1. 
 else: 
 yhat = 0.
 yhat_vec[i] = yhat
 
 # updating the weights
 for j in xrange(0, len(w)): 
 w[j] = w[j] + eta*(y[i]-yhat)*x[i][j]
 
 n += 1
 # computing the sum-of-squared errors
 for i in xrange(0,len(y)): 
 errors[i] = (y[i]-yhat_vec[i])**2
 J.append(0.5*np.sum(errors))
 return w, J
z = 0.0
eta = 0.1
t = 50
perceptron_train(x_train, y_train, z, eta, t)

让我们来看看权重和平方误差之和。

w = perceptron_train(x_train, y_train, z, eta, t)[0]
J = perceptron_train(x_train, y_train, z, eta, t)[1]
print w
print J
Out:
[-0.5 -0.29850122 0.35054929]
[4.5, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]

权值现在对我们来说意义不大，但我们将在下一节中使用这些数字来测试感知器，还将使用权重来比较我们的模型和scikit-learn模型。

看一下平方误差之和，我们可以看到感知器已经收敛，这是我们期望的，因为数据是线性可分的。

4．测试感知器

现在是测试感知器的时候了。为此，我们将构建一个小型的perceptron_test函数。这和我们已经看到的很相似。这个函数使用perceptron_train函数计算的权值的点积，以及特征，以及激活函数来进行预测。

我们唯一没有看到的是accuracy_score，这是一个来自scikit-learn的评估度量函数，你可以在这里了解更多。

把所有这些放在一起，以下是具体的代码实现:

from sklearn.metrics import accuracy_score
w = perceptron_train(x_train, y_train, z, eta, t)[0]
def perceptron_test(x, w, z, eta, t):
 y_pred = []
 for i in xrange(0, len(x-1)):
 f = np.dot(x[i], w) 
 # activation function
 if f &gt; z: 
 yhat = 1 
 else: 
 yhat = 0
 y_pred.append(yhat)
 return y_pred
y_pred = perceptron_test(x_test, w, z, eta, t)
print "The accuracy score is:"
print accuracy_score(y_test, y_pred)
Out:
The accuracy score is:
1.0

准确度为1.0表明我们的模型正确地预测了所有的测试数据。这个数据集显然是可分离的，所以我们期望这个结果。

5、和scikit-learn的感知器相比

最后一步是将我们的结果与scikit-learn的感知器进行比较。下面是这个模型的代码:

from sklearn.linear_model import Perceptron
# training the sklearn Perceptron
clf = Perceptron(random_state=None, eta0=0.1, shuffle=False, fit_intercept=False)
clf.fit(x_train, y_train)
y_predict = clf. Predict(x_test)

现在我们已经训练了模型，让我们将权重与模型计算的权重进行比较。

Out:
sklearn weights:
[-0.5 -0.29850122 0.35054929]
my perceptron weights:
[-0.5 -0.29850122 0.35054929]

scikit-learn模型中的权重与我们的相同，这意味着我们的模型工作正常。

在我们结束之前，有几个小问题需要解决一下。在scikit-learn模型中，我们必须将随机状态设置为“None”并关闭变换，但我们已经设置了一个随机种子并打乱了数据，所以我们不需要再这样做了。

我们还必须将学习率“eta0”设置为0.1，以与我们的模型相同。

最后一点是截距。因为我们已经包含了一个虚拟的特征列1s，我们正在自动拟合截距，所以我们不需要在scikit-learn感知器中打开它。

这些看起来都是次要的细节，但如果我们不设置这些，就无法达到与我们的模型相同的结果。

这一点很重要。在使用模型之前，阅读文档并理解所有不同设置的作用是非常重要的。

6、写下你的过程

这个过程中的最后一步可能是最重要的。你已经完成了所有的工作，包括学习、记笔记、从头开始编写算法，并将其与可行的实现进行比较，不要让所有的好工作白白浪费掉!

写下这个过程很重要，原因有二:

1、你会得到更深的理解，因为你正在教导别人你刚刚学到的东西。

2、你可以向潜在雇主展示它。

证明你可以从机器学习库中实现一个算法是一回事，但如果你可以自己从头实现它，那就更令人印象深刻了。一个展示你作品的好方法是使用GitHub页面组合。

结论

在这篇文章中，我们学习了如何从零开始编写实现感知器。更重要的是，我们学习了如何找到有用的学习资源，以及如何将算法分解成块。

然后，我们学习了如何使用一个玩具数据集在代码中实现和测试算法。

最后，我们通过比较我们的模型和可行实现的结果来结束本文。要获得使用的Python代码的完整副本，单击下面的绿色按钮。

这是在更深层次上学习算法的一个很好的方法，这样就可以自己实现它了。

大多数情况下，你将使用可行的实现，但如果你真的想深入了解底层的情况，从头实现它是一个很好的练习。

文章原标题《machine-learning-from-scratch》

作者：dataoptimal 译者：虎说八道，审校：。

机器学习感知器 python机器学习人工智能算法权重

weiweipig

0 关注 0 粉丝 0 动态

关注关注

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 2020-11-02

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 2020-11-10

如果不能用Python执行机器学习，那该用什么呢？

长期学习数据科学的人一定知道如何用Python、R和Julia这些语言执行机器学习任务。然而，如果速度很关键，但硬件很有限，或者所在公司仅使用SQL进行预测分析，又该怎么办呢?答案就是——数据库内的机器学习。下面将使用Oracle机器学习在著名的Iris数

mori 2020-11-06

这里有你需要的5个机器学习必备技能

机器学习，听起来很酷。这名字不禁令人以为是一排机器人坐着学习知识的样子，但其实是让机器人拥有像人一样的学习能力的高端技术，这样就能高效快捷地从数据中找出有用的东西。云计算服务支持构建和部署AI及机器学习应用程序的种种功能。除了专业外，作为IT团队成员一定要

jaybeat 2020-11-02

在云端你需要的5个机器学习技能

机器学习和AI继续深入IT服务中，并补充软件工程师开发的应用程序。如果IT团队想跟上这种步伐，必须提高他们的机器学习技能。云计算服务支持构建和部署AI及机器学习应用程序的各种功能。在很多方面，AI系统的管理与IT专业人员在云端熟悉的其他软件非常相似。但是，

changyuanchn 2020-11-01

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 2020-11-16

选择困难终结者：不同问题之下的机器学习算法

刚开始学习数据科学时，笔者经常面临这样一个问题：遇到具体问题，选择何种算法才合适。也许你也和我一样，搜了很多有关机器学习算法的文章，会看到许多详细的描述，却并没有减少让抉择的难度。问题陈述2：深挖客户统计数据用以识别模式。问题陈述12：根据车辆特性预估车辆

lwnylslwnyls 2020-11-06

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 2020-11-12

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 2020-11-11

安科网

6个步骤从头开始编写机器学习算法：感知器案例研究

weiweipig

weiweipig

相关推荐

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

面向深度学习的五大神经网络模型及其应用

关于机器学习管道需要了解什么?

Python 用5行代码学机器学习—线性回归

如果不能用Python执行机器学习，那该用什么呢？

这里有你需要的5个机器学习必备技能

在云端你需要的5个机器学习技能

关于机器学习算法的16个技巧

选择困难终结者：不同问题之下的机器学习算法

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何通过7个步骤构建机器学习模型

机器学习新风暴：如何用ML模型预测房价？

为什么所有的机器学习模型有90％从没有投入生产

LinkedIn开源Dagli，发布Java机器学习函数库

全面解读谷歌云人工智能如何为机器学习提供帮助

需要知识的后深度学习时代，如何高效自动构建知识图谱

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

24个提高知识和技能极限的机器学习项目

IT自动化和人工智能将在2021年走向何方？

weiweipig