为什么要从源代码构建Tensorflow？

Kindle君

2018-07-20

Tensorflow是谷歌广受欢迎的机器学习库。它于2015年推出，截至撰写本文时，它是世界上最受欢迎的机器学习库。使用pip安装Tensorflow非常简单直接。但是，tensorflow的官方最佳实践指南说，如果使用CPU，最好从源代码构建Tensorflow。这是为什么？这是因为从源代码构建时，您可以编译Tensorflow以使用可用于特定CPU的所有优化。这会产生重大影响。

首先，要从源代码构建，您需要安装Bazel，然后克隆Tensorflow github存储库。详细说明可在此处找到(https://www.tensorflow.org/install/install_sources)。完成后，您需要确定选项，以便优化CPU的构建。这可以通过两种方式完成：

谷歌。找出您正在使用的CPU以及可用于CPU的所有优化。
使用这个脚本(https://gist.github.com/venik/9ba962c8b301b0e21f99884cbd35082f)，适用于MacOS和Linux。它可以自动计算出您的CPU和平台，并使用所有正确的标志运行Bazel构建。

问题是它真的加快了性能吗？

首先，让我们进行基本矩阵乘法以查看加速。Python实现如下：

import tensorflow as tf

import time

m1 = []

m2 = []

result = []

i = 10

while i <= 10000:

m1.append(tf.random_uniform(shape = [i, i]))

m2.append(tf.random_uniform(shape = [i, i]))

i *= 10

for t1, t2 in zip(m1, m2):

result.append(tf.matmul(t1, t2))

sess = tf.Session()

for tensor in result:

start = time.time()

sess.run(tensor)

print(tensor.shape, time.time() - start)

结果如下：

为什么要从源代码构建Tensorflow？

速度从22％上升到52％，这看起来很有希望，接下来我们尝试使用神经网络。

我写了一个简单的前馈全连接神经网络分类器并使用了MNIST数据集。代码从命令行中获取了一个参数：隐藏层的数量。所以我将测试从3个隐藏层运行到10个隐藏层，每个层有1000个节点。Python代码如下：

from tensorflow.examples.tutorials.mnist import input_data

import sys

layers = int(sys.argv[1])

import tensorflow as tf

from time import time

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

x = tf.placeholder(tf.float32, [None, 784])

hiddenLayer = tf.layers.dense(x, 1000, activation = tf.nn.tanh)

lastLayer = hiddenLayer

for i in range(layers):

lastLayer = tf.layers.dense(lastLayer, 1000, activation = tf.nn.tanh)

output = tf.layers.dense(lastLayer, 10)

y_ = tf.placeholder(tf.float32, [None, 10])

cross_entropy = tf.nn.softmax_cross_entropy_with_logits_v2(labels = y_, logits = output)

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

sess = tf.Session()

sess.run(tf.global_variables_initializer())

then = time()

for _ in range(550):

print(_, end = "")

batch_xs, batch_ys = mnist.train.next_batch(100)

sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

print(layers, time() - then)

结果如下：

为什么要从源代码构建Tensorflow？

为什么要从源代码构建Tensorflow？

正如我们所看到的，增长速度是28-43%。那么卷积神经网络(CNN)呢?

我写了一个简单的CNN网络来分类相同的MNIST数据集。网络有n个卷积层，然后是最大池化层，然后是一个的全连接隐藏层。Python代码如下：

import tensorflow as tf

tf.logging.set_verbosity(tf.logging.ERROR)

from tensorflow.examples.tutorials.mnist import input_data

from time import time

import sys

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

image_size = 28

x = tf.placeholder(tf.float32, [None, 784])

input2d = tf.reshape(x, [-1, image_size, image_size, 1])

layers = int(sys.argv[1])

conv1 = tf.layers.conv2d(inputs=input2d, filters=32, kernel_size=[5, 5], padding="same", activation=tf.nn.relu)

conv = conv1

for i in range(layers):

conv = tf.layers.conv2d(inputs=conv, filters=32, kernel_size=[5, 5], padding="same", activation=tf.nn.relu)

pool1 = tf.layers.max_pooling2d(inputs=conv, pool_size=[2, 2], strides=2)

pool_flat = tf.layers.flatten(pool1)

hidden = tf.layers.dense(inputs= pool_flat, units=1024, activation=tf.nn.relu)

output = tf.layers.dense(inputs=hidden, units=10)

y_ = tf.placeholder(tf.float32, [None, 10])

cross_entropy = tf.nn.softmax_cross_entropy_with_logits_v2(labels = y_, logits = output)

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

sess = tf.Session()

sess.run(tf.global_variables_initializer())

then = time()

for _ in range(550):

print(_, end = "")

batch_xs, batch_ys = mnist.train.next_batch(100)

sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

print(layers, time() - then)

结果如下：

为什么要从源代码构建Tensorflow？

为什么要从源代码构建Tensorflow？

加速只有18-26％，为什么呢？为什么加速降低？这是因为当你从源码构建时，最大的加速是在矩阵乘法中，因为tensorflow使用Eigen进行矩阵乘法使用CPU，这是相当优化的。前馈神经网络主要由矩阵乘法组成，其中CNN大部分时间都在卷积中。

tensorflow 源代码 tensor

Kindle君

0 关注 0 粉丝 0 动态

相关推荐

对比PyTorch和TensorFlow的自动差异和动态模型

使用自定义模型类从头开始训练线性回归，比较PyTorch 1.x和TensorFlow 2.x之间的自动差异和动态模型子类化方法，这篇简短的文章重点介绍如何在PyTorch 1.x和TensorFlow 2.x中分别使用带有模块/模型API的动态子类化模型

lybbb 2020-10-15

如何在tensorflow中判断tensor(张量)的值

众所周知，在tensorflow程序中，tensor只是占位符，在会话层没有run出tensor的值之前，我们是无法获知tensor的值的。也就是说，下面的逻辑是无法实现的：。#a is a 1-D tensor, b is a 1-D tensor to

sherry颖 2020-08-01

TensorFlow 基础 (03)

项目再忙碌, 还是要抽出时间来学习的.继续学习一波, 不管了. 这篇来练习张量 tensor 的创建.Python 的这些 "容器" 或者数据结构, 用的最多的必然是 List 了, 各种骚操作哇. 然后做数据分析处理, Panda

源式羽语 2020-06-02

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 2020-10-27

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

操作张量并非易事，因为它需要很多先决条件，例如跟踪多个维度，Dtype兼容性，数学正确性和张量形状等。当然最大的挑战还是从数百种可用选项中确定正确的TensorFlow操作。如果会的话，谷歌的TensorFlow Coder可以帮你实现这一点。然后，它会运

lybbb 2020-09-29

TensorFlow推出新接口，简化 ML移动端开发流程

在移动设备上使用 TensorFlow Lite 模型运行推理不仅仅是与模型交互，还需要额外的代码来处理复杂的逻辑，如数据转换、预处理/后处理、加载关联文件等。今天，我们将为大家介绍TensorFlow Lite Task Library，这是一组功能强大

ghjk0 2020-09-24

如何在浏览器中使用TensorFlow？

TensorFlow 2.0引入的创新之一是JavaScript实现：TensorFlow.js。我没料到这会加快训练或推理速度，但确实如此，它通过WebGL API支持所有的GPU。TensorFlow.js是一个库，用于使用JavaScript开发

yamaxifeng 2020-09-09

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 2020-08-28

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

如何使编程更加便捷？最近，谷歌 TensorFlow 开源了一个帮助开发者写 TensorFlow 代码的程序合成工具 TF-Coder。用过 TensorFlow 框架的应该都知道，在操纵张量时，需要跟踪多个维度、张量形状和数据类型兼容性，当然还需要考虑

lybbb 2020-08-28

TensorFlow Lattice：灵活、可控、可解释的机器学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。大多数的机器学习实践者都曾遇到过训练数据和实际运行时用以评估模型的样本差别很大的情况。因此，相对灵活的机器学习解决方案，如DNN和随机森林等，仅依赖于训练数据的模型，在训练数据集和验证数据集没有覆盖的输入空间

Icevivian 2020-08-25

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

使用tensorflow进行音乐类型的分类

音乐流媒体服务的兴起使得音乐无处不在。我们在上下班的时候听音乐，锻炼身体，工作或者只是放松一下。这些数据可能来自出版歌曲的人手工标注。但这并不是一个很好的划分，因为可能是一些艺人想利用一个特定流派的流行趋势。在描述了所使用的数据源之后，我对我们使用的方法及

carbon0 2020-08-16

【tensorflow】常量和变量的定义

data1 = tf.constant # 声明常量。data2 = tf.Variable # 声明变量。print # 打印数据的

源式羽语 2020-08-09

TensorFlow会话常用的两种方式

需要注意的是我们可以使用两种方法来创建并使用session. 我们计算WX+b，其中W，X和b是从随机正态分布中抽取的。我们开始定义一个shape=（3,1）的常量X：。实现一个线性功能：。初始化X，类型为tensor的随机变量，维度为(3,1). res

songbinxu 2020-07-19

Ｍnist手写数字识别 Tensorflow

MNIST 数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology . 训练集由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局的

sherry颖 2020-07-18

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。也就是说，原本需要训练的权重现在被冻结了。让

Niteowl 2020-07-15

TensorFlow中超大的30个机器学习数据集

由谷歌Brain的研究人员创建的TensorFlow是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台，适用于初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习指南，以及开放数据集的语料库。为了帮助你找到所需的

Kindle君 2020-07-15

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

将visual c++ 升级到2019版本。安装完之后，即可解决该问题。

源式羽语 2020-07-04

Yolo v3 Introduction to object detection with TensorFlow 2

https://medium.com/analytics-vidhya/yolo-v3-introduction-to-object-detection-with-tensorflow-2-ce75749b1c47

源式羽语 2020-06-28

Kindle君

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号