csdn研发技术

举世瞩目的「深度神经网络」如何应用于移动端？

声明：本文来自有道技术团队的投稿，交流可致邮：[email protected]
责编：钱曙光（[email protected]）
欢迎加入CSDN人工智能技术交流QQ群（群号：299059314），内涵大量学习材料。

随着深度学习算法在图像领域中的成功运用，学术界的目光重新回到神经网络上；而随着 AlphaGo 在围棋领域制造的大新闻，全科技界的目光都聚焦在“深度学习”、“神经网络”这些关键词上。与大众的印象不完全一致的是，神经网络算法并不算是十分高深晦涩的算法；相对于机器学习中某一些数学味很强的算法来说，神经网络算法甚至可以算得上是“简单粗暴”。只是，在神经网络的训练过程中，以及算法的实际运用中，存在着许多困难，和一些经验，这些经验是比较有技巧性的。

有道云笔记不久前更新的文档扫描功能中使用了神经网络算法。本文试图以文档扫描算法中所运用的神经网络算法为线索，聊一聊神经网络算法的原理，以及其在工程中的应用。

背景篇

首先介绍一下什么是文档扫描功能。文档扫描功能希望能在用户拍摄的照片中，识别出文档所在的区域，进行拉伸(比例还原)，识别出其中的文字，最终得到一张干净的图片或是一篇带有格式的文字版笔记。实现这个功能需要以下这些步骤：

识别文档区域
将文档从背景中找出来，确定文档的四个角；
拉伸文档区域，还原宽高比
根据文档四个角的坐标，根据透视原理，计算出文档原始宽高比，并将文档区域拉伸还原成矩形。这是所有步骤中唯一具有解析算法的步骤；
色彩增强
根据文档的类型，选择不同的色彩增强方法，将文档图片的色彩变得干净清洁；
布局识别
理解文档图片的布局，找出文档的文字部分；
OCR
将图片形式的“文字”识别成可编码的文字；
生成笔记
根据文档图片的布局，从 OCR 的结果中生成带有格式的笔记。

在上述这些步骤中，“拉伸文档区域”和“生成笔记”是有解析算法或明确规则的，不需要机器学习处理。剩下的步骤中都含有机器学习算法。其中“文档区域识别”和“OCR”这两个步骤我们是采用深度神经网络算法来完成的。

之所以在这两个步骤选择深度神经网络算法，是考虑到其他算法很难满足我们的需求：

场景复杂，浅层学习很难很好的学习推广；

同时，深度神经网络的一些难点在这两个步骤中相对不那么困难

属于深度神经网络算法所擅长的图像和时序领域；
能够获取到大量的数据。能够对这些数据进行明确的标注。

接下来的内容中，我们将展开讲讲“文档区域识别”步骤中的神经网络算法。

算法篇

文档区域识别中使用的神经网络算法主要是全卷积网络(FCN)[1]。在介绍 FCN 前，首先简单介绍一下 FCN 的基础，卷积神经网络（这里假设读者对人工神经网络有最基本的了解）。

卷积神经网络(CNN, Convolutional Neural Networks)

卷积神经网络（CNN）早在 1962 年就被提出[2]，而目前最广泛应用的结构大概是 LeCun 在 1998 年提出的[3]。CNN 和普通神经网络一样，由输入、输出层和若干隐层组成。CNN 的每一层并不是一维的，而是有(长, 宽, 通道数)三个维度，例如输入层为一张 rgb 图片，则其输入层三个维度分别是(图片高度, 图片宽度, 3)。

与普通神经网络相比，CNN 有如下特点：

第 n 层的某个节点并不和第 n-1 层的所有节点相关，只和它空间位置附近的(n-1层)节点相关；
同一层中，所有节点共享权值；
每隔若干层会有一个池化(pool)层，其功能是按比例缩小这一层的长和宽(通常是减半)。常用的 pool 方法有局部极大值(Max)和局部均值(Mean)两种。

通过加入若干 pool 层，CNN 中隐层的长和宽不断缩小。当长宽缩小到一定程度(通常是个位数)的时候，CNN 在顶部连接上一个传统的全连接(Fully connected)神经网络，整个网络结构就搭建完成了。

CNN 之所以能够有效，在于它利用了图像中的一些约束。特点1对应着图像的局域相关性(图像上右上角某点跟远处左下角某点关系不大)；特点2对应着图像的平移不变性(图像右上角的形状，移动到左下角仍然是那个形状)；特点3对应着图像的放缩不变性(图像缩放后，信息丢失的很少)。这些约束的加入，就好比物理中”动量守恒定理“这类发现。守恒定理能让物体的运动可预测，而约束的加入能让识别过程变得可控，对训练数据的需求降低，更不容易出现过拟合。

全卷积网络(FCN, Fully Convolutional Networks)

全卷积网络(FCN)是 CNN 基础上发展起来的算法。与 CNN 不同，FCN 要解决这样的问题：图像的识别目标不是图像级的标签，而是像素级的标签。例如：

图像分割需要将图像根据语义分割成若干类别，其中每一个像素都对应着一个分类结果；
边缘检测需要将图像中的边缘部分和非边缘部分分隔开来，其中每一个像素都对应着“边缘”或“非边缘”。(我们面对的就属于这类问题)
视频分割将图像分割用在连续的视频图像中。

在 CNN 中，pool 层让隐层的长宽缩小，而 FCN 面对的是完整长宽的标签，如何处理这对矛盾呢？

一个办法是不使用 pool 层，让每一个隐层的长宽都等于完整的长宽。这样做的缺点是，一来计算量相当大，尤其是当运算进行到 CNN 的较高层，通道数达到几百上千的时候；二来不使用 pool 层，卷积就始终是在局域进行，这样识别的结果没有利用到全局信息。

另一个办法是转置卷积(convolution transpose)，可以理解为反向操作的 pool 层，或者上采样层，将隐层通过插值放缩回原来的长宽。这正是 FCN 采用的办法。当然，由于 CNN 的最后一个隐层的长宽很小，基本上只有全局信息，如果只对该隐层进行上采样，则局部细节就都丢失了。为此，FCN 会对 CNN 中间的几个隐层进行同样的上采样，由于中间层放缩的程度较低，保留了较多的局部细节，因而上采样的结果也会包含较多的局域信息。最后，将几个上采样的结果综合起来作为输出，这样就能比较好的平衡全局和局域信息。

整个 FCN 的结构如上图所示。FCN 去掉了 CNN 在顶部连接的全连接层，在每个转置卷积层之前都有一个分类器，将分类器的输出上采样(转置卷积)，然后相加。

上图是我们实验中真实产生的上采样结果。可以看到，层级较低的隐层保留了很多图片细节，而层级较高的隐层对全局分布理解的比较好。将二者综合起来，得到了既包含全局信息，又没有丢失局域信息的结果。

转置卷积(convolution transpose)

上文中出现的“转置卷积”是怎样实现的呢？顾名思义，转置卷积也是一种卷积操作，只不过是将 CNN 中的卷积操作的 Input 和 Output 的大小反转了过来。https://github.com/vdumoulin/conv_arithmetic 中提供了一系列转置卷积的图示，不过我个人认为更符合原意的转置卷积的图示如下图：

与 conv_arithmetric 提供的图示对比，可以看出上图只是卷积示意图的上下翻转。在实际运算中，Input 层的某个节点数值会（以卷积核为权重）加权相加到与该节点相关的每一个 Output 层节点上。

从维度上来看，如果记卷积核的高、宽为 H 和 W，Input 层的 channel 数为 C，Output 层的 channel 数为 O，那么一次正向卷积的输入节点数为 H * W * C，输出节点数为 O；而一次转置卷积运算的输入节点数为 C ，输出节点数为 H * W * O。

改进的 cross entropy 损失函数

在边缘识别问题中，每一个像素都对应着“边缘-非边缘”中的某一类。于是，我们可以认为每一个像素都是一个训练样本。这会带来一个问题：通常图片中的边缘要远少于非边缘，于是两类样本的数量悬殊。在模式识别问题中，类别不平衡会造成很多不可控的结果，是要极力避免的。

通常面对这种情况，我们会采用对少样本类别进行重复采样(过采样)，或是基于原样本的空间分布产生人工数据。然而在本问题中，由于同一张图中包含很多样本，这两种常用的方法都不能进行。该怎么解决样本数量悬殊问题呢？

2015 年 ICCV 上的一篇论文[4]提出了名为 HED 的边缘识别模型，试着用改变损失函数(Loss Function)的定义来解决这个问题。我们的算法中也采用了这种方法。

首先我们概述一下 CNN 常用的 cross entropy 损失函数。在二分类问题里，cross entropy 的定义如下：

这里 l 为损失值，n 为样本数，k 表示第几个样本，Q 表示标签值，取值为 0 或者 1，p 为分类器计算出来的”该样本属于类别 1 “的概率，在 0 到 1 之间。

这个函数虽然看起来复杂，但如果对它取指数(L=exp(-l))，会发现这是全部样本均预测正确的概率。比如样本集的标签值分别为 (1, 1, 0, 1, 1, 0, …)，则：

这里 L 是似然函数，也就是全部样本均预测正确的概率。

HED 使用了加权的 cross entropy 函数。例如，当标签 0 对应的样本极少时，加权 cross entropy 函数定义为：

这里 W 为权重，需要大于 1。不妨设 W = 2，此时考虑似然函数：

可见类别为 0 的样本在似然函数中重复出现了，比重因此而增加。通过这种办法，我们虽然不能实际将少样本类别的样本数目扩大，却通过修改损失函数达到了基本等价的效果。

数据篇

文档区域识别中用到的神经网络算法就介绍到这里了，接下来聊一聊我们为训练这个神经网络所构建的数据集。

数据筛选

为了训练神经网络模型，我们标注了样本容量为五万左右的数据集。然而这些数据集中存在大量的坏数据，需要对数据进行进一步筛选。

五万左右的数据集，只凭人工来进行筛选成本太高了。好在根据网络的自由度等一些经验判断，我们的网络对数据集的大小要求尚没有那么高，数据集还算比较富足，可以允许一部分好的数据被错筛掉。

基于这一前提，我们人工标注了一个小训练集(500张)，训练了一个 SVM 分类器来自动筛选数据。这个分类器只能判断图片中是否含有完整的文档，且分类效果并不特别强。不过，我们有选择性的强调了分类器分类的准确率，而对其召回率要求不高。换而言之，这个分类器可以接受把含有文档的图片错分成了不含文档的图片，但不能接受把不含文档的图片分进了含有文档的图片这一类中。

依靠这个分类器，我们将五万左右的数据集筛选得到了一个九千左右的较小数据集。再加上人工筛选，最终剩下容量为八千左右的，质量有保证的数据集。

实现篇

在模型训练中，我们使用 tensorflow 框架[5]进行模型训练。我们的最终目标是在移动端(手机端)实现文档区域识别功能，而移动端与桌面端存在着一些区别：

移动端的运算能力全方位的弱于桌面端;
带宽和功耗端限制，决定了移动端的显卡尤其弱于桌面端的独显；
移动端有 ios 和 Android 两个阵营，它们对密集运算的优化 API 各不相同，代码很难通用；
移动端对文件体积敏感。

这些区别使得我们不能直接将模型移植到移动端，而需要对它们做一些优化，保证其运行效率。优化的思路大致有两种：

选择合适的神经网络框架，尽可能用上芯片的加速技术；
压缩模型，在不损失精度的前提下减小模型的计算开销和文件体积。

神经网络框架的选择

目前比较流行的神经网络框架包括 tensorflow, caffe[6], mxnet[7] 等，它们大多数都有相应的移动端框架。所以直接使用这些移动端框架是最方便的选择。例如我们使用 tensorflow 框架进行模型训练，那么直接使用移动端 tensorflow 框架，就能省去模型转换的麻烦。

有的时候，我们可能不需要一个大而全的神经网络框架，或者对运行效率要求特别高。此时我们可以考虑一个底层一些的框架，在此基础上实现自己的需求。这方面的例子有 Eigen[8]，一个常用的矩阵运算库；NNPACK[9]，效率很高的神经网络底层库，等等。如果代码中已经集成了 OpenCV[10]，也可以考虑用其中的运算 API。

如果对运行效率要求很高，也可以考虑使用移动端的异构计算框架，将除 CPU 以外的 GPU、DSP 的运算能力也加入进来。这方面可以考虑的框架有 ios 端的 metal[11]，跨平台的 OpenGL[12] 和 Vulkan[13]，Android 端的 renderscript[14]。

模型压缩

模型压缩最简单的方法就是去调节网络模型中各个可调的超参数，这里的超参数的例子有：网络总层数、每一层的 channel 数、每一个卷积的 kernel 宽度等等。在一开始训练的时候，我们会选择有一定冗余的超参数去训练，确保不会因为某个超参数太小而成为网络效果的瓶颈。在模型压缩的时候，则可以把这些冗余“挤掉”，即在不明显降低识别准确率的前提下，逐步尝试调小某个超参数。在调节的过程中，我们发现网络总层数对识别效果的影响较大；相对而言，每一层的 channel 数的减小对识别效果的影响不大。

除了简单的调节超参数外，还有一些特别为移动端设计的模型结构，采用这些模型结构能显著的压缩模型。这方面的例子有 SVD Network[15], SqueezeNet[16], Mobilenets[17]等，这里就不细说了。

最终效果

经过神经网络框架定制、模型压缩后，我们的模型大小被压缩到 1M 左右，在性能主流的手机(iphone 6, 小米 4 或配置更好的手机)上能达到 100ms 以内识别一张图片的速度，且识别精度基本没有受到影响。应该说移植是很成功的。

总结

在两三年之前，神经网络算法在大家的眼里只适用于运算能力极强的服务器，似乎跟手机没有什么关联。然而在近两三年，出现了一些新的趋势：一是随着神经网络算法的成熟，一部分学者将研究兴趣放在了压缩神经网络的计算开销上，神经网络模型可以得到压缩；二是手机芯片的运算能力飞速发展，尤其是 GPU，DSP 运算能力的发展。伴随这一降一升，手机也能够得着神经网络的运算需求了。

“基于神经网络的文档扫描”功能得以实现，实在是踩在了无数前人的肩膀上完成的。从这个角度来说，我们这一代的研发人员是幸运的，能够实现一些我们过去不敢想象的东西，未来还能实现更多我们今天不能想象的东西。

参考文献
1. Long, J., Shelhamer, E., & Darrell, T. (2015). Fully convolutional networks for semantic segmentation. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 4. 3431-3440).
2. Hubel, D. H., & Wiesel, T. N. (1962). Receptive fields, binocular interaction and functional architecture in the cat’s visual cortex. The Journal of physiology, 160(1), 106-154.
3. LeCun, Y., Bottou, L., Bengio, Y., & Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11), 2278-2324.
4. Xie, S., & Tu, Z. (2015). Holistically-nested edge detection. In Proceedings of the IEEE International Conference on Computer Vision (pp. 1395-1403).
5. https://www.tensorflow.org/
6. http://caffe.berkeleyvision.org/
7. http://mxnet.io/
8. http://eigen.tuxfamily.org/index.php?title=Main_Page
9. https://github.com/Maratyszcza/NNPACK
10. http://opencv.org/
11. https://developer.apple.com/metal/
12. https://www.opengl.org/
13. https://www.khronos.org/vulkan/
14. https://developer.android.com/guide/topics/renderscript/compute.html
15. Denton, E. L., Zaremba, W., Bruna, J., LeCun, Y., & Fergus, R. (2014). Exploiting linear structure within convolutional networks for efficient evaluation. In Advances in Neural Information Processing Systems (pp. 1269-1277).
16. Iandola, F. N., Han, S., Moskewicz, M. W., Ashraf, K., Dally, W. J., & Keutzer, K. (2016). SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and< 0.5 MB model size. arXiv preprint arXiv:1602.07360.
17. Howard, A. G., Zhu, M., Chen, B., Kalenichenko, D., Wang, W., Weyand, T., … & Adam, H. (2017). Mobilenets: Efficient convolutional neural networks for mobile vision applications. arXiv preprint arXiv:1704.04861.

《C++语言的设计和演化》读书感悟（一）依晴无旧 C\C++java 开发语言
写了一百多篇技术文章了，我突然想写一下和技术文搭一点关系的语言发展设计的文章，《C++语言的设计和演化》是我无聊翻自己库存电子书找到了，因为当年看这本书是C++之父写的，所以就保存下来，但是当时主要学习C++，这本书更多是C++之父从本身出发，对C++设计和演化的观点和感想，所以当时就被我扔去吃灰了。现在重拾起来，读起来别有风味。开发语言，虽然很多，但是万变不离其宗，学进去了，无非就是数据类型、控
收藏！打造高质量技术文章的 8 个技巧京东零售技术写作
在信息爆炸的时代，写作不仅是一种表达，更是一种影响力的体现。无论是为了提升个人品牌，还是为了增强团队的技术氛围，或是推动公司的技术影响力，一篇高质量的文章都能起到关键作用。今天给大家分享打造高质量技术文章的8个技巧，由零售技术后端开发工程师孟冬同学所总结。帮助大家提升文章的质量，激发大家的写作热情，共同推动技术交流与知识传播的进程。1、换位思考应当试着站在读者的角度思考，讲清楚。是什么？为什么？怎
论文翻译：arxiv-2022 Ignore Previous Prompt: Attack Techniques For Language Models CSPhD-winston-杨帆论文翻译 LLMs-安全 prompt 语言模型人工智能
IgnorePreviousPrompt:AttackTechniquesForLanguageModelshttps://arxiv.org/pdf/2211.09527忽略之前的提示：针对语言模型的攻击技术文章目录忽略之前的提示：针对语言模型的攻击技术摘要1引言摘要基于Transformer的大型语言模型（LLMs）为大规模面向客户的应用程序中的自然语言任务提供了强大的基础。然而，探索恶意用户
HTML 进阶: Web Components 原生组件技术超悠閒 HTML &CSS 前端 html javascript web components 组件化
HTML进阶:WebComponents原生组件技术文章目录HTML进阶:WebComponents原生组件技术WebComponents概念&技术核心1.CustomElements自定义标签1.1注册WebComponent1.2生命周期钩子2.ShadowDOM3.Template模版&Slot插槽3.1Template模版的作用3.2Slot插槽的作用小结其他资源参考连接完整代码示例Web
IT技术学习之开发(六) opcc
上次好像说到了反映zabbix数据，我又打算回到web形式，一劳永逸，比word形式的更好，但web形式的开发又涉及到了很多其他技术，比如前端、中间件，以及如何用它们调用后端数据。之前突击了一阵技术文章，之后就沉寂了几个月，最近又开始搞，稍微学了点皮毛，拿来晒晒。Python有现成的web应用框架，可以快速的搭建网站，我用的是Django框架，介绍性的内容大家可以上网查查，资料很多，都比我说的好，
raid数据恢复技术文章规范篇 weixin_33802505 运维前端操作系统 ViewUI
（1）RAID技术规范简介冗余磁盘阵列技术最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘，以降低大批量数据存储的费用，同时也希望采用冗余信息的方式，使得磁盘失效时不会使对数据的访问受损失，从而开发出一定水平的数据保护技术，并且能适当的提升数据传输速度。过去RAID一直是高档服务器才有缘享用，一直作为高档SCSI硬盘配套技术作应用。近来随着技术的发展和产品成本的不断下降，IDE硬盘性能有了很
通天星CMSV6车载定位监控平台 getAlarmAppealByGuid SQL注入漏洞漏洞文库-网络安全 day漏洞挖掘漏洞复现 sql 数据库安全网络网络安全 web安全安全架构
0x01阅读须知技术文章仅供参考，此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他！！！0x02产品概述通天星CMSV6车载定位监控平台拥有以位置服务、无线3G/4G视频传输、云存
「干货」Web安全红队外围信息收集「详细总结」橙留香Park Web攻防信息安全网络安全渗透测试
也许每个人出生的时候都以为这世界都是为他一个人而存在的，当他发现自己错的时候，他便开始长大少走了弯路，也就错过了风景，无论如何，感谢经历转移发布平台通知：将不再在CSDN博客发布新文章，敬请移步知识星球感谢大家一直以来对我CSDN博客的关注和支持，但是我决定不再在这里发布新文章了。为了给大家提供更好的服务和更深入的交流，我开设了一个知识星球，内部将会提供更深入、更实用的技术文章，这些文章将更有价值
C#/.NET/.NET Core技术前沿周刊 | 第 1 期（2024年8.12-8.18）追逐时光者 C#.NET 技术前沿周刊 c#.net .netcore
前言C#/.NET/.NETCore技术前沿周刊，你的每周技术指南针！记录、追踪C#/.NET/.NETCore领域、生态的每周最新、最实用的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿，助力技术成长与视野拓宽。欢迎投稿，推荐或自荐文章/项目/学习资源等。C#/.NET/.NETCore技术前沿周刊汇总：DotNetGuide/docs/DotNet/DotNetWeekly.m
【大咖力荐新手必备】软件开发入门，这300篇文章就够了！高校俱乐部软件开发新手必备数据编码 IP
小编在这里根据知识图谱整理了CSDN站内的优质文章300篇，帮助见习工程提升技术能力、实现系统化学习！基础IT技术文章300篇大合集包含：【信息/编码】进制转换25篇、数据编码25篇；【IP/组网】网关与网段25篇、IP协议26篇、主机与DNS23篇、访问控制37篇；【程序逻辑】JavaScript29篇、常用算法37篇；【Web基础】HTML31篇、CSS32篇、DOM与BOM23篇扫码添加小助
LiveVideoStack公众号内容改版通知 LiveVideoStack_ 编程语言大数据人工智能 python 比特币
LiveVideoStack公众号已经陪伴大家走过了四年多的时间，在过去四年里，我们为读者朋友推送了各类音视频技术文章，这些文章获得了很多读者的喜爱和推荐。在这里，我们非常感谢大家的支持。为了让我们的读者获得更丰富、更有深度的音视频信息，LiveVideoStack编辑部决定做一次尝试，在内容上推陈出新，呈现更多精彩的阅读栏目给大家。经过认真讨论，我们将推出以下音视频栏目：l主编观察：记录对音视频
构建轻量级CentOS Docker镜像的实战指南 Evaporator Core centos docker linux
随着容器技术的迅速发展，Docker已成为现代应用部署和运维的标准工具之一。其中，构建自定义的Docker镜像是将应用程序无缝集成到容器化环境的关键步骤。在这篇1600字的技术文章中，我们将详细介绍如何快速高效地将一个精简的CentOS系统打包成Docker镜像，并结合实际操作及代码示例详述整个过程。一、准备工作首先，理解Docker镜像是由多层组成的只读文件系统，每一层代表了容器内的一组文件更改
编程两年半了，还要坚持写博客吗？程序员
前言思否的朋友你们好，我是何未来，计算机专业本科在读，在大学期间通过自己的努力获得了多个全国计算机类大赛奖项并连续两年获得奖学金，目前主要在学习Java后端开发，这是我在思否上发布的第一篇文章，今后我会持续更新Java后端，数据结构与算法，web前端，开源，效率开发工具和技巧等对你们有价值的计算机知识和问题解答，我会严格把关自己文章内容的质量，持续为大家输出高质量技术文章！三人行，必有我师焉，希望
基于Nakama和Unity开发网络多人游戏：Part 2
您好！在我的博客当中，我将持续挑选一些优质的国外技术文章进行翻译，如果文章内容翻译有误，欢迎在评论区指正，感谢：）本文是Nakama系列的第二篇，第一篇的链接如下：https://segmentfault.com/a/1190000044502161以下是原文链接：Tutorial:MakingaMultiplayerGamewithNakamaandUnity:Part2/3–TheKnight
技术分享 | Web自动化之Selenium安装霍格沃兹测试开发学社
⬇️复制“下方链接”，提升测试核心竞争力！更多技术文章分享和免费资料领取原文链接Web应用程序的验收测试常常涉及一些手工任务，例如打开一个浏览器，并执行一个测试用例中所描述的操作。但是手工执行的任务容易出现人为的错误，也比较费时间。因此，将这些任务自动化，就可以消除人为因素。Selenium可以帮助我们自动化完成验收测试，通过构建更严格的测试，从而使软件更为可靠也更易于维护。Selenium支持W
一个完整的比特币交易流程是怎么样的？编程狂魔
本文解释了比特币交易的内容，目的和结果。下面的解释适用于新手和中级比特币用户。作为加密货币用户，你需要熟悉交易雏形——为了你对这种不断发展的创新有信心，以及作为理解新兴多签名交易和合约的基础，这两者都将在本系列的后期进行探讨。这不是纯技术文章，解释将集中在你需要了解的标准比特币交易——我们通常做的支出交易——并且我们将掩盖你可以安全忽略的内容。本文底部的信息图提供了从钱包到区块链的整个比特币交易流
[免费专栏] Android安全之静态逆向APK应用浅析「手动注入smali」+「IDA Pro静态分析so文件」+「IDA Pro基础使用讲解」橙留香Park 网络安全渗透测试信息安全
也许每个人出生的时候都以为这世界都是为他一个人而存在的，当他发现自己错的时候，他便开始长大少走了弯路，也就错过了风景，无论如何，感谢经历转移发布平台通知：将不再在CSDN博客发布新文章，敬请移步知识星球感谢大家一直以来对我CSDN博客的关注和支持，但是我决定不再在这里发布新文章了。为了给大家提供更好的服务和更深入的交流，我开设了一个知识星球，内部将会提供更深入、更实用的技术文章，这些文章将更有价值
IT技术学习之开发(五) opcc
先声个明：我陆续写技术文章的目的可能是因为有点上瘾，而且最近几个月都在钻研技术。既然花费了大量精力来搞技术，那么把这个过程记录下来也很重要。技术大牛估计看不上眼，初学者可能也摸不着头脑，就是个个人学习成长血泪史，兴许可以替同路人铺个把个坑儿。下面继续挖坑儿......在搞后端的时候我就开始琢磨，如何把后端的数据传给前端web，按理说方法很多，起码传过去不应该算难事，但我一直没搞明白怎么让py文件和
Sora背后的论文(1)：使用 lstms 对视频展现进行无监督学习一支烟一朵花论文学习人工智能深度学习
之前那篇《Sora背后的32篇论文》发出后，大家都觉得不错，有很多小伙伴都开始啃论文了。那么我就趁热打铁，把这32篇论文的通俗解读版贴一下。从去年开始，我基本上形成了一个思维方式，任何事情做之前先看看有没有好的AI工具帮助自己提高效率。我本身不是算法出身，也是散装英语的水平，所以这个过程是借助了一些AI工具完成，后面会专门写一篇介绍详细的说明。Sora官网技术文章出处：Videogeneratio
Linux中编译C++代码的g++工具，以及g++的常用操作指令极客开发者
这是一篇技术文章，如果你想继续阅读，并希望从中有所收获，你现在应当具备以下技能：C++编程语言基础Linux操作系统基础本文目录1.GCC概述2.g++编译过程3.g++重要编译参数3.1.编译带调试信息的可执行文件3.2.优化源代码3.3.指定库文件3.4.-I指定头文件搜索目录3.5.-Wall打印警告信息3.6.-w关闭警告信息3.7.使用-std设置编译标准3.8.-o(小写)指定输出文件
linux 安装 ffmpeg 包括静态包和编译安装树下水月 ffmpeg linux 运维
linux安装ffmpegwindows上安装，直接下载压缩包解压。linux安装，找了半天各种技术文章，说最好编译安装，按照步骤安装编译环境编译成功了，但是使用的时候总要安装各种外部库，转码转不了等等问题......最后无奈，卸载掉ffmpeg,去官网下载编译好的程序，尝试了一下。效果满意。所以建议0基础底子薄的，和我一样不要编译安装了。切记，去官网下载最新版本ffmpeg。避免踩坑！ffmpe
当你不知道如何实现一个功能点，该怎么做？ Taoai_M
其实每个人做事的方式不尽相同，在这个快速发展的时代，我们要做的事情就是把你认为好的做事方式，转变成自己的习惯。不管是任何领域，东西都是那么多，为什么会有许多的人可以占领这个领域的顶端。因为他们有不同的方式去实现同一个目标。我是一个标准的程序员，就职在一家小公司。我关注了一些在程序方面的大佬。每天看他们所更新的东西。有的在写技术文章，有的在出书分享他们所学到的知识。当你不知道如何实现一个功能点的时候
C#/.NET/.NET Core学习、工作 He少年 .net .netcore c#数据结构
‍C#/.NET/.NETCore学习、工作、面试指南让现在的自己不再迷茫✨✨✨。DotNetGuideDotNetGuide技术社区是一个面向.NET开发者的开源技术社区，旨在为开发者们提供全面的C#/.NET/.NETCore相关学习资料、技术分享和咨询、项目推荐、招聘资讯和解决问题的平台。在这个社区中，开发者们可以分享自己的技术文章、项目经验、遇到的疑难技术问题以及解决方案，并且还有机会结识
快看！比KaliLinux更炫酷的鹦鹉OS系统！！知攻善防实验室网络安全渗透测试 Web渗透黑客操作系统
注本公众号，长期推送技术文章知攻善防实验室红蓝对抗，Web渗透测试，红队攻击，蓝队防守，内网渗透，漏洞分析，漏洞原理，开源工具，社工钓鱼，网络安全。79篇原创内容公众号免责声明：请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失，均由使用者本人负责，所产生的一切不良后果与文章作者无关。该文章仅供学习用途使用！！！前言本期介绍的为parr
帮管客存在用户信息泄露-漏洞复现-附EXP 知攻善防实验室漏洞复现信息安全网络安全
注本公众号，长期推送技术文章知攻善防实验室红蓝对抗，Web渗透测试，红队攻击，蓝队防守，内网渗透，漏洞分析，漏洞原理，开源工具，社工钓鱼，网络安全。78篇原创内容公众号免责声明：请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失，均由使用者本人负责，所产生的一切不良后果与文章作者无关。该文章仅供学习用途使用！！！前言帮管客是一款基于移动
.NET下集成http请求调用的最佳姿势数字智慧化基地 .net http 网络协议 c#.netcore
作者：科技、互联网行业优质创作者专注领域：.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造欢迎关注我（Net数字智慧化基地），里面有很多高价值技术文章，是你刻苦努力也积累不到的经验，能助你快速成长。升职+涨薪！！支持.Net/.NetCore/.NetFramework，可以部署在Docker,Windows,Linux,Mac。http请求
.NET应用国际化-AIGC智能翻译+代码生成数字智慧化基地 AIGC .net c#.netcore
作者：科技、互联网行业优质创作者专注领域：.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造欢迎关注我（Net数字智慧化基地），里面有很多高价值技术文章，是你刻苦努力也积累不到的经验，能助你快速成长。升职+涨薪！！.NET应用国际化-AIGC智能翻译+代码生成的议题，今天整理成博客，分享给所有人。随着疫情的消退，越来越多的企业开始向海外拓展，应
它让你1小时精通RabbitMQ消息队列数字智慧化基地 rabbitmq ruby 分布式 .netcore c#后端
作者：科技、互联网行业优质创作者专注领域：.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造欢迎关注我（Net数字智慧化基地），里面有很多高价值技术文章，是你刻苦努力也积累不到的经验，能助你快速成长。升职+涨薪！！支持.Net/.NetCore/.NetFramework，可以部署在Docker,Windows,Linux,Mac。Rabbit
.NET集成DeveloperSharp生成分布式唯一ID 数字智慧化基地分布式 c#.netcore
作者：科技、互联网行业优质创作者专注领域：.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造欢迎关注我（Net数字智慧化基地），里面有很多高价值技术文章，是你刻苦努力也积累不到的经验，能助你快速成长。升职+涨薪！！支持.Net/.NetCore/.NetFramework，可以部署在Docker,Windows,Linux,Mac。分布式唯一I
C# 人脸识别ViewFaceCore使用的经验分享数字智慧化基地 c#microsoft 开发语言
作者：科技、互联网行业优质创作者专注领域：.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造欢迎关注我（Net数字智慧化基地），里面有很多高价值技术文章，是你刻苦努力也积累不到的经验，能助你快速成长。升职+涨薪！！前言POS软件是什么？你好意思吗，还在用老掉牙的Winform。门店被淘汰的POS机销售终端——POS（pointofsale）是一
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

举世瞩目的「深度神经网络」如何应用于移动端？

背景篇

算法篇

数据篇

实现篇

总结

你可能感兴趣的:(技术文章)