hzbooks

【第20期】实践深度学习？先接住这三板斧再说

作者：木羊同学

来源：华章计算机（hzbook_jsj）

深度学习发展到现在，已经不是红不红的问题，真的是那种谈项目做课题不扯两句深度学习，别人就要来怀疑你用的技术是不是落后于时代。可是，深度学习的书和论文看起来好像都很难，就算删掉那些明摆着欺负人的数学公式，剩下又是图又是表的，照样看得人无从下手，怎么动手实践呢？今天我们就来聊聊深度学习实践的三把板斧。

第一把板斧：工具

要手撸深度学习模型的代码，首先得选一把趁手的工具。业内现在基本都是推荐使用Python语言来实现深度学习模型，不过，这还没到第一步。想必你已经听过很多Python简单易用、十分好学的说法。不过，真要使用Python从零开始实现产品级的深度学习模型，那相当于要自己从挖地基开始，盖一栋房子，简直是一件地狱难度的任务。

不过好在，Python除了简单易用，另一大优势就是出了名的库多——没什么工作是不能import一个库来完成的，如果有，那就import两个库。在深度学习方面也不例外，现在市面上最最常用的Python深度学习库有两个，一个叫Tensorflow——Google出品，另一个叫Pytorch——Facebook出品。这里先说一点，既然Python是出了名的库多，深度学习库自然也不只是这俩，很多大公司都推出了自己的深度学习库，譬如Amazon出了Mxnet，百度出了PaddlePaddle，而且很难说哪家的就技高一筹，别人难以望其项背，只能说各具特色。不过，玩编程的同学应该知道，生态这玩意有很多时候比技术本身更重要。在深度学习方面，目前占据“头部”的就是Tensorflow和Pytorch。那么你的第一个工作，就是在这俩之中选择一款来用。

Tensorflow和Pytorch要怎么选这个问题，现在是道送命题——两边阵营吵得不可开交：按一般的说法，学界偏好Pytorch，写法更加干净清爽，而工业界则更喜欢Tensorflow。Tensorflow推出更早，可以说是紧紧跟随这一波深度学习浪潮一同崛起，生态更为完整，同时有着Google强大的工程应用能力加持，在产品化方面做得更为成熟。

Tensorflow有一个重要的特点，也是重要的槽点，就是计算图。Tensorflow的计算图写法总让人有一种难以言传的别扭，有一批对此深恶痛绝的用户最后成了Pytorch的铁杆粉丝。不过，单就技术来说，要使用深度学习，计算图是无法避免的，Pytorch也同样依赖计算图。不过，计算图有两种，一种是必须先搭后用的静态图，一种是更为灵活但运行效率低一些的动态图。究竟是选择效率更高的静态图，还是牺牲效率选择写法更友好的动态图，只能说尺有所短寸有所长，和具体的应用场景有关，没有一个绝对的定论。

Tensorflow刚推出时选择的是静态图，没想成了劝退神器，相当部分的深度学习开发者纷纷表示各种不适应，连“这不Python”之类的话都喊出来了。我自己的感想是：写法这东西，每个人的接受程度不同，我相对来说没那么反感，但静态图的引入，确实对调试带来了一些不便。

但Tensorflow一直在迭代升级，很快也支持了动态图，称为“Eager Execution”。不仅如此，目前Tensorflw已经进入2.0时代，不但支持动态图，而且进行了大规模的优化，Eager Execution也成了默认的执行方式。Google一直在推Tensorflow与Keras深度融合，现在的Tensorflow早比1.0时代友善多了。

第二把板斧：搭建模型

选好了工具，第二步就是搭建深度神经网络模型。很多初学者会担心，现在市面上的深度学习库这么多，每一个学起来也都不见得太容易，如果第一步选的工具后面发现不合适，决定要换，是不是还得重头再学一遍？

不用担心，实际情况比想象得要好一些。在我看来，使用这些不同的深度学习库来搭建深度神经网络模型，就好比使用不同的编程语言来实现同一套算法，虽然具体的某些细节总会有一些不同，但思路是完全一样的，大体上来说是大同小异，有了一种深度学习库的使用经验，完全可以很快迁移到另一种深度学习库上去，在这一点上大可放心。所以，学习的关键还是在于深度神经网络模型本身，而非深度学习库的使用细节。

首先自然就是如何搭建深度神经网络。这个问题可以分成两个部分，第一个部分，我们先来说说深度神经网络的历史传承。深度学习是近年红起来的，但并不是凭空蹦出来的技术。

深度学习和机器学习一脉相承，具体来说，机器学习是一批智能算法的集合，其中有一种历史悠久的算法，叫神经网络算法，这套算法至少有60年的历史，但许多东西一直沿用到了深度学习模型里面。我们说的深度学习，其实都知道指的是深度神经网络，意思就是层数加深了的神经网络，所以，搭建神经网络也好，搭建深度神经网络也好，首先需要考虑的就是拿什么来构建这个“网络”。

答案是神经元。神经网络嘛，最小的构成单位自然是神经元，得先了解神经元的结构，实现了神经元，然后才能再谈构建神经网络。

那神经元是怎样的结构呢？我在《机器学习算法的数学解析与Python实现》中专门介绍了神经网络，说到神经元，书里说“就像一只爆炸头的蝌蚪”，头发就是输入，有很多的输入，所以是爆炸头。尾巴是输出，一个神经元只有一项输出，所以是蝌蚪。

既然有很多的输入，那是直接输入的吗？不是，加权输入，如果你了解线性回归，或者翻过《机器学习算法的数学解析与Python实现》这本书，一定会马上反应过来：这不就是线性方程嘛！

没错，神经元的输入就是一个线性方程，唯一的区别在于，这条线性方程的结果在最终输出时，需要先经过一个特殊的函数，叫激活函数，所以，对于神经元的结构，我们可以简单地理解为：线性方程+激活函数=神经元。

线性方程好说，你可能会担心：这个激活函数该如何实现？其实，在搭建模型时，深度学习库一般都会提供各类常用的激活函数，你只要选择需要的激活函数即可。譬如说你在论文上看到Relu函数作为激活函数效果很好，你甚至不需要知道Relu函数的表达式，只要在深度学习库中选取Relu，然后把线性方程套进去，神经元的构建就完成了。

那神经元怎么构成神经网络呢？那就更简单了，只要将这一个个小蝌蚪们头尾相衔，前一位的输出作为后一位的输入，这就构成了最基本的前馈神经网络。前馈是什么意思呢？就是输入由前至后地传递，一级一级向后传的意思。

那，还有不基本的神经网络？

正是。深度学习的兴起，并不是单纯靠加深神经网络的层数这么简单粗暴，还添加了许多“魔改”的神经元组件，譬如说深度学习的龙兴之地——深度卷积神经网络（CNN），要实现这个，首先就需要使用卷积核这个组件。

卷积核的功能比较复杂，小蝌蚪们是指望不上了，那如何是好呢？非常简单，深度学

习库里一定都准备好了，只要找到对应的API，譬如说深度卷积网络所必须的卷积层和池化层，像搭乐高积木一样，把这些组件装配起来，深度神经网络也就搭建好了。其它的“魔改”深度学习组件，譬如循环神经网络（包括RNN、LSTM和GRU），也可以按同样方式处理。

这里多说一句。深度学习的许多大牛都说过一句话：“搭建深度学习模型像装配乐高积木，十分有意思。”这在深度学习库推出之前，相关的工作其实并没有那么美好，有不少繁琐的细节，但现在有了成熟的深度学习库，搭建深度学习模型就真的像“搭积木”了。

第三把板斧：模型训练

现在，深度神经网络模型搭建好了，是不是就大功告成了呢？很可惜，接下来的第三步才是整个流程中最费时费力，当然也是最费电的环境——模型训练环节。

深度学习模型的训练，有一点像我们玩的《愤怒的小鸟》。这个游戏怎么玩呢？首先你得瞄准一头绿色哼哼叫的猪，然后用手指控制弹弓，带动小鸟拉出一条弹道，最后放手，小鸟就飞了出去。怎么算训练成功呢？直接命中了那头猪，训练就成功了。但在一般情况下，“一发入魂”的可能性非常低，这就需要调整，不断修正弹道，以求最终击中那头绿猪。

这个不断修正弹道的过程，就是模型的训练过程。这里有几个要素，首先是损失函数，在模型训练中，最终目标是让损失函数最小。

然后是误差传递，误差传递这个概念按教材讲起来很容易让人昏昏欲睡，不过其实非常简单，前面我们不是说要调整弹道嘛，那怎么调整呢？是上一点还是右一点？总要有个依据。误差传递就是传递这个依据，把误差告诉你，也就是把偏了多少告诉你，你就根据这个调整去吧。

不过实际工作要复杂一点，在多层神经网络中，误差传递是一项颇具挑战的工作，研究人员尝试了很久，最终才懂得，使用有名的反向传播机制（BP）来训练多层网络。因此，反向传播机制也就成了神经网络、包括深度神经网络必不可少的组成部分。要实现反向传播机制并不太容易，不过深度学习库都已经隐式实现了后向传播机制，只要我们将误差放入其中，就可自动完成误差的后向传播。

最后，当然是权值更新了，上一步只是将误差传递过来，告诉你偏了多少，要真正弹道得到修正，还需要通过调整权值来完成。当所有神经元的权值都完成了调整更新，一轮训练也就结束了。

听起来很简单，但权值更新里面也是别有洞天。你就这么想：现在你手上已经拿到了“旧权值”和“当前误差”，你怎么决定“新权值”该是多少呢？最简单最容易想到的做法，是直接相减，用“旧权值”直接减去“误差”。这当然能到结果。但后来，有人觉得“直接相减”太粗暴了，缺乏弹性，就加了个学习率，先用学习率和误差相乘，然后再相减。通过调整学习率，能控制这一轮权值更新的幅度。

那现在更常用的做法是什么呢？直接用优化器，我们训练模型的目标，前面已经说了，就是让损失函数最小化，那有没有一种数学工具能到达这样的效果呢？有，就是梯度下降法，用来求极值效果特别好，唯一的问题，就是实现比较复杂。不过，你肯定已经猜到了，这么好用的优化器，深度学习库里肯定已经内置了，不但有经典的随机梯度下降，现在主流的优化器，譬如 Adam，库里都有现成的，只要按照语法直接使用就好。

好了，抡完上面三把板斧，一套由你定制的深度学习模型也就闪亮登场了，当然，深度学习远不止这三道工序，譬如说模型效果调优，不但有传统的各种正则，还有Dropout和Early Stopping等新潮玩法，这里我推荐一本书，《深度学习：基于案例理解深度神经网络》，讲的是用Tensorflow搭建深度学习模型，包括介绍Tensorflow在上述三步中的一些具体用法。想从实践角度了解深度学习的同学，相信读完这本书会有收获。这本书的姊妹篇——《深度学习进阶：卷积神经网络和对象检测》也刚刚出版，非常适合深度学习从业者掌握更高级的技术。

作者简介：

莫凡，娱乐向机器学习解说选手，《机器学习算法的数学解析与Python实现》作者，前沿技术发展观潮者，擅长高冷技术的“白菜化”解说，微信公众号“睡前机器学习”，个人知乎号“木羊”。

赠书啦

《机器学习算法的数学解析与Python实现》

作者：莫凡

ISBN：978-7-111-64260-2

点击链接了解详情并购买

卖点：

生动——语言生动幽默，通过分析大量生活案例，帮助读者理解机器学习的算法。

简单——让很多听起来高大上的名词更实用。

实用——精选了最主要的机器学习算法，如线性回归算法、Logistic回归算法、KNN算法、朴素贝叶斯算法、决策树算法、支持向量机算法、K-means聚类算法、神经网络、集成学习方法等。

系统——从概念、原理、Python实现、应用场景几个方面，详细剖析机器学习中主要的算法。

推荐语：

有趣、易懂、不枯燥，看得懂、学得会的机器学习入门书。全书用白话讲解，帮你从生活案例中理解算法，发现算法的乐趣，再把算法应用到机器学习中，让你零基础掌握算法精髓，快速进入人工智能开发领域。

《深度学习：基于案例理解深度神经网络》

作者：[瑞士]　翁贝托·米凯卢奇（Umberto Michelucci）

译者：陶阳　邓红平

ISBN：978-7-111-63710-3

点击链接了解详情并购买

卖点：

完善的知识体系，适合各层次学生及从业人员。

1）包含正则化、学习率衰减技术和不同的优化器的完整概述及示例；

2）介绍Dropout和超参数调优等高级技术；

3）包含构建卷积神经网络和递归神经网络模块的概述;

4）额外含有优化Python代码的技巧。

推荐语：

基于实例，手把手教你理解并使用Python和TensorFlow构建自己的深度神经网络，并传授实践中会用到的一些高级技术。

《深度学习进阶：卷积神经网络和对象检测》

作者：[瑞士]　翁贝托·米凯卢奇（Umberto Michelucci）

译者：陶阳　李亚楠

ISBN：978-7-111-66092-7

点击链接了解详情并购买

卖点：

1）包含CNN在内的高阶深度学习技术的广泛示例；

2）所有高阶技术的应用示例均使用真实的数据集；

3）本书为《深度学习：基于案例理解神经网络》的姊妹篇，指导你从简单的例子到更高级的技术，一步步提升难度直至熟悉高级方法;

推荐语：

为深度学习进阶读者提供完善的知识体系，包含基于Keras和TensorFlow的YOLO算法完整实现。

第019期赠书活动中奖名单公布

赠书规则

送书规则：感谢大家对华章图书的信任与支持。以上3本好书你最想要哪本？围绕深度学习，留言谈谈你的想法。小编会随机挑取2条最用心的留言，分别包邮送出1本正版书籍（以上2本任选）。

截止日期：9月11日下午17：00

特别注意：请按规则留言。阅读最多、分享最多者优先。

更多精彩回顾

书讯 |9月书讯（下）| 开学季，读新书

书讯 |9月书讯（上）| 开学季，读新书

上新 | 一本书带你吃透Nginx应用与运维
书单 | 开学季——计算机专业学生必读的10本畅销经典

干货 | 巨详细！使用OpenCV和OpenVINO轻松创建深度学习应用

收藏 | 开学季——想打好数学基础？这些经典教材你最需要！

视频 | 4min视频带你了解阿里B2B电商算法

点击阅读全文查看更多AI好书

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

【第20期】实践深度学习？先接住这三板斧再说

为深度学习进阶读者提供完善的知识体系，包含基于Keras和TensorFlow的YOLO算法完整实现。

你可能感兴趣的:(神经网络,算法,卷积,编程语言,人工智能)