zhang405744522

https://mp.weixin.qq.com/s?src=11×tamp=1509090286&ver=477&signature=cgdv6tbrM5s58sUA9FGT7bBpm*a

机器学习与微博：TensorFlow在微博的大规模应用与实践

2017-08-08 何沧平 AI前线

https://mp.weixin.qq.com/s?src=11&timestamp=1509090286&ver=477&signature=cgdv6tbrM5s58sUA9FGT7bBpm*a_第1张图片

作者｜何沧平编辑｜陈思TensorFlow 在微博业务中有丰富的应用场景，文字、图片、视频，各具特色。微博机器学习平台集成 TensorFlow 服务，支持分布式训练，在广告点击预测应用中，本轮分享的主讲人何沧平积累了一些 TensorFlow 优化经验，在 8 月 3 日晚 AI 前线社群分享活动中，他将自己的这些经验分享给了大家。本文首发于 InfoQ 垂直公众号 AI 前线。

借 AI 前线提供的交流机会，我给各位汇报一下 TensorFlow 在微博的使用情况和在分布式计算上的一点经验，错误疏漏不足之处，敬请批评指教。

TensorFlow 在微博的应用场景

今天的分享内容由虚到实，由概括到具体。

微博的日活和月活数量都在增长，移动端比例很高，占 91%。2017 年 4 月份的财报显示，营收同比增涨 67%，一个重要原因就是移动端抢到了用户的碎片时间。

微博里随处可见推荐信息：推荐的新闻、推荐的视频、推荐的新账号。最重要还有推荐的广告。

用户登录以后，立刻就要计算推荐什么内容。拿推荐广告来说，备选的广告数以万计，需要排序给出最可能被点击的几条广告。

如果切中用户的购买需要，广告就不再是打扰。

垃圾严重影响用户体验，色情、暴力、反动、低俗，宁可错杀不可漏网，十分严格。

人工智能反垃圾的目标是提高准确度、降低成本。

图像质量也是用户体验的基本要求。

用户可以容忍不感兴趣的图片，但很难容杂乱的图像。

例如左边的美女图，看起来赏心悦目，手机上刷过，即使不停下细看，也不会反感。

右边的图片，里面也是美女，但加上文字之后，立刻变得杂乱，版式与酒店里的小卡片相仿。很可能被认定为骗子。

明星是微博制胜的法宝。明星是公众人物，话题多、热度高、影响力大。明星粉丝狂热，消费力强。

为粉丝推荐她他喜欢的明星的行程、事件、各种评价，粉丝爱看。甚至明星代言的广告，粉丝可能都会喜欢。停留在微博的时间越长，有意无意浏览的广告就越多。正确识别明星就很重要了，如果不巧推荐了用户讨厌的明星，可能就没了刷微博的心情。

明星脸识别是微博的特色，有海量的明星图片，也有巨大的识别需求。

明星脸识别有特别的困难：常用人脸识别研究所用的照片表情、造型较少，不同人之间的差别较大。而明星表情丰富，造型多变，无论男女都化妆！不少人妆容近似，有些整容脸连人脑都傻傻分不清，计算机就更难分清了。

上部的图片可能归属两个及以上类别，因此称为“兼类”。

图片、视频分类的最终目的都是为了关联广告。喜欢旅游的用户就给她他推荐旅游景点、线路、酒店、机票、户外装备等。

如果广告能够切中用户本来就要买的物品，就不必费尽心机说服用户购买不必要的商品，只需要将购买场所由一个地点（网站、实体店）转移到另一个地点，将购买时间由将来转移到现在，将商品品牌由 A 切换为 B。这样广告效果自然会好很多，点击率高，用户还不反感。

例如，印度电影《三个白痴》中几次提到太空笔，我当时就特别想买一支，在京东上搜了半个小时。如果能够提前识别到这个广告点，并在播放过程中推荐购买链接，很可能立即就下单了。

但是，图像分类难，视频精细分类更难，又不得不分。短视频（5 分钟以内）方兴未艾，变现模式还不成熟，处于烧钱阶段。相对于文本、图片，短视频的带宽成本更高，消耗的用户时间更多。如果关联广告的转化率不高，入不敷出，无法长久。

TensorFlow 在微博的应用技术 & 案例

务虚内容结束，下面是具体点的技术。

微博机器学习平台承担了离线训练和在线预测任务。微博实时产生的文本、图片、视频显示后转入后台，用于提取特征、离线训练。

越来越多的业务使用深度学习方法，TensorFlow/Caffe 框架被集成进来。

离线训练主要使用 GPU 机群。由于业务增长过快，计算机群有一部分来自阿里云。

这一页完全是个人理解。

对规模巨大的训练任务，TensorFlow 提供了分布式的模式。

TensorFlow 分布式计算与 HPC 的 MPI(Message Passing Interface) 分布计算区别很大。用过 MPI 的人都知道，MPI 进程相互平等，保证没有瓶颈进程。MPI-IO 也设计得每个主机都能均匀分担 IO 压力。MPI 进程上的计算任务也要求均匀划分，保证各个进程的计算进度保持一致。MPI 进程之间也只交换数据块的边界，尽量减少网络流量，压缩通信时间。

TensorFlow 的分布式计算设计得简单粗暴。

若干参数服务器 (parameter server) 和若干劳工 (worker) 组成一个机群 (cluster)，劳工承担运算任务，将每步运算得到的参数（权重和 bias）提交给参数服务器，参数服务器将来自所有 worker 的参数合并起来，得到全局参数，然后将全局参数发送给劳工。劳工在全局参数的基础上继续下一步运算。

TensorFlow 采用主从模式，参数服务器是瓶颈。每步都要传递所有的参数，网络流量太大，假设每个劳工上参数占用内存 1GB，机群包含 1 个参数服务器和 10 个劳工，那么每个迭代步将产生 20GB 的网络流量，按照 10GbE 网络计算，通信时间至少需 16 秒。而实际上，每个 batch 数据的运算时间可能还不足 1 秒，模型参数占用的内存可能远大于 1GB。从理论分析来看，TensorFlow 分布式运算的效率不如 MPI。

有人说深度学习只是高性能计算的一个特殊应用，我认为不是这样。

如图中表格所列，TensorFlow 机群就与 HPC 机群有重大区别。

HPC 机群的 3 大特点：高性能计算芯片（高端 CPU、GPU）、高速网络、并行存储。TensorFlow 机群只需要其中的 1 个：高端 GPU。

劳工在一批数据上训练得到∆W 和∆b（合称为∆P），称为一步训练。

如上图所示，所有的劳工（Device A/B/C）在完成一步训练后，暂停训练，将自己得到的∆P 发送到参数服务器（Parameter Device）。参数服务器一直等待，直到来自所有的劳工的参数变化量∆P 都接收成功。参数服务器将所有的∆P 相加取平均，然后用这个均值更新旧参数（更新公式请参见随机梯度算法），得到新参数 P，接着将 P 发送给所有的劳工。劳工在接收到新参数 P 以后，才进行下一步的训练。

与用 1 台服务器训练相比，用 N 台劳工同时训练 + 同步更新参数等价于将 batch 的规模扩大了 N 倍。具体来说，如果用 1 台服务器时，每步训练采用 100 张数字图片（batch=100）, 那么用 4 个劳工得到的参数变化量（即∆P）同步更新，就相当于每步训练采用 400 张数字图片（batch=400）。从而，参数变化得更平稳，收敛更快。

同步更新也有缺点：整体速度取决于最慢的那个劳工。如果劳工之间的软硬件配置差别较大，有明显的速度差异，同步更新计算速度较慢。

为了避免劳工有快有慢造成的等待，TensorFlow 提供了异步更新策略。

如图下部所示，当有一个劳工训练得到一个参数变化量∆P 时，不妨假设是图中的 Device A，该劳工立即将∆P 发送给参数服务器。参数服务器接收到来自劳工 Device A 的∆P 后，不等待其它的劳工，立即用∆P 更新全局参数，得到全局参数 P，紧接着将 P 发送给劳工 Device A。劳工 Device A 接收到全局参数 P 后，立即开始下一步训练。

由异步更新参数的过程可知，它等价于只用 1 台服务器训练：都是每次用一小批（batch）图像训练更新参数，只是各批数据的上场顺序不能事先确定，上场顺序由劳工的随机运行状态确定。

刚开始运算时，劳工 0(左边) 先算了 10100 步（对应 localstep）, 此后劳工 1（右边）才开始运算。这说明，在异步运算模式下，劳工之间确实不相互等待。劳工 0 和劳工 1 都运算了全局第 10100 步 (global_step_value)，说明运算的剖分并不十分准确。

2 个劳工都执行了第 13142、13144、13146、13148 步，但都没有执行 13143、13145、13147 这 3 步。这说明 Tensorflow 异步更新的任务指派会随机出错，并不是绝对不重不漏。所幸随机梯度法对更新顺序没有要求，少量的错误对最终计算结果影响不大。

同步更新模式不能真正地同步执行，将程序杀死的时候，2 个劳工执行完的步数相差很多。劳工 0 本地执行了 11023 步之后，全局步数竟然只有 7072，肯定出错了。

网络上也有人报告了这个错误：

https://github.com/tensorflow/tensorflow/issues/9596，

TensorFlow 开发者已经确认这是一个漏洞，但尚未修复。

公式预警。。。。

以 MNIST 手写数字识别为例，上部分公式迭代一步就使用所有 n 个样本。

下部公式将所有样本分割成若干批次（batch）。

TensorFlow 的异步更新，就是不同的劳工使用不同的小批训练样本来更新权重和 bias，不能事先确定每个劳工的更新顺序。具体举例：假设有 2 个劳工执行训练任务，劳工 0 负责更新奇数批次样本 b1/b3/b5…b499，劳工 1 负责更新偶批样本 b2/b4,…,b500。

由于各种随机因素，样本的使用顺序可能是 b1àb3àb5àb2àb7àb4à…因为样本的批次划分本身就是随机的，这样乱序更新仍然是随机的，对最终结果没有什么影响。

TensorFlow 同步更新时，对所有劳工得到的梯度求平均，然后更新权重和截距。仍然假设有 2 个劳工，它们分别训练第 1 批和第 2 批样本得到梯度∆w1 和∆b1 截距分别为∆w2 和∆b2，同步之后的梯度如图中所示。

从而，同步更新等价于一次使用 2m 个训练样本，正则化系数和 batch 大小都扩大为原来的 2 倍而已。如果劳工数量很多（例如 20 个），那么同步更新就等价于一次使用 2000 个训练样本，与划分 batch 的初衷不符。因此，建议不要使用同步更新。

注意公式里红色的（2m）

下面是一个具体优化案例：

CTR（Click-Through-Rate，点击通过率）是营收的关键。

对候选广告按点击可能性排序，然后插入到用户信息流之中。

deepCTR 不完全是特征工程，输入层与隐层的连接关系也是不全连接。

千亿样本数据近百 TB，为提高效率，采用多人推荐过的 TensorFlow 队列。

个人理解，队列的设计初衷很好（如图中表格所示），但实际性能很差，GPU 利用率只有 5%。查找原因发现，程序卡在线程同步操作上，而这个线程同步就来自于 TensorFlow 队列。于是尝试用别的方式读取训练样本文件。

左图横轴采用对数坐标。

队列读以 CSV 带宽只有极限带宽的 1/467，队列读取 tfrecord 格式文件带宽提升至 1.24MB/s，提高至 3.2 倍。由于 tfrecord 格式文件较小，读完一个文件的耗时降低至 15%(272.6/1789.9)。

用 pandas 读取文件带宽达到极限带宽的 35%。最终舍弃 TensorFlow 队列，选用 pandas 读 CSV 文件。

当 CSV 文件小于 1/3 内存时，直接用 pandas 一次性读入内存。不用 tf 队列，数据混洗就要程序员自己完成，所幸不麻烦。

对大于内存 1/3 的文件，直接拆分成多个小文件。需要程序员自行保证均匀使用各个小文件。

最后给各位汇报一个小游戏。

用 MNIST 训练得到的 CNN 网络来识别汉字，“霸”字被识别为 1。这点很容易理解，得到的 CNN 网络只有 10 个类别，不得不在 0~9 个数字中选一个。

因为“霸”字与任何数字都不像，识别为任何数字的“概率”应该都不太大吧，例如都小于 0.2（随便说的数值）。可是实际情况却是这样：0~9 分类对应的概率差别很大，最大接近 0.8，最小接近 0，卷积网络识别汉字的时候不会犹豫不决，错得十分坚定。

从这个小实验里可以发现几个问题：

图像的特征究竟是什么？如果有，如何用这些特征来区分不认识的图像（比如这个例子里的汉字）？

如何控制一个网络的泛化能力？这个例子中的泛化能力看起来太强了，以致于把汉字都识别成数字了。目前看来，CNN 的泛化能力几乎是听天由命。

softmax 后的值真的代表概率吗？看起来它们仅仅是和为 1 正数。概率本质的随机性体现在哪里呢？

这些问题，我还没有想明白，这里提出来，请各位朋友批评指教。

问答环节问题 1：队列读取性能差是否是由于设置 cache 的样本数问题？

回答：cache 基本没有影响。batch_size 会有影响，最关键还是线程锁的问题。

问题 2：（反垃圾）这一步的准确率怎么算的？是模型准确率吗？

回答：这个涉及到业务，不便透露。可以私下交流。

问题 3：千亿级别 feature 没有模型并行吗？感觉模型单机放不了，不能数据并行。

回答：数据并行，因此研究分布式运算。

问题 4：1 亿条评论的话，你怎么判断分类器是否分正确了？还是说这里的准确率只是在测试集上的准确率？

回答：业务上具体做法不便透露。这里提醒一下，微博有举报、屏蔽功能。

问题 5：微博的 TensorFlow 环境配置，资源管理和分布式计算是用的第三方平台吗？还是自己封装的

回答：资源管理和分布式计算尝试过几种方案，开源软件 + 自行定制。多种机群，安全级别和管理方式不完全一样，因此资源管理方式（网络、存储、权限）也不一样。

问题 6：会考虑评价 GPU 的利用率吗？比如用 deepbench 测？有什么 GPU 提升利用率的经验分享？

回答：GPU 利用率是成本核算的重要指标，很重视。查看 GPU 利用率比较简单：命令行 nvidia-smi，英伟达还有专门的库，提供轻量级的 C、JAVA 等接口。

提高 GPU 利用率经验：如果显存能装得下，尽量使用 1 个模型训练；设定显存使用量（例如 0.5），将 2 个及以上作业放在同一个 GPU 上。IO 性能差的话，会导致数据供应不上，从而 GPU 利用低。PPT 中 deepCTR 优化案例就是这个情况。batch 太小、权重矩阵过小，都会导致不能充分利用 GPU 的大量核心（通常有 4000-5000 个），利用率低。

问题 7：如果在庞大的 csv 上训练, 用 tf 队列和用 spark df 制作生成器的效果有比对过么?

回答：目前没有对比过 tf 队列和 spark df。

作者介绍

何沧平，微博研发中心算法工程师，目前负责建设深度学习平台。对高性能计算（HPC）较熟悉，著有《OpenACC 并行编程实战》一书。如有相关技术问题可以私下与讲师讨论，讲师微信：272702575

今日荐文

点击下方图片即可阅读

https://mp.weixin.qq.com/s?src=11&timestamp=1509090286&ver=477&signature=cgdv6tbrM5s58sUA9FGT7bBpm*a_第24张图片

2017 年已经过去 218 天，大数据杂谈 80 篇精选文章千万别又双叒叕错过啦

CNUTCon 全球运维技术大会将于 9 月 10-11 日在上海举行，大会主题是“智能时代的新运维”，并特设“大数据运维”专场，邀请了来自腾讯、苏宁等公司大咖分享他们在最新运维技术实践过程中遇到的坑与经验，更有 Google、Uber、eBay、BAT 等一线技术大牛现场为你解疑答惑，点击“阅读原文”了解更多精彩！9 折限时优惠，本文的读者在报名时输入 CNUTCon666 还可再减 200 哦！

阅读原文

微信扫一扫
关注该公众号

字符串比较忽略全角半角，忽略大小写的方法 adis789 vb.net c#
C#中直接调用VB.NET的函数，兼论半角与全角、简繁体中文互相转化在C#项目中添加引用Microsoft.VisualBasic.dll,可以在C#程序中直接使用VB.NET中丰富的函数1//命令行编译:csc/r:Microsoft.VisualBasic.dllTest.cs23//如果是用VisualStudio.NETIDE,请按以下方法为项目添加引用:4//打开[解决方案资源管理器],
Android 倒计时总结 xiangxiongfly915 Android android 倒计时 Handler Timer CountdownTimer Flow
文章目录Android倒计时总结Handler方案CountDownTimer方案Timer方案Flow方案总结源码下载Android倒计时总结Handler方案classMyHandler(privatevalintervalTime:Long,//间隔privatevaltotalTime:Long,//总时长onTick:(Long)->Unit,//每秒回调onFinish:()->Uni
C++：格式化输入和输出、非格式化输入和输出（控制布尔值格式、整型值格式、浮点数格式；单字节操作put和get、多字节操作getline等）还下着雨ZG C++杂谈 c++开发语言
1、格式化输入和输出(1)What标准库定义了一组操纵符（本质是函数或对象）来修改流的格式状态当操作符改变流的格式状态时，通常改变后的状态对所有后续IO都生效(2)WhichA.控制布尔值的格式boolbFlag=true;std::cout<
Android面试准备之Android基础北诺南兮 android java 面试
一、Handler机制创建一个Handler//提示已过时Handlerhandler=newHandler();Handlerhandler=newHandler(Looper.myLooper());隐式指定Looper的Handler初始化方法已被Android11报过时，根据注释，是由于不指定Looper在一些场景下会导致任务丢失或程序崩溃，比如没有Looper的线程。publicstat
react-native 踩过的坑 \光辉岁月/
一、遇到过的坑1.1执行Downloadinghttps://services.gradle.org/distributions/gradle-2.4-all.zip时报错解决方法：复制报错的下载链接，用迅雷下载，将项目地址中的AwesomeProject/android/gradle/wrapper/gradle-wrapper.properties中的distributionUrl=https
互联网大厂Java面试指南：从基础到高阶技术栈与业务场景实战 yiiyx Java场景面试宝典 Java Spring Boot 微服务面试分布式系统
互联网大厂Java面试指南：从基础到高阶技术栈与业务场景实战场景介绍本文模拟互联网大厂高级Java工程师面试场景，涵盖JavaSE、Spring生态、微服务、数据库、缓存、消息队列等技术栈，结合音视频、电商、金融等业务场景，提供3轮渐进式提问与详细解析。技术栈核心语言与平台:JavaSE(8/11/17),JakartaEE(JavaEE),JVM构建工具:Maven,Gradle,AntWeb框
跨区域智能电网负荷预测：基于 PaddleFL 的创新探索暮雨哀尘人工智能智能电网 AIGC PaddleFL 数据库 python 可视化
跨区域智能电网负荷预测：基于PaddleFL的创新探索摘要：本文聚焦跨区域智能电网负荷预测，提出基于PaddleFL框架的联邦学习方法，整合多地区智能电网数据，实现数据隐私保护下的高精度预测，为电网调度优化提供依据，推动智能电网发展。一、引言在当今社会，电力作为经济发展的命脉，其稳定供应对于保障社会生活的正常运转和生产的持续进行具有不可替代的重要性。而智能电网作为现代电力系统的重要发展方向，通过集
面向隐私保护的机器学习：联邦学习技术解析与应用 Blossom.118 机器学习与人工智能机器学习人工智能深度学习 tensorflow python 神经网络 cnn
在当今数字化时代，数据隐私和安全问题日益受到关注。随着《数据安全法》《个人信息保护法》等法律法规的实施，企业和机构在数据处理和分析过程中面临着越来越严格的合规要求。然而，机器学习模型的训练和优化往往需要大量的数据支持，这就产生了一个矛盾：如何在保护数据隐私的前提下，充分利用数据的价值进行机器学习模型的训练和优化？联邦学习（FederatedLearning）作为一种新兴的隐私保护技术，为解决这一问
银行家算法后会无期77 算法算法
文章目录银行家算法概述银行贷款案例A再次申请50万，能批准吗？B再次申请40万，能批准吗？或者C申请20万，能批准吗？安全序列和不安全序列多维度资源分配操作系统资源分配银行家算法总结数据结构银行家算法的步骤安全性算法步骤死锁的避免银行家算法概述银行家算法（Banker’sAlgorithm）是一个避免死锁（Deadlock）的著名算法，是由艾兹格·迪杰斯特拉在1965年为T.H.E系统设计的一种避
解决在Nuxt3+naiveUi中打包出现vueuc导入方式问题报错张苹果博客前端
在nuxt3+naiveui项目中打包出现vueuc导入方式问题报错，导致页面访问500。错误描述[nuxt][requesterror][unhandled][500]Namedexport'VBinder'notfound.Therequestedmodule'vueuc'isaCommonJSmodule,whichmaynotsupportallmodule.exportsasnamede
NVAPI 获取同步卡信息 xhh-cy NVAPI
#include"nvapi/nvapi.h"intdetectSync(){//初始化NVAPIif(NvAPI_Initialize()!=NVAPI_OK){std::cerr<<"FailedtoinitializeNVAPI."<
Kyle的算法记录 Z2475269074 算法
本文将展示一个小白从0->1完成算法的全部历练已经心得PS:要求做到真正的自我思考而不是对着教程敲代码，并借用AI进行辅佐与思考LinkedListLinkedList里的add和remove，都是索引/索引+值进行操作//在链表头部插入元素0lst.addFirst(0);//在链表尾部插入元素6lst.addLast(6);队列QueueQueueq=newLinkedList();//向栈顶
ali docker部属paddleocr 大熊程序猿 ASP.NET Core docker 容器运维
dockerpullregistry.baidubce.com/paddlepaddle/paddle:2.6.0nano/root/projects/paddleocr_server.py========================fromflaskimportFlask,requestfromwerkzeug.utilsimportsecure_filenameimportuuidfrom
java面试题墨京 java面试 java 开发语言
1.list和set的区别？list底层是数组，有序可重复，按对象进入顺序保存元素，可以有多个null元素，可以使用该iterator迭代器取出元素，也可以直接get（intindex）下标，取出元素。底层数据结构：动态数组（arraylist）或链表（Linkedlist）set底层是，无序不可重复，最多只能储存一个null元素，只能使用iterator接口取出所有元素，再逐一遍历各个元素。底层
Deepfacelive安装报错解决记录 matouxiao conda
去c盘：windows/system32目录下面找不能load的文件比如kernel132.dll，然后copy到.\DeepFaceLive_NVIDIA\_internal\CUDA\bin目录下就能运行
AI 技术&AI开发框架 34号树洞人工智能深度学习人工智能机器学习 NLP GAI
目录一、AI技术及其开发框架1.AI技术分类与代表方向2.主流AI开发框架3.AI应用开发流程简述4.补充：基础依赖与生态二、AI技术方向1.机器学习（MachineLearning,ML）✦核心概念：✦关键方法：✦应用案例：2.深度学习（DeepLearning,DL）✦核心概念：✦网络结构举例：✦技术趋势：3.自然语言处理（NLP）✦核心任务：✦代表模型：4.计算机视觉（ComputerVis
加快Dlib人脸检测速度 weixin_46019223 opencv 人脸识别视频处理机器学习
加快Dlib人脸检测速度前言一、让电脑以最大运行效率运行二、开启Dlib自带的加速三、彩色图像转灰度图像四、其它的坑总结前言使用dlib人脸检测接口detector()速度过慢,导致视频只有1帧所以找了一些方法,并解决了一些问题将视频帧数提升到了十几帧。一、让电脑以最大运行效率运行之前笔记本电脑,都是没插电源运行得,插了之后视频变成了两帧(-_-||),但是可以查看电脑电源设置,查看cup是否全速
Python dlib（HOG+SVM）人脸识别总结程序媛一枚~ 人脸识别 python 支持向量机开发语言读书笔记人脸检测识别
Pythondlib（HOG+SVM）人脸识别总结面部标志检测dlib68点（HOG+SVM），194点人脸识别模型，包括口（外嘴唇，内嘴唇），鼻，眉毛（左右眉），眼睛（左右眼），下鄂5点面部标志检测器（左眼2点，右眼2点，鼻子1点）面部对齐更高效眨眼检测ear眨眼瞬间达到0疲劳驾驶检测—连续帧ear面部对齐眼睛连线反正切获取旋转角度，期望图像眼睛横长度计算比率左眼计算右眼相对坐标眼睛横中心点作为
【Rust + Actix Web】现代后端开发：从零构建高并发 Web 应用 LCG元前端 rust 前端开发语言
目录项目概述环境准备项目创建与依赖配置系统架构设计核心代码实现1.数据库模型(`src/models.rs`)2.应用状态管理(`src/state.rs`)3.核心业务逻辑(`src/handlers.rs`)4.主应用入口(`src/main.rs`)高并发优化策略1.异步处理模型2.连接池配置优化3.缓存策略设计性能测试结果部署方案Docker部署配置(`Dockerfile`)Kubern
探索PyRDP：远程桌面协议的瑞士军刀彭宏彬
探索PyRDP：远程桌面协议的瑞士军刀pyrdpRDPmonster-in-the-middle(mitm)andlibraryforPythonwiththeabilitytowatchconnectionsliveorafterthefact项目地址:https://gitcode.com/gh_mirrors/py/pyrdp在网络安全领域，攻防两端的对决不断推动着工具的创新。今天，让我们聚
Github 2025-06-24Python开源项目日报 Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-06-24统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目10Swift项目1C++项目1yt-dlp:一个增强版的youtube-dl分支创建周期：1184天开发语言：Python协议类型：TheUnlicenseStar数量：64607个Fork数量：5309次关注人数：64607人贡献
nt!MiFlushSectionInternal函数分析从nt!IoSynchronousPageWrite函数到Ntfs!NtfsFsdWrite函数 sitelist nt4源代码分析 MiFlushSection NtfsFsdWrite
第一部分：while(TRUE){KeClearEvent(&IoEvent);Status=IoSynchronousPageWrite(FilePointer,Mdl,(PLARGE_INTEGER)&StartingOffset,&IoEvent,IoStatus);1:kd>pnt!MiFlushSectionInternal+0x6f6:80a72410e8c74bfbffcallnt!
Ubuntu基础（上传文件和部署Python） aaiier ubuntu linux 运维
首先打开[email protected]然后写yes，在输入密码然后就是输入ls/查看根目录ls/结果是ubuntu@x0-x-xx-xx:~$ls/binbootdevhomelib.usr-is-mergedlost+foundmntprocrunsbin.usr-is-mergedsrvtmpvarbin.usr-is-mergeddataetclibli
联咏NT98567高度集成边缘IPC应用SoC规格特性 weixin_Todd_Wong2010 边缘计算人工智能计算机视觉 python c++神经网络
联咏NT98567MQG是一款高度集成的SoC，具有高图像质量、低比特率和低功耗的特点，适用于电池应用，目标是2Mp至5Mp/8Mp边缘IP摄像头应用。该SoC集成了双核ARMCortexA7CPU、新一代ISP、H.265/H.264视频压缩编解码器、视频处理引擎（VPE）用于双传感器拼接和鱼眼去畸变、高性能硬件DLA模块、图形引擎、显示控制器、以太网PHY、USB2.0主机/设备、音频编解码器
开发者视角：一键拉起与快速安装的巧妙运用 tongjiwenzhang 携带参数安装信息可视化大数据 android ios
Apptrace技术集成方案SDK集成基础Android集成配置//build.gradle(Module)dependencies{implementation'com.apptrace.sdk:core:3.2.1'implementation'com.apptrace.sdk:deeplink:2.0.0'}//AndroidManifest.xmliOS集成配置//Podfilepod'A
MYSQL中常见DDL语句为你奋斗！数据库 mysql sql
DDL：对数据库以及数据库内部的对象进行创建、删除、修改等操作的语言,DDL语句更多的是由数据库管理员(DBA)使用，开发人员一般很少使用。一、数据库：1、查看数据库列表：showdatabases;2、创建数据库：createdatabase[ifnotexists]数据库名;3、显示已创建的库创建时的创建语句：showcreatedatabases数据库名4、删除数据库：dropdatabas
探秘 SELinux Notebook：安全增强的利器与实践指南纪亚钧
探秘SELinuxNotebook：安全增强的利器与实践指南去发现同类优质开源项目:https://gitcode.com/在网络安全日益重要的今天，SELinux（Security-EnhancedLinux）作为Linux内核的安全模块，提供了强制访问控制机制，极大地增强了系统的安全性。而SELinuxNotebook则是为了帮助用户更好地理解和使用SELinux的一款交互式教程平台。它将复杂
android launcher3,Android Launcher3 基本功能分析众卡之友 android launcher3
AndroidLauncher3基本功能分析1,界面的布局,从上往下分别为:DeleteDropTarget(应用卸载区域,它是一个DropTarget)Workspace(页面容器,一个页面是一个CellLayout)PageIndicator(指示器,指示workspace当前位于第几个页面)Hotseat(底部图标区域)2,Launcher桌面图标的加载:LauncherApplicatio
mb_bootloop_le.elf是使用microblaze默认的elf文件，这个文件包括哪些内容？ hahaha6016 硬件设计 fpga开发
一、mb_bootloop_le.elf说明1.mb_bootloop_le.elf是使用microblaze的FPGA的时候的默认的elf文件；2.XilinxSDK中的.elf文件全称为“ExecutableandLinkingFormat”（ELF）文件‌3.fpga开发中xilinxsdk的elf文件就是arm程序文件;elf文件大小就决定了你的堆栈大小要分配多大二、mb_bootloop
【Axum】Rust Web 高效构建：Axum 框架从入门到精通指南 LCG元前端 rust 前端开发语言
目录一、环境准备与项目创建1.1安装Rust工具链1.2创建项目并添加依赖二、Axum核心架构解析三、项目结构设计四、核心代码实现4.1应用入口(src/main.rs)4.2数据模型(src/models.rs)4.3路由配置(src/routes.rs)4.4认证服务(src/services/auth.rs)4.5用户处理器(src/handlers.rs)4.6数据访问层(src/repo
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

https://mp.weixin.qq.com/s?src=11×tamp=1509090286&ver=477&signature=cgdv6tbrM5s58sUA9FGT7bBpm*a

机器学习与微博：TensorFlow在微博的大规模应用与实践

作者介绍

今日荐文

你可能感兴趣的:(dl)