美通社

七牛云李朝光：深度学习平台AVA及海量资源管理

杭州2018年7月11日电 /美通社/ -- 5月26 日下午，在第二十八期七牛云架构师实践日，李朝光进行了题为《深度学习平台 AVA 及海量资源管理》的实战分享。本文是对演讲内容的整理。

七牛云在深度训练平台里如何管理数据以及 GPU ？

深度训练平台有两个核心，一个是数据管理，一个是计算资源管理。首先提数据管理的原因是，从传统意义上使用数据到深度训练访问数据，会发现一个有趣的问题：数据量已经大到没法管理的地步了。李朝光表示，“比如以往，我们用网盘或搭一个 CEPH，数据一般都是少数几个 T 的级别，但等到真正运作深度训练的时候，会发现跑一个训练，比如图像分类或视频检索训练，就能消耗几十个 T 的空间。怎么有效把这些数据喂到深度训练里？七牛云 AVA 平台的诞生就是要想办法解决这个问题。”

第二是计算资源的管理。这里的计算资源，基本指 GPU，一般来说是 NVIDIA 的 GPU。七牛云实验室里，现在已经有百台级别的 GPU，里面有各种型号，比如 M4、K80，到 P100、V100 都有。这些资源怎么有效地管理、使用，是个难题。七牛云开始是用非常原始的方式，比如抢占方式，后来再慢慢把资源管理模块化、精细化，最后才做到 AVA 这个平台。

七牛云目前围绕的是数据创新服务。但七牛云是做存储起步的，开始是集中在海量（对象）存储，后面进入了机器学习、智能多媒体服务，这些的共用特点是对数据本身的存储管理，比如对象存储。怎么把这么多数据存储起来？怎么高效地把它放在 CDN 里，快速地进行转发？目前七牛云已经基本实现了第一步：把数据有效地管理起来。第二步，怎么发现数据之间的关系？如何根据数据内容做创新？比如一个视频有几千帧，帧和帧之间有什么关系？一个图片，是否属于黄色或暴恐的？七牛云重点做图片、视频的检索、分类，还有人脸识别等。

一个图片过来，不能直接喂到七牛云深度训练系统里，第一步就要做数据处理。之前七牛云有个 DORA 系统，是做图片视频处理的，比如裁减翻转、加水印等。这样可以把数据转换成深度训练需要的格式，然后喂到深度训练系统里，这是目前正在做的一块工作。数据喂进来以后，经过深度训练、视频截帧，发现其中的关系，比如判断图片是不是暴力的、恐怖的，再重新把数据放在结构化存储里。然后反过来做一个迭代。做一个基础模型，内容分发，重新进入系统做一个循环。在这个循环的不停迭代中，不停改变训练的精度，输出一个最终想要的结果。这大体上现在 AVA 平台想做的事情，它的背景就是从传统的内容服务，慢慢过渡到数据挖掘，这部分就是通过七牛云深度训练平台来实现的。

七牛云 AVA 平台的概貌

七牛云 AVA 平台

上面一层是七牛云 AI 实验室主打的方向，是对外部可见的业务层，大部分的业务都是围绕图像、视频定制化，包括鉴黄产品、目标检测等。因为网络上充斥的黄色图片太多，很多客户每天有几千万张甚至上亿张图片存到七牛云。根据国家的法规，这些图片可能会有相当一部分是不适宜在网上出现的。但有时候客户也不知道，不可能靠人把这些图搜出来，我们怎么把这样的图片拎出来？这就需要做一个自动化处理，把图片自动识别。在七牛云这端，把图片清理掉，网站就不会把黄色图片或敏感图片放出去。这是通过深度训练平台，利用算法识别出不同的模型，然后在毫秒级别把图片识别出来。下面一层提供基础的服务功能，即 AVA 深度训练平台。

七牛云 AVA 平台能为大家提供一些什么？

AVA 平台最初是直接服务于算法工程师的。通过引入 CEPH，屏蔽掉存储管理细节，引入 Kubernetes 屏蔽容器管理细节，并把不同的深度训练框架打包到 Docker 镜像中，方便算法工程师使用。算法工程师可以聚焦于算法本身的设计，不用关心下面资源如何提供的。开始的时候机器比较少，GPU 资源有限，大家使用方式基本是独占模式，直接面对存储和 GPU 资源。后来随着业务量增大，机器资源增多，平台的灵活性和扩展性越发显得重要。AVA 平台重点从对资源的包装到对资源的灵活调度转变。算法人员已经解除对资源的直接依赖，一个简单的命令或 GUI 操作就能启动训练。除了针对算法人员，目前这套系统也开始提供给外部用户使用，首先会给高校学生提供一个免费尝试深度训练的平台，后面将会具体介绍。

七牛云 AVA 平台主要有哪些部分组成？

第一个部分是数据集管理。这里讲的数据集管理包含几个部分。第一是如何管理 P 级别的云上云下数据，并能及时有效地提供给深度训练。第二是对数据进行加工处理，比如图片裁剪，把数据打包成不同深度训练框架所需的格式，自动挂载入深度训练平台进行训练。还有一种是如何把训练产生的结果自动回传。

第二就是标注。机器其实并不是一上来就能识别图片，很多时候需要人工辅助它，即要人先教会它怎么做。在信息大爆炸的时代，每天进来、出去可能 60% 以上都是图像、视频，这不是现有模型仓库里能准确识别出来的。AVA 平台提供一套打标机制（LabelX），让非专业或专业人士，通过标注手段，告诉平台这些图片到底是哪种类型，然后输入到训练算法进行模型迭代、更新，最后输出标准模型。基于产生的模型，我们就可以通过推理来判断新输入的图片是属于什么分类了，比如黄色，暴恐的等。目前七牛云对黄图识别的准确率已经达到 96% 以上。

同时，深度训练是平台比较重头的一块，包括对 GPU 资源的管理、存储资源的管理、训练管理， Quota 管理、以及跟深度训练相关的联合调度。现在七牛云有比较好的调度系统，比如 Kubernetes，但当真正使用的时候，发现 Kubernetes 能做的非常有限，调度管理粒度比较粗，只能调度到容器的级别。做到容器级别，可部分解决资源共享问题，比如 100 台 GPU，可以全部用起来。但如果有成千上万的并发训练任务，Kubernetes 的管理就有点捉襟见肘了，比如不同机器的 GPU 怎么联合调度、通信怎么管、资源怎么分配更合理等。七牛云现在要做的一件事，就是在 Kubernetes 调度之上，细化对 GPU、CPU 的管理，引入 RDMA 的技术，把资源管理、通信和调度做深，做细，达到更好的资源共享和使用。

最后一个部分，是评估推理。前期的训练做了大量准备工作，准备好了评估模型。推理评估要做的就比较简单，是把新的少量图片加上模型再训练一次，在毫秒级别能够得出结果。这一部分大都与业务结合比较紧密。

AVA 平台的技术架构是怎样的？

下图显示的是 AVA 平台的技术架构，主要分为三层。最下面一层属于硬件和资源管理层，我们现在基本不会买单台 GPU 做训练，一般我们都是做一个集群，这一块交给 Kubernetes 就可以了。最上面一层是业务系统，包括模型、推理、标注和各个不同的训练系统，七牛云 AI 实验室业务大部分业务都在这层。中间这层是 AVA 平台重点要发力的地方，也是我们现在重点在做的。

AVA 平台的技术架构

这层有三个部分：

第一部分是存储系统。这一部分的核心是如何把大量的数据管起来。最早我们的数据是直接搭在 CEPH 上使用，但数据量一旦达到几十 T 的规模，问题就开始显现了。举个例子，一个视频训练有几十 T 容量，包含十多亿张文件，存在 CEPH PVC 上，有一天突然发现数据读不了了，找了半天才发现是文件系统 inode 用完了。另外一个例子是，当 PVC 空间满了之后，新的数据进不来，老的数据不知道哪些该删，很被动。七牛云现在的一个策略，就是不再基于 CEPH 做训练，而是基于云做训练，CEPH 可以做中间缓存。目前中等规模的训练已经完全跑通，对于 IO 吞吐要求不是特别高的训练，和在 CEPH 上训练没有显著差别。目前 AVA 是通过 Alluxio 把本地训练和云上的数据对接起来。

第二是数据管理。所有数据都来源于互联网，开始都是存在对象存储中。AVA 刚做的时候，必须把数据拉到本地来才能训练。标准用法是，用户提供一个 json 文件，里面每行是七牛对象存储的 URL，AVA 会把 json 中每个文件都下载，放到一个 PVC 中并挂载到 Kubernetes 的 Pod 中进行训练。在存放到 PVC 之前，还会调用七牛的图像处理系统 Dora 对数据进行一些必要的操作如旋转，裁剪等。在现实使用中，大家会不停地调整数据内容并进行迭代训练，每次调整都重新把数据拉取一遍将是很繁琐的事情。现在我们的做法，一个是直接在云上训练，这样对数据的改动直接反馈到云端，另外一个是引入结构化存储，把数据和元数据信息存放到 Mongo 中，并通过打快照的方式，方便灵活的选择不同版本数据进行训练。

第三是调度管理系统。在七牛内部，现有比较成熟的框架比如 Caffe、MXNet、Pytorch、TensorFlow 等都在使用。最初是直接使用，后来迁移到七牛容器云，由 Kubernetes 提供调度，这样的调度还是比较简单的。比如， Kubernetes 现在的调度策略是，选中了 GPU 机器后，对 GPU 卡是随机选择。但是，一台机器上的两张 GPU 卡，处于不同拓扑连接方式，性能相差非常大。比如 QPI 连接带宽可能是 3GB，而 P2P 模式可能达到 12GB。AVA 通过检查 GPU 的 Affinity 模式，改写 Kubernetes 的 scheduler，避免选择处于不同 CPU 通道上的 GPU 卡。还有，现有的调度策略是让所有 GPU 机器卡使用比较均衡，但如果一个训练需要使用 8 张卡，系统中卡总数满足，可能没有一台机器可以提供完整的 8 张卡，AVA 通过定制策略，提供特殊的 scheduler，可以选择优先把 Pod 调度到部分分配的 GPU 机器上。对于分布式训练，七牛云调研过 Tensorflow、MXNet 等，最终选择 MXNet ps-lite 作为基础。MXNet 可以做分布式训练，但只能把任务调到机器里，调过去 GPU 怎么共享、使用，依然有很多东西可以优化。后续七牛云会基于 MXNet 的 PS-LITE 框架，把分布式调度往深里做，满足深度训练的需要。七牛云也正在引进 RDMA 机制，通过 RDMA 机制把 GPU 跟 GPU 之间联系打通，提升运行的性能。

对海量数据，七牛云怎么管？

之前数据管理的现状是：大部分的数据会存放在对象存储中，做训练的时候，会把数据拉到本地来。所谓本地，一般指本地的一个集群或本地一台机器，一般玩法，都是搭一个本地 CEPH 集群，通过 Kubernetes 调度，把 PVC 挂上去，然后训练数据从对象存储导到这里，可以在里面跑训练，跑一两个月或是一两天都可以。这样做的问题是用户数据不能共享，大家如果用过 CEPH 就知道，CEPH RBD 在 Kubernetes 中不能共享读写，CEPH FS 可以，但性能有点差距。还有，CEPH 提供的存储空间对于深度训练的数据量来说是杯水车薪。

去年七牛云搭了一个 100T 的集群，在真正用的时候感觉还是比较吃力，会碰到各种问题。一个训练，就可能有几十 T，把 CEPH 会一下子撑爆。这只是七牛内部一个正常的训练，算上对外开放的用户，还有内部上百号人同时使用，这个集群明显不能满足要求。

视频数据一下占几十 T，其他人没法玩了，这是比较头痛的一个问题。运维空间不够，可以加盘，加了几次以后就没法加了，或者盘位没了，然后再加机器，形成恶性循环。几十T的数据可能前面半个月用了一半数据就不用了，这个时候其实放在云上对象存储里就可以了。但刚开始没有这个机制，大部分的数据都躺着“睡觉”，而其他人又没有空间可用

对 GPU 也是类似，如果一个集群中的 GPU 不能充分利用，到最后会发现运维就是不停加盘、加机器，用户不停倒数据。这过程还会影响带宽，陷入恶性循环。怎么破这个问题？这是七牛云 AVA 要解决的问题，AVA 首先要解决痛点问题，然后才解决好用的问题。

存储问题怎么解决？

七牛云引入了一个 Alluxio 的特性。对七牛云来讲不只是单纯把一个开源系统引进，七牛云还会做优化、定制化，后期也会开源出去。Alluxio 这个系统现在相对比较成熟了，支持的厂家也很多，微软、百度、京东都用了这个系统，这个系统还算成熟。将来大家的数据可以直接放到七牛云存储上，直接利用 AVA 平台做训练，当然其中也会有些优化、定制。

为什么选 Alluxio？它有以下几个特性：

第一，支持多对象存储，海量空间。对七牛云来讲，CEPH 按百 T 级别，运维就很难做了。但对对象存储来讲，上 P 都不是问题，可能稍微慢一点，但数据放在这里，总归可以做训练，虽然有时候会慢，但通过其他的手段解决，至少先把空间问题解决了。

第二，统一命名空间。通过 Alluxio 做，就是一个大系统，做训练的时候，数据放到任何地方照样可以把数据拉过来，导入七牛云的深度训练平台，训练完以后把结果再导回原来的地方。

第三，内存分布式文件系统。比如一百台机器，每个机器贡献几百 G 内存形成几个 T 的内存系统，可以把数据放在里面，后续所有训练都是从内存读取，不会从云上读取，这是非常好的一个好处。在实际训练中，七牛云经常用到这个内存文件系统的特性。

第四，Multiple tier 缓存系统。内存可能是几个 T 的级别，现在七牛云本身训练数据已经到了 P 级别，加上后续平台开放出去，可能要到 E 级别，T 级别的内存系统对 E 级别的云上数据肯定不可用，这里就可以做一个多层的缓存系统，内存放不下了可以放在本地的硬盘。这一块可以不落 CEPH 空间，因为 CEPH 空间可能还要再走一次网络，速度会受影响，七牛云可以直接落到本地缓存系统。

Alluxio 在七牛的应用

首先为了考虑稳定性，七牛云会搭两套集群。

一个是只读 Alluxio 集群，会分配大量的 RAM，还有基于 SSD 裸盘作二级缓存，大部分的云上训练数据，可以落到这里。平时不繁忙的时候，数据可以完全落在 RAM 空间里。另外一个是 Alluxio 写集群，可以把训练过程产生的模型、log、qw、h 新文件等写入它，并通过同步或异步方式传回云上。写集群对接的不是 SSD 裸盘，而是 CEPH 集群。为什么考虑 CEPH？因为可以保证机器故障的时候，数据不会丢。写集群分配的 RAM 容量较少，数据写入的时候直接落入 CEPH，再次访问的时候才提升到 RAM 中。大部分的加速会在 Alluxio 读缓存集群， Alluxio 写集群也有加速功能，但不是主要的。

再上面对接的是 FUSE Adapter。这是基于 Kubernetes 的 Flex Volume 做的，可以把云上数据通过 Alluxio 直接导到训练平台。采用 Adapter 是为了安全原因，再通过 FUSE 就可以把数据挂进来。比如每个用户在七牛云 AVA 平台训练的时候，把 bucket 直接挂进来就行了，之后七牛云会自动把数据缓存到本地的系统，后续所有读写训练都走本地系统。从使用者角度来看，相当于在本地系统里做训练。通过这种方式，很大程度上简化了用户的使用。 AVA 把外面的这些东西都掩盖了，用户做训练的时候，根本看不到自己的 bucket，只看到自己的目录，当做本地目录直接读写就行了。

数据读写流程约为：

训练开始的时候，可以对数据预热，读取到本地 Alluxio 集群缓存起来，大部分框架都有这样的预取功能。或者不做预热，这样训练速度可能受损，但训练完全没有问题。RAM 充满以后，会把数据下沉到下一层的 SSD 盘。通过 FUSE 系统，训练所在的 POD 可以直接读取 Alluxio 的数据，就像读取本地文件系统文件一样。读取的其实不是云上的内容，内容已经存在集群内部了。这个集群容量完全可以替代原来的 CEPH 集群，另外的好处是数据不用的时候可以自动剔掉，大部分在使用的数据，在这个集群里都可以找得到，相当于把加速性能发挥到了极致。

而对写也是一样，但写七牛云有个不一样的地方。为了保证数据安全，写的话可以直接穿过 RAM 写入 CEPH，最终 RAM 或 CEPH 空间到达高水位了，可以自动把写入数据推到云上。训练完以后，异步的把一些干净数据淘汰，脏数据送回云上。

七牛云通过这个流程，把海量数据管理起来。用了这套系统后，大家就不需要频繁倒数据了，因为系统就可以自动把冷数据踢掉，也不会存在空间不够的问题了。以前用 CEPH 的时候盘很快会满，很多工程师不知道哪些数据该丢哪些该留，现在不需要考虑这些问题了。AVA 会自动把冷数据踢掉，自动把脏数据上传云。

计算资源管理

七牛云刚开始对 GPU 的使用还是比较原始的。比如通过 Kubernetes 启动 Pod 绑定 GPU，绑定以后跑训练，绑定以后，GPU 不能共享，而且 Pod 基本是停留在那，不释放。正确的使用方式应该是做一个 GPU 的池子，训练开始的时候分配、绑定 GPU，结束后马上归还，这是可以做到的。现在七牛云对计算资源的使用，也是遵循这个模式。七牛云采用了 workspace 和训练两种方式来管理使用计算资源。 Workspace 和训练共享用户的存储。用户通过workspace来编辑代码，准备数据并做简单的编译、调试。一切准备就绪后，从 AVA 平台启动训练实例，绑定 GPU，训练结束后，归还 GPU 到池子里，后面的训练可循环使用。

计算资源管理

现在所有的新用户不能直接看到 GPU，具体训练的时候他不知道用的是哪几个 GPU，放在哪里。最早的时候大家占住几个 GPU 一直使用，不释放，别人没法共享。现在七牛云把它做成一个池子， GPU 就完全可以流转起来。以后的目标，就是用少数的 GPU 可以做大量的训练。目前，七牛云正在加一些新的特性，比如加 quota，分组机制，这样可以避免少数人无限制地霸占 GPU。

如何解决使用 GPU 存在问题？

如何解决使用 GPU 存在问题，最典型的问题是：GPU 的调度问题。

Kubernetes 的调度策略是比较简单的，先通过 predicate 检查，再通过 priority 检查，然后由 Kubelet 具体分配绑定资源。假如有两台 GPU 机器，每台 8 张卡，第一台已经分配出去 2 张卡了，再次申请 2 张卡的时候，Kubernetes 很可能会调度到第二台机器上，这样每台机器都使用了 2 张卡。如果这时有个训练要求使用同一台机器上的 8 张卡训练，调度将失败。这个时候需要把调度改掉，第二次分配在选择第一台机器的 GPU，第二台机器的 8 张卡可以完整留下来。通过不同策略就可以满足不同的需求。还有，假设是单台机器上选择两张 GPU 训练，如果选 GPU1 和 GPU3，它们属于不同 CPU，通过 QPI 链接，它们之间带宽可能只有是 3 个 GB 每秒。如果选择 GPU0 和 GPU1，它们之间属于同一个 CPU，那么带宽可能达到 12G 每秒。调度的时候尽量要选择 GPU0 和 GPU1 在一起。

实测中，七牛云也发现，比如内存和 CPU 有一定限制的情况下，通过不同的 GPU 分配方式跑的训练时间差异非常大，最多性能差距达到1倍以上。将来一旦扩大到整个集群，差别会更大。所以 GPU 的调度模式对训练影响会非常大。

AVA 平台的展望

原来七牛云内部从业务角度出发，也做了一个分布式的训练系统 ESPP，用于图像和视频训练，其中也用到了 Kubernetes 和一些训练框架，但是针对于特定业务系统的。现在七牛云准备把原来的业务系统都收编到 AVA 平台。 RDMA 这一块也是要重点考虑的，正在跟厂家做一些沟通交流，马上就要布上去，加上分布式调度系统，以后训练会比现在快很多。

虽然说现在 AVA 有了分布式的调度机制和 RDMA 机制，但从算法模型的生产角度讲，还处在一个手工阶段，大家还是通过手工方式不停的调整参数，然后不停的跑训练，以期调试出一个满意的模型。目前 Google 已经通过 AutoML 的方式自动能产生出很好的模型，七牛云还有很多路要走。七牛云正在和算法团队一起研究，如果让模型训练变得更高效，更自动化，更智能化。

总结

这套 AVA 系统，不仅七牛云内部使用，现在已经推广给高校学生免费使用。第一步已经准备了几十张 GPU 卡和常用的训练框架，登陆到平台后就可直接使用。高校学生遵循下面几个步骤就可以非常方便的使用 AVA 平台：

登陆七牛云 www.qiniu.com，创建一个账号
创建一个对象存储 Bucket
把学校名称/实验室名称，账号， bucket 发送到 [email protected]
审批通过后，进入 portal.qiniu.com，选择深度训练平台，绑定 bucket
创建 Workspace，编辑训练代码和准备数据
创建训练，从 workspace 查看运行结果
Done

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
直返APP是什么?直返APP是干嘛的氧惠帮朋友一起省
直返是一种电商购物模式，其核心特点是用户购买商品后可以获得直接返利。具体来说，用户在直返电商平台购买商品时，不仅可以获得商品本身的优惠，还可以获得一定的现金返利或者积分奖励。返利的金额可以提现到用户的账户余额，或者用于下次购物时抵扣。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

七牛云李朝光：深度学习平台AVA及海量资源管理

你可能感兴趣的:(七牛云李朝光：深度学习平台AVA及海量资源管理)