阿里云大数据AI技术

weidl x DeepRec：热门微博推荐框架性能提升实战

微博推荐团队：陈雨、韩楠、蔡小娟、高家华

1.项目背景

热门微博是新浪微博的重要功能之一，包含热门流、热点流、频道流、小视频后推荐、视频社区等场景。

标推荐首页发现页推荐沉浸视频题

weidl机器学习框架为热门微博在线学习提供模型训练和推理服务，推荐全链路中在线推理服务的性能一直是weidl框架优化迭代的重要目标。在线学习系统依托于weidl框架。其服务的吞吐量、平均响应时间、承接上游QPS、机器资源占用等指标相互制衡，其中weidl框架推理计算的性能至关重要，与推荐服务全链路的整体性能指标及成本密切相关。探索引擎中计算图运行时算子计算加速的各种特性及优化支持成为本项目主要方向。

DeepRec是阿里巴巴集团提供的针对搜索、推荐、广告场景模型的训练/预测引擎，在分布式、图优化、算子、Runtime等方面对稀疏模型进行了深度性能优化，同时提供了稀疏场景下丰富的Embedding相关功能。

本文主要介绍热门微博推荐的整体架构与DeepRec对热门推荐框架性能上的提升，并详细剖析的weidl平台中使用的DeepRec的重要优化点。

2.热门微博推荐系统与weidl在线学习平台

2.1 热门微博推荐系统整体架构

热门微博推荐系统可分为前台业务与weidl在线学习平台两个部分。前台业务为各个业务的接口，负责将推荐结果返回给业务方。在线学习平台集成了样本拼接、模型训练、参数服务器、模型服务等多个模块，为热门推荐的多个业务实现了完整的推荐流程，可快速为新业务搭建一套推荐系统。

2.2 weidl在线学习平台

在线学习平台是整个系统最核心的部分，主要负责召回、粗排、精排等模块。热门推荐系统为全链路大规模深度模型的在线学习系统，其中召回模块有兴趣召回、热点召回、策略召回、模型召回等多路召回，分别从千万级物料库中召回部分候选集，通过每路配额配置，将万级物料送入粗排模块。粗排阶段通过物料特征离线生成、用户特征实时拉取的方式，实现高性能的打分服务，通过粗排排序后，将千级候选集送入精排阶段。精排阶段模型最为复杂，物料与用户特征实时拉取，多场景多目标融合，最终通过规则系统的重排，选出一次曝光的博文，推荐给用户。

在线学习平台底层推理计算部分采用bridge模式，支持多个backend，包括DeepRec、TensorFlow、Torch、TensorRT等，同时支持基于CPU与GPU的模型训练与在线推理。

标题weidl在线学习平台

热门微博推荐系统从2018年开始，经过几年的升级，在实时性和规模上都有了本质的提升。

2.2.1 实时性

实时性包括模型学习到用户行为的速度，模型参数的更新应用到线上模型服务的速度。推荐系统的更新速度越快，越能够反应用户最近的用户习惯，越能够给用户进行越有时效性的推荐；模型更容易发现最新流行的数据pattern，越能够让模型反应找到最新的流行趋势。工程上主要通过以下几个方面，实现推荐系统的实时性。

a. 样本拼接作为模型训练的起点，一条完整的样本拼接完成的速度决定了模型学习用户行为速度的上限，目前热门推荐样本拼接窗口为30分钟，即用户在客户端的互动行为在30分钟内必会生成一条样本，送入kafka队列。

b. 模型训练读取样本流kafka，保证kafka无积压，所以该条样本会在毫秒级被模型学到，并通过rpc调用，更新到训练的参数服务器，并将新的模型参数推入kafka队列。

c. 参数同步服务从模型更新的kafka队列中读取数据，将模型最新的参数通过rpc调用，发送给在线服务所用的参数服务器中，此时从用户行为到模型更新完成。

d. 模型在线推理服务直连参数服务器，实时拉取模型最新参数进行打分。除去样本拼接所需的30分钟窗口，其余流程在1分钟内完成。

2.2.2 大规模深度复杂模型

热门推荐业务从最初的FM模型，到现在召回阶段以双塔为主，粗排阶段以cold dnn为主，精排阶段以多场景、多目标的复杂深度模型为主，模型在特征数量、目标个数、模型结构复杂度上都发生了质的变化，给业务带来了很大的收益。

精排模型从snr模型迭代到mm模型标题

标题粗排双塔模型迭代到cold dnn模型

模型复杂度的提升给工程架构带来了不小的压力，一个multitask模型比一个单目标的dnn模型在算力上是成倍的增加。为了复杂模型的落地，热门微博推荐团队探索了多种开源框架，包括TensorRT, XDL,TFRA等，通过测试与源码分析，这些框架都在原生Tensorflow基础上做了不同方向的优化，但性能始终无法满足要求。同时，我们也通过指令集优化、改进TensorFlow内存管理、算子融合等方式，优化weidl kernel部分性能。

在不断的优化与开源框架的尝试中，发现DeepRec框架在性能、易用性、与weidl的兼容性上都全面胜出，最终，热门推荐框架引擎采用DeepRec引擎，提升了训练与在线推理的新能，同时也给业务带来了效果上的提升。

3.DeepRec及相关模块优化点剖析

3.1 OneDNN库加速算子运算

DeepRec集成了最新版本的开源的跨平台深度学习性能加速库oneDNN（oneAPI Deep Neural Network Library），英特尔相关团队进一步优化将oneDNN 原有的线程池统一成DeepRec的Eigen线程池，减少了线程池切换开销，避免了不同线程池之间竞争而导致的性能下降问题。oneDNN针对主流算子实现了性能优化，包括MatMul、BiasAdd、LeakyReLU等在稀疏场景中的常见算子。针对热门微博的线上模型，性能提升明显。

在DeepRec中英特尔CESG团队针对搜索广告推荐模型中存在着大量稀疏算子如Select、DynamicStitch、Transpose、Tile、SparseSegmentMean、Unique、SparseSegmentSum、SparseFillEmptyRows等一系列稀疏算子进行了深度的优化，下面介绍2个常用稀疏算子的优化方法。

3.1.1 Select算子优化

Select算子实现原理是依据条件来做元素的选择，此时可采用向量化指令的mask load方式，如图所示，以减少原先由if条件带来大量判断所导致的时间开销，然后再通过批量选择提升数据读写效率，最终线上测试表明，性能提升显著。

3.1.2 Transpose算子优化

同样，可以使用向量化的unpack和shuffle指令对transpose算子进行优化，即通过小Block的方式对矩阵进行转置，最终经线上测试表明，性能提升同样十分显著。

3.2 关键路径优先的调度引擎

DeepRec通过对执行引擎以及底层线程池的重新设计，达到在不同的场景下，包括trianing和inference，能做到更佳执行性能。保证不同线程之间的均衡性，尽量减少线程之间的steal，避免加锁等问题。

Executor的设计需要考虑对内存的访问及其并行实现之间的联系，进行多层次任务调度，减少缓存缺失和远程内存访问，充分发挥多核、多节点CPU的并行特性，提升系统的运行性能。在线程池层面，设计Cost-aware线程池，结合内存感知以及算子类型等信息，进行针对性优化；在计算图层面，对张量内存的位置进行调度，有利于线程池的调度；在算子生成层面，进行有利于线程池任务调度的算子任务划分。

DeepRec提供的基于关键路径优化的执行引擎，通过动态采集Session Run情况，统计与计算多组指标，并构建CostModel，计算出一个较优的调度策略。该功能中包含了基于关键路径的调度策略，根据CostModel patching执行细碎算子的调度策略以及线程池Cost-aware调度策略等。

在graph执行过程中，Collector会监测所有算子执行以及线程池情况，包括算子执行时间，线程池pending任务饱和度，以及算子的前后依赖关系。这些参数会通过CostModel来计算更佳的调度策略。对于一张graph来说，存在一条或者多条关键路径，即从输入到输出经过的延时最长的逻辑路径。graph执行总的时间一定是大于等于关键路径时间。为了让整个graph执行更快，并发更佳高效，在graph执行时应当优先执行关键路径上的节点。

在稀疏模型图中，可能会存在大量细碎算子，会带来大量调度开销。有些可以通过算子融合来做优化，算子融合一般通过graph pattern匹配或者手动指定子图来确定需要融合的对象，难以覆盖全部算子。故而在executor层面，通过trace运行时数据来动态进行批量调度执行，这样可以减少非必要的细碎算子调度开销。

在线程调度层面，目前的线程池调度策略比较简单，如果当前执行线程是inter线程，优先将task调度到当前线程执行，若不是，则调度到一个random线程上。线程的balance完全由steal机制来保证。在我们的观察中，发现inter线程之间存在大量的steal，这会导致很多锁以及重复的线程调度等开销。CostModel executor通过采集运行时数据，来确定更佳的线程来执行任务，减少大量的steal行为。

在复杂模型上，使用DeepRec的CostModel调度，能够生成更佳的调度策略，减少调度开销。在测试的snr模型上平均耗时稳定优化2ms。

3.3 动态感知的内存/显存分配器

在张量内存管理方面，通常存在两点问题，一个是内存碎片过多，另一个是没有考虑模型结构存在多分支的情况下算子并行带来的内存增长。其内存管理十分粗放，大体上都是运行时依据内存请求动态进行内存释放和分配，同时进行一些内存池管理。由于无法感知上层应用的分配请求特点，这种内存管理存在着内存碎片过多的特点。例如在不清楚后续内存请求的情况下，由于前期的多次内存分配和释放，会导致后来的大内存请求由于内存碎片的问题而需要一块新的内存或者OOM。

深度学习模型的内存分配由于其应用特点存在着明显的规律性，训练时都是以一个个mini-batch的形式训练，每个mini-batch的分配特征大体上保持一致，训练时前向过程一直分配内存，较少释放，而反向过程中会释放前向计算中的临时张量，释放大量内存，所以内存会周期性呈现先增长后降低的特征。基于此学习到执行过程中内存分配pattern，从而减少内存的动态分配以及对内存块做到最佳的复用。同时自适应内存分配器也是graph-aware的，这样使得不同子图之间存在较小的相互干扰，提高分配效率。自适应内存分配器基本架构如下图所示：

自适应内存分配器在训练过程对于前面的K轮进行一些统计，通过Allocator模块，对内存的分配，包括分配的时间点、分配的大小，统计好分配的时间点和大小后，在K轮结束之后会使用启发式的一些算法规划出一个较优的tensor cache planner，planner会创建allocator，并且预分配一些tensor内存块，后续的分配会优先通过此allocator进行分配。

自适应内存分配器基本原则是使用尽量少内存，同时提高内存的复用率。整体来讲，自适应内存分配器解决了在稀疏场景中内存分配上存在的一些问题，主要包括，第一，减少了在稀疏场景中，大量内存分配问题，包括小内存和大内存。譬如小内存分配出现在特征的处理过程中，包括一些特征的拼接，或者在做一些交叉特征，这里会存在大量的小内存的分配。同样在模型训练也存在很多大的内存，包括attention、RNN、或者全连接层，会有一些大内存的分配。减少大内存的分配，进而也减少了minor pagefault数量。第二，对于tensor能做到更好的复用，减少了总体的内存占用量。

4.DeepRec在业务中取得的收益

4.1 服务性能提升

热门微博已于9月将weidl的backend全量替换为DeepRec，线上服务与训练都取得了很大的收益，最明显的是精排多任务模型，图计算部分DeepRec比原生TensorFlow耗时降低50%，精排阶段整体耗时降低20%，单机吞吐量提升30%。

对于双塔和cold dnn模型，图计算部分耗时降低20%，粗排阶段整体耗时降低10%，单机吞吐量提升20%，模型训练模块性能提升20%，提升了训练速度并有效的改善了样本积压问题。

4.2 性能提升所带来的其他收益

推荐引擎模块整体耗时减少与吞吐量的提升，减少了推荐在训练与在线推理上所使用的机器资源，极大的降低了公司成本。

在线推理服务性能提升，使推荐引擎各个模块可以计算更多的候选物料，粗排阶段可以计算更多的候选物料，提升物料库总量与扩大召回条数，精排也由1000条扩到2000条，每个阶段候选物料数的增加，都会对整体指标有显著的提升。

更多关于 DeepRec 训练/预测引擎相关信息：https://github.com/alibaba/DeepRec

前端技术简介 2401_83916204 程序员前端
“前端开发”是从“网页制作”演变而来的。从2005年开始，互联网进入web2.0时代，由单一的文字和图片组成的静态网页已经不能满足用户的需求，用户需要更好的体验。在web2.0时代，网页有静态网页和动态网页。所谓动态网页，就是用户不仅仅可以浏览网页，还可以与服务器进行交互。举个例子，你登陆新浪微博，要输入账号密码，这个时候就需要服务器对你的账号和密码进行验证通过才行。web2.0时代的网页不仅包含
周杰伦十大“冰度”歌曲 L香味
首先我个人声明，我是个04年就开始的JAY粉，榜单是我根据某狗音乐杰伦的热度榜上（live版）除外来排名的，看看你们都听过没？一、《麦烝玮》词：Jay曲：Jay麦烝玮，是经常出现在周杰伦身边的一个得力舞角，这首歌是周杰伦即兴创作歌曲，并于2011年5月18日通过小麦新浪微博首发，这歌是周杰伦写词谱曲诙谐调侃小麦。相信听过这首歌的人不会很多。二、《天台的月光》词：方文山曲：Jay《天台的月光》，作为
「DR」他爱的，只是你爱他的感觉／Aniel-Vega 箫凌
全世界只有不到3%的人微信搜索并且关注了箫凌你真是个特别的人策划：箫凌「fromOvertureStudio/角一文化」姓名：Aniel-Vega出生年月日：1996年6月1日星座：双子座把我想的，都说给你听。模特，演員，自由撰稿人，大二學生，2017亞洲小姐.花椒忘憂家族簽約主播，開平影視文化協會理事，廣東微電影聯盟會員，林涧樹洞創始人，開平潮人主編，新浪微博頭條文章作者，新浪微遊戲平台綜合版版
我玩腾讯微博也有10年了，腾讯微博即将停止运营和服务，我的青春说没就没了媒体人蔡林芮
据腾讯微博官网2020年9月4日发布官方公告称：由于业务调整，腾讯微博将于2020年9月28日晚23时59分停止服务和运营，届时用户将无法登录，如有需要，可在停止服务前备份自己的相关信息。这件事还顺利上了新浪微博的热搜。据悉，腾讯微博早已停止功能开发，维持基本运营。腾讯微博2020年9月4日发布微博停服公告看到腾讯微博发布这样的公告，让我感到非常的诧异，我以为腾讯微博早就停止运营。回想起腾讯微博的
千万级规模高性能、高并发的网络架构经验分享搬砖养女人网络架构经验分享
主题：INTO100沙龙时间：2015年11月21日下午地点：梦想加联合办公空间分享人：卫向军（毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。）架构以及我理解中架构的本质在开始谈我对架构本质的理解之前，先谈谈对今天技术沙龙主题的个人见解，千万级规模的网站感觉数量级是非常大的，对这个数量级我们
L1-100 四项全能大道戏 PTA团体程序设计天梯赛算法 PTA
作者陈越单位浙江大学新浪微博上有一个帖子给出了一道题：全班有50人，有30人会游泳，有35人会篮球，有42人会唱歌，有46人会骑车，至少有（）人四项都会。发帖人不会做这道题，但是回帖有会做的：每一个才艺是一个技能点，一共是30+35+42+46=153个技能点，50个人假设平均分配，每人都会3个技能那也只有150，所以至少有3人会四个技能。本题就请你写个程序来自动解决这类问题：给定全班总人数为n，
iOS 第三方登录 YQ_苍穹
第三方登录原理友盟登录1.在友盟下载SDK下载SDK2.查看如何配置SDK3.将SDK（UMSocial_SDK）拖拽到项目中，然后按照友盟文档做相应的配置：如：修改plist文件，让其支持HTTPS请求为APP瘦身导入依赖框架指明那个应用集成登录在友盟官方文档中直接拷贝，三方登录代码就ok了新浪微博登录SSO授权不跳转到微博登录了，直接授权配置步骤：在上面友盟登录的基础上，将之前下载的SDK里面
2024年Python最新Python爬虫教程-新浪微博分布式爬虫分享(2) 2401_84584682 程序员 python 爬虫新浪微博
开发语言：Python2.7开发环境：64位Windows8系统，4G内存，i7-3612QM处理器。数据库：MongoDB3.2.0、Redis3.0.501（Python编辑器：Pycharm；MongoDB管理工具：MongoBooster；Redis管理工具：RedisStudio）爬虫框架使用Scrapy，使用scrapy_redis和Redis实现分布式。分布式中有一台机充当Maste
ios加载html富文本编辑器,IOS - 富文本解决方案（上） Mr.括号 ios加载html富文本编辑器
概述针对富文本来说，一直都是移动端的痛。虽然网上的解决方案很多，但是大多数都是基于展示，真正可以进行编辑的，却很少。而这些少数的实现中，适合我使用就没有了。所以我决定自己研究，并实现。需求需求说起来很简单，就是要设计一款IOS、Androd、PC端通用的富文本编辑器。模仿新浪微博中-头条文章。调研经过多次的分析和调研，有过这么几套方案。使用UIWebView来实现使用内嵌js编辑器实现使用html
移动花卡宝藏版流量卡，19元每个月200G流量，你用过吗？全网优惠分享
移动花卡宝藏版流量卡，19元每个月200G流量，你用过吗？关注微•信•公•众•号"卡泡泡"就知道啦！移动花卡宝藏卡19元每个月200G流量。那是哪些软件能用这些流量?1、套餐优惠内容。30G的定向流量包，这里包括有中国移动精品APP以及阿里系、百度系、网易系、腾讯系、抖音系、芒果TV、快手、哔哩哔哩、喜马拉雅、新浪微博、VIVO等超过100款的APP。移动热门大流量卡推荐：动感地带花卡宝藏版19元
大数据毕业设计hadoop+spark+hive微博舆情情感分析知识图谱微博推荐系统 qq_79856539 javaweb 大数据 hadoop 课程设计
（一）Selenium自动化Python爬虫工具采集新浪微博评论、热搜、文章等约10万条存入.csv文件作为数据集；（二）使用pandas+numpy或MapReduce对数据进行数据清洗，生成最终的.csv文件并上传到hdfs；（三）使用hive数仓技术建表建库，导入.csv数据集；（四）离线分析采用hive_sql完成，实时分析利用Spark之Scala完成;（五）统计指标使用sqoop导入m
圣人与凡夫 c592ef8896a6
此文转发新浪微博中毉大夫博文2020-12-21阅读21406近来中国文化的兴起，本来是一件好事，大家都应该积极的参于，人人都应该尽力的去挖掘，人人都应该去分享，可是事实上却不是这样，很多人打击中国传统文化，说是封建迷信，不科学，有的人说中国传统文化装神弄鬼，近来又有人传找到了孔子的遗书，好像兴灾乐祸一样，今天我再谈一下，什么才是中国传统文化，圣人之道。首先我们在聊中国传统文化之前，必须的要分清，
失去“新浪热搜”的这一周，生活受到什么影响了吗？玉妃说
1月27日，国家互联网信息办公室指导北京市互联网信息办公室约谈新浪微博负责人，新浪微博热搜榜、热门话题榜、微博问答功能等板块暂时下线一周进行整改。很多人知道，也有很多人不知道。在PGONE被四大党媒联名批评之时，其粉丝误以为批评者之一紫光阁是餐饮饭店，计划制造“紫光阁地沟油”的热搜来整垮对方，讨论聊天记录被截屏暴露，第二天“紫光阁地沟油”果然上了新浪热搜。然而……其实新浪买热搜、造热搜并不是什么新
2020-04-30：闲话驿舟
之一：骂战爆发疫情以来全世界的新闻不仅单调了也明显少了在有限的新闻中最多的是骂战也有人说得冠冕堂皇谓之媒体战之二：不知道是怎么一回事新浪微博上无法打开别人的链接不知道是怎么一回事是不是又莫名地设置了什么限制一些无形的绳索总是把我们束缚刚才又试了一下这一次竟能打开之三：绿皮车与白衬衫微博上我特别关注的有两个其中之一是绿皮车与白衬衫绿皮车与白衬衫好久不来了今天我特意去他微博看了看好多好诗我一一点了赞之
微博评论点赞可以购买吗，微博评论点赞提升的方法有几种爱吃菠萝的鱼
新浪微博是国内最大的社交网络服务平台，很多用户都在用微博来记录生活，分享自己的喜怒哀乐。最近有很多人问我微博可以买点赞吗，可以买微博评论点赞吗？答案是肯定的，虽然不是很贵，但是也要给我带来一些帮助。我这里提供几种办法帮助你：第一种、在网上找点赞数高的微博，这种办法一般都是要花钱的。微博点赞：17762069205(长按微信号可复制粘贴)微博评论点赞购买1、在微博中寻找一条点赞数高的微博，一般都是要
荐诗丨像这样细细地听（茨维塔耶娃）李译
孩子遥望记忆的远方像这样细细地听，如河口凝神倾听自己的源头。像这样深深地嗅嗅一朵小花。直到知觉化为乌有。像这样，在蔚蓝的空气里溶进了无底的渴望。像这样，在床单的蔚蓝里孩子遥望记忆的远方。像这样。莲花般的少年默默体验血的温泉。……就像这样，与爱情相恋就像这样，落入深渊。（飞白译）新浪微博：@木子译
微博热搜榜单被撤下整改突然感觉生活少了点什么...... 英语学习社
昨日，微博热搜突然下线整改，这个消息传出可谓是几家欢喜几家愁啊，对新浪微博早就有意见的网友无不拍手称快。新浪的热搜榜，热门话题榜，微博问答功能，热门微博榜明星和情感板块，广场头条栏目情感版块都齐齐下线整改一周后再重新上线。China'sWeibosocialmediasitesuspendsportalsafterreprimand[1][1]reprimand:1)V-TIfsomeoneisr
外星小哥哥自己做的火箭“炮”日内竟然自己吃掉了？做个吃的
不可描述的食物你看了能受的了吗？想了解更多视频，欢迎关注新浪微博@做个吃的_吃星妄想~外星小哥哥自己做的火箭“炮”日内竟然自己吃掉了？
我可以既不是男人，又不是女人吗？柒号寡妇
去年年初，科幻片《上海堡垒》上映前，电影质量尚待论，网络上却热火朝天地议论起鹿晗的长相。图源新浪微博“现在的小鲜肉怎么都那么娘？““中国出现了男孩危机”“女装大佬男不男，女不女的，恶心“上述这些对男女气质形象的讨论被李银河老师称为“中性化社会焦虑症“。但你知道吗，Facebook注册提供的性别选项早已超过五十种：脸书其中一页比如跨性别者（Transgender）：指心理上不认同自己与生俱来性别的人
高敏感人群-怎么能让自己活的不那么累咖啡就要不加糖
打开新浪微博，有一个关于敏感的相关话题，叫做："和敏感的人相处有多累"，这个话题有接近1100万的阅读量。话题里主要的焦点在于-如果对着一个敏感的人，说一句话都怕他多想，想前想后想五百年，他累，整得自己也跟着累，时时刻刻都紧张。所以敏感，就成了一个贬义词，通常和多愁善感、玻璃心、脆弱连在一起。敏感的人也很委屈：明明我是在关心你处处以你也中心，甚至处心积虑的在讨好你，观察入微你的那个动作那个眼神，揣
应用架构文章这小子
ServiceOriented的iOS应用架构新浪微博iOS客户端架构与优化之路糯米移动组件架构演进之路文化碰撞：函数式、面向协议、面向对象编程的最佳实践探索Swift中的MVC-N模式Code-T沙龙资料高速公路换轮胎——为遗留系统替换数据库围观神仙打架，反革命工程师《iOS应用架构谈组件化方案》和蘑菇街Limboy的《蘑菇街App的组件化之路》的阅读指导iOS组件化方案探索iOS应用架构谈组件
Python爬虫开源项目代码（爬取微信、淘宝、豆瓣、知乎、新浪微博、QQ、去哪网等等）... lyc2016012170 python java 大数据编程语言数据库
文章目录1、简介2、开源项目Github2.1、WechatSogou[1]–微信公众号爬虫2.2、DouBanSpider[2]–豆瓣读书爬虫2.3、zhihu_spider[3]–知乎爬虫2.4、bilibili-user[4]–Bilibili用户爬虫2.5、SinaSpider[5]–新浪微博爬虫2.6、distribute_crawler[6]–小说下载分布式爬虫2.7、CnkiSpid
L1-027 出租分数 20 想了半天也不知道取什么名字每日两题算法
下面是新浪微博上曾经很火的一张图：一时间网上一片求救声，急问这个怎么破。其实这段代码很简单，index数组就是arr数组的下标，index[0]=2对应arr[2]=1，index[1]=0对应arr[0]=8，index[2]=3对应arr[3]=0，以此类推……很容易得到电话号码是18013820100。本题要求你编写一个程序，为任何一个电话号码生成这段代码——事实上，只要生成最前面两行就可以
Redis缓存设计与性能优化逍遥白亦
1.缓存设计在使用Redis场景中，最常见的问题就是缓存雪崩、缓存穿透和缓存击穿，后果都是由于各种情况导致大量请求直接访问DB，使得DB压力巨增，从而DB服务瘫痪，导致整体服务有问题。(参见新浪微博明星、大V的推送)1.1缓存雪崩缓存雪崩指的是大批量缓存在同一时间失效或者是缓存层支撑不住宕机，导致流量直接涌入数据库中，会造成数据库压力过大甚至挂掉。1.1.1解决方案把每个key的失效时间都加个随机
Markdown基本语法的总结 H_jb23
Markdown基本语法总结标题：从一级到六级的标题XXXXXXXXXXXXXXXXXX无序列表：XXXXXXXXX有序排序列表：1、XXX2、XXX链接和图片：新浪微博[图片上传失败...(image-4d30d5-1517704756832)]引用：printfscanfdoubleintchar...粗体和斜体：普通的字体斜体粗体表格：dogbirdcatfoofoofoobarbarbar
apicloud config配置夏茵儿
Widget的名称。如：QQ、新浪微博、微信等(必选)Widget的简单描述信息(可选)Widget的作者信息(可选)
编码安全风险是什么，如何进行有效的防护德迅云安全-文琪安全
2011年6月28日晚20时左右，新浪微博突然爆发XSS，大批用户中招，被XSS攻击的用户点击恶意链接后并自动关注一位名为HELLOSAMY的用户，之后开始自动转发微博和私信好友来继续传播恶意地址。不少认证用户中招，也导致该XSS被更广泛地传播。状况持续至21时左右。在这期间共有3W多名微博用户受到攻击。根据分析，此XSS攻击事件其实是一个利用了新浪微博的一处漏洞进行的CSRF攻击。在软件开发过程
冯绍峰赵丽颖官宣结婚，微博瘫痪，微博技术专家如何应对？ top100case 技术案例分享微博瘫痪冯绍峰赵丽颖
今日上午10时左右，新浪微博推送了一条消息，赵丽颖冯绍峰官宣，晒出结婚证！小编立马点了进去，没想到微博（手机端）又打不开了。微博作为国内第一媒体，拥有超过3.6亿的月活用户，也是当前社会热点事件传播的最主要平台。本来明星出轨、宣传结婚等热点事件出来就会对微博服务器产生很大影响，甚至造成瘫痪。当年鹿晗和关晓彤恋情曝光致微博瘫痪，就有微博搜索架构师丁振凯在婚礼上还在修复bug，并成功登上自家热搜榜。2
为了新中国，请向我开炮 c592ef8896a6
为了新中国，请向我开炮节选：新浪微博中毉大夫文章回想起小时候看电影，战士被敌人包围了，战士为了中国的解放，向上级请示，向我开炮，可惜在今天无烟的战场上，我们也被层层的包围着，中国的崛起，中国的振兴，在国外有多国联合围堵，在国内也被层层设防围堵打压，上边也知道百姓的困境，才告知要理直气壮的学习中国传统文化，要做排头兵，要杀出一条血路出来。可是在今天的中国电视，纸媒有几人再看，网络平台遍地开花，已经主
名人也有生老病死梦之荒原
早晨无意中浏览了手机uc推送的一条新闻，著名央视主持李咏去世了，当时想一定是假新闻，之后又翻看了微信公众号里文章，在澎湃新闻也有一条这样的消息，同为哈文微博发文：永失我爱。下午又在新浪微博官方也看到了新闻，其它新闻也都跟风而来。毫无疑问，这是事实了。印象最深的是李咏的春晚主持，当时总觉得那是一张马脸，外加长卷发，好似外国人，一个油腻的中年大叔形象，去年突然看到剪发形象，委实觉得是越来越帅，越来越年
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。