冬瓜1

百度搜索研发部

首页
关于我们

百度开发者中心百度开放V计划百度技术沙龙

基于机器学习的知道推荐—Enlister (2012-11-07 06:11:29)

标签：分类：未分类

基于机器学习的知道推荐—Enlister

— trisun

Enlister—最大的中文问答网站“百度知道”的问题推荐系统名字。这个由几个百度一线工程师研发的系统，自2012年1月上线以来，承担着百度知道千万级登录用户的问题推荐计算。

问题的开始

百度知道这样的问答社区型网站有个典型特点：有些用户在平台上提出问题，这些问题被另一些用户发现，其中有能力且有意愿的人回答了这几个问题。这几个问题及其解答在平台上沉淀下来，持续给后来有相关问题的搜索用户提供着解答，并激励着更多用户将自己的问题发布在平台上。

像这样的系统就是一个自生态系统，有人生产，有人消费（如图1）。若其中一个环节出现问题，都会导致这个生态异常。在现在的百度知道上，每日有几十万的新问题正在提出，又有近百万左右的在涌现，而浏览这些知识的人每天有上亿。最可能出问题的地方在于，问题被提出以后，解答无法满足甚至鲜有人问津，这不利于解决提问者的疑惑和知识的沉淀。

图1

面对这样问题，提升回答量是最直接的办法，回答量上升了，有价值的回答数量就会成比上涨。“回答”是一个高门槛的事，是contribute而非consume。排除这个问题，若用户本身在发现待回答问题上，还需要过高的付出（例如搜索、或按分类查找，如图2），那着实让大量有能力和意愿但不想花更多时间在查找问题上的人望而却步。而推荐，就是我们一把杀手锏。

图2

说到推荐

有了推荐，就有了地基，如何设计楼宇有更多细节需要解决。做推荐需要密切结合产品，是恒古不变的真理。详细了解了知道的产品和目标后，我们提出了三个该系统核心：

1、基于内容

新问题一旦被提出，其解决就刻不容缓。高时效性要求了必须要以准确的内容分析为基础。

2、 CTR预估(Click Through Rate，点击率预估)

为了提升回答量，我们可考虑提升点击量，在用户量和回答率不变的基础上，间接提升了回答量。另外，CTR预估是我们擅长的技术，是我们的一大优势。

3、流式计算

为了适应新问题实时推送，我们设计了以问题数据为主数据流的推荐系统，保证了新问题在分钟级时效性内推送给目标（如图3）。

图3

基于内容

基于内容，意味我们需要用模型准确地描述“问题”和用户。考虑我们的推荐场景，一个新问题产生并被推荐给目标用户后，用户看到的是一个推荐列表与里面的问题标题（如图4）。此时，影响一个用户是否点击该问题的因素大致有：问题的具体内容、问题的分类及分类的回答活跃度、问题的地域性。其中，问题分类活跃度是一个实际观察得到的因素，某些分类，如情感，的回答活跃度会远远高于其他分类。而用户因素则有：用户内容偏好、回答时间、了解地域、最近行为偏向与最近推荐活跃度。其中，除了内容偏好与了解地域这类用户长期兴趣，一些短期偏好如时间、最近行为和最近对推荐的活跃度作为context信息也被考虑在内，以便提高推荐时机准确性。

图4

根据以上因素，我们对问题进行了如下建模：获取问题标题、切词并从标题中抽取中心词，构建plsa主题模型，利用分类器获取问题分类（分类结构可见知道主页上“问题分类”）与该分类最近点击、回答量，问题推荐的时间与问题地理关键词。

而用户的建模包括了：用户在知道的个人中心定制的关键词、问题分类，用户历史回答问题标题中挖掘的中心词分布与权重及这些中心词的plsa模型，用户最近回答问题的时间，最近回答的问题标题，以及用户最近对推荐问题的点击与回答量。

利用以上的数据，我们基本对问题、用户有了准确的描述。不仅涵盖了用户关注的问题且能解答的兴趣方向，同时刻画了最近用户的回答兴趣偏向与推荐场景信息。

CTR预估

CTR预估自然就会使用到最大熵模型。该模型是经典的分类模型，在工业界有很多成功的使用案例，不仅可以进行线性计算以满足实时推荐需求，也不用考虑变量间独立性关系，可将所有的特征（包括context信息）构造成向量加入模型中。在我们的问题中，希望利用及其有限规模的设备来获得优质的推荐服务，自然就涉及到需要定期更新训练模型且样本数不能过大（训练本地化），特征维度不宜过高。因此，我们尽可能利用用户与问题模型构造组合的高级特征，以提高特征的覆盖度和泛化能力（如图5）。

图5

为了保持模型的新鲜性，我们自动更新模型周期为5天。在5天之内采样登录用户的几百万点击数据作为正样本。常规情况下，本可采用推荐列表中展示但未被点击的问题作为负样本，但预测结果并不令人满意，究其原因可能为：由于列表上问题方向由一定重复性，另外用户每天回答能力有上限，所以列表上其他问题可能由于用户未看到或已经不想再继续回答而未点击，不能代表其为真正的负样本。所以，负样本采用从与正样本时间一致的同一批问题里随机抽取。而正负样本比例则尝试了多种比例组合，最终1:1的比例在精确率(accuracy)上优于其他组合(如图6)。

图6

流式计算

流式计算，是相对于离线批量计算和当用户访问时实时为其计算推荐而言的。当新问题产生时，我们需要及时为其发现目标用户，并为这批目标用户构建新的推荐列表，包含了巨大的计算量及存储量。如图7，当我们在question pre-process端接收到新问题时，立即对其进行秒级建模运算；而在user action pre-process端，我们利用分布式计算实现了用户模型小时级更新，保持用户模型的新鲜性。通过BMQ系统（Baidu Message Queue）将建好模的问题发送到几十台click predict运算模块中（每台包含不同的用户分片）。click predict内部也是多线程并行流水线处理，保持高并发性（如图8）。当click predict接收到一个问题，会先根据问题中心词拉取用户倒排，获取一个该问题关联用户的候选集(pre-process)，淘汰部分不合格用户。在prediction阶段，对问题和关联到的全部用户（千量级）计算点击率，并淘汰低点击率。最后再re-rank阶段对用户原有列表插入该新问题。

图7

图8

列表构建

在上一节最后提到了将一个新问题插入到原有用户列表中。若只简单考虑利用CTR值来进行排序，则使得整个列表看起来同质化比较严重：

1、不少问题的标题很接近，在列表中排序也可能很邻近；

2、用户可能包含几个兴趣点，但最终列表（特别头部）集中了大量问题只属于一个兴趣；

实验表明，这些问题会严重影响用户体验，降低用户持续回答的欲望。我们则采用了一种多样化列表构建方法，以CTR为基本排序依据，但在列表头部尽可能的保证推荐的相关性。当一个新问题插入头部时，只要和周围标题不是非常接近都可插入，让用户能首先看到的列表前部看起来推荐很“准”；而在非头部区域，则加强对邻近问题相似过滤，让更多的兴趣点能得以展现，用户看起来觉得很“多样化”(如图9)。

图9

整体系统

除了以上几点需要考虑之外，我们做一个线上的推荐系统还需要考虑如spam屏蔽、某些业务逻辑、用户反馈等问题。如图，在多样化列表构建时，加入业务逻辑模块，过滤spam问题，对一些高价值问题的展现进行优先或对用户点击删除或不太喜欢的关键词进行屏蔽、降权。图10中RP部分是推荐引擎，iknow部分是产品线。

图10

图11是系统上线前与上线后（201201）回答量的一个对比。原有推荐系统基于中心词计算距离相似进行推荐，日均回答量不足8万。Enlister上线后回答量持续攀升，至6月份后稳定在19万左右。

图11

蔡晶/文

阅读全文>

阅读(30,235) ┆ 评论(0)

解析nginx负载均衡 (2012-7-27 06:07:57)

标签： nginx , webserver , 负载均衡分类：未分类, 贴吧技术

摘要：对于一个大型网站来说，负载均衡是永恒的话题。随着硬件技术的迅猛发展，越来越多的负载均衡硬件设备涌现出来，如F5 BIG-IP、Citrix NetScaler、Radware等等，虽然可以解决问题，但其高昂的价格却往往令人望而却步，因此负载均衡软件仍然是大部分公司的不二之选。nginx作为webserver的后起之秀，其优秀的反向代理功能和灵活的负载均衡策略受到了业界广泛的关注。本文将以工业生产为背景，从设计实现和具体应用等方面详细介绍nginx负载均衡策略。

关键字：nginx 负载均衡反向代理

阅读全文>

阅读(36,571) ┆ 评论(0)

漫谈社区PHP 业务开发 (2012-7-26 03:07:20)

标签： lamp , 子系统拆分 , 开发框架分类：大型网站架构, 未分类

在当前这个互联网业务飞速发展时期，新的产品如雨后春笋般涌出，老产品线新业务也在不断突破和尝试。这就对快速开发迭代提出了更高的要求。

一、基础运行环境

针对新产品的开发，必须能够快速搭建一套LAMP架构。那么无外乎选择一个webserver，选择一个php版本，选择一个mysql版本，再选择一个PHP开发框架和选择一些php通用扩展和基础库等。这个过程读者可能觉得已经很快了，能不能更快？

选择的过程要求研发同学对相关技术方向有一定的积累，权衡利弊和优先点，又是一番调研和学习。如果有一键安装程序，提供自动化安装webserver，php，mysql，以及携带高性能灵活的php开发框架，并提供标准化、安全、常用的配置文件，可以大大缩短产品线LAMP系统调研的成本，缩短工作周期。

阅读全文>

阅读(20,822) ┆ 评论(0)

使用Weka进行数据挖掘 (2012-7-26 03:07:26)

标签： Weka , 数据挖掘分类：数据挖掘

1.简介

数据挖掘、机器学习这些字眼，在一些人看来，是门槛很高的东西。诚然，如果做算法实现甚至算法优化，确实需要很多背景知识。但事实是，绝大多数数据挖掘工程师，不需要去做算法层面的东西。他们的精力，集中在特征提取，算法选择和参数调优上。那么，一个可以方便地提供这些功能的工具，便是十分必要的了。而weka，便是数据挖掘工具中的佼佼者。

Weka的全名是怀卡托智能分析环境（Waikato Environment for Knowledge Analysis），是一款免费的，非商业化的，基于JAVA环境下开源的机器学习以及数据挖掘软件。它和它的源代码可在其官方网站下载。有趣的是，该软件的缩写WEKA也是New Zealand独有的一种鸟名，而Weka的主要开发者同时恰好来自新西兰的the University of Waikato。（本段摘自百度百科）。

Weka提供的功能有数据处理，特征选择、分类、回归、聚类、关联规则、可视化等。本文将对Weka的使用做一个简单的介绍，并通过简单的示例，使大家了解使用weka的流程。本文将仅对图形界面的操作做介绍，不涉及命令行和代码层面的东西。

阅读全文>

阅读(18,885) ┆ 评论(0)

前端重构实践（二） —— 模块化开发 (2012-7-26 03:07:58)

标签： js代码压缩 , 前端 , 性能分类：前端技术

前言：

在上一篇文章中我介绍了我们对N产品性能优化的整个历程，主要偏重优化方法。本篇我将介绍在这一过程中，我们的代码出现了什么样的问题，以及我们是如何通过前端重构来解决掉这些问题，并产生了哪些收益。

痛点：

按需加载为我们的页面带来了很大的性能提升，但同时也为代码结构带来了很大的冲击，很多直接调用的方式被改为了模块化的调用形式（先判断模块是否存在，不存在就先加载对应的js，再执行回调）。

阅读全文>

阅读(7,922) ┆ 评论(0)

Gecko架构浅析之编码检测和转换 (2012-7-16 02:07:59)

标签： Gecko , 编码检测 , 编码转换 , 网络排版引擎分类：浏览器技术

一：前言简介

Gecko是一套网络排版引擎，由来已久，为当年大名鼎鼎的netscape网络浏览器流传而来，后面也成为了firefox浏览器，thunderbird等等软件的基础。详细的发展历程在这里就不展开做具体介绍了，读者可以自行查阅百度百科，维基百科等资料。

在这一章我们重点介绍一下gecko中是如何对全球各种不同的网页文档的编码方式来做出识别和转换的。

我们知道，netscape或者firefox是面向全球用户的，并且，在互联网的世界，并没有什么界限妨碍一个美国的用户访问中文或者日文的网页。所以，在这种场景下，浏览器是否能正确识别每个地区的网页的编码格式，并正确地显示出来，就尤为重要了。

阅读全文>

阅读(6,113) ┆ 评论(0)

诡异提交失败问题追查 (2012-7-13 08:07:52)

标签： linux内核 , 系统调优分类：贴吧技术

摘要:

自四月份以来，贴吧遇到了发帖失败的问题，现象比较诡异。经过追查发现是操作系统刷磁盘时，阻塞write系统调用导致。本文主要分享问题追查过程，希望对大家日常工作中定位问题有一定帮助。

TAG:

提交、问题追查、脏页

1 背景

很久前知道上有个问题：“从前天开始，跟帖就是发帖失败，换个ID开始能发，后来又变成发帖失败，很迷惑。谁知道怎么回事么。是系统问题么，还是网络问题？”最佳答案是：“很大部分是网络出现问题，你可以重新提交下就可以了”。

前段时间，贴吧的提交UI老是报警，晚上的时候手机叮叮咣咣地响，每次看都是apache进程数上千hold不住了，只好逐台重启。后来OP怒了，直接写了个脚本，发现apache进程数上来就自动重启。

好景不长，某天图1被PM截下来发到群上，自己发几个贴测试下居然复现了！看来真不是网络的问题，必须好好追查下了。

阅读全文>

阅读(9,116) ┆ 评论(0)

浅析App Engine (2012-7-12 01:07:02)

标签： app engine , paas , 云服务分类：贴吧技术

摘要：

在国内外，云计算正在大步的走向商业化的道路，也得到了越来越多公司的重视。其中平台即服务（Platform-as-a-Service PaaS）已经称为业界探讨云计算的热点方式之一，采用PaaS模式来构建应用运行平台App Engine是一种重要的实现方式。本文主要是对App Engine的背景、特点、需求等进行分析整理，并据此对业界主要的App Engine进行了调研分析。最后对一个完善的App Engine进行了需求的细化分解、架构设计，并针对App Engine的部分核心技术问题提出了解决方案。

关键字：App Engine、PaaS、SAE、Nginx、scribe、Hadoop、Storm、Ptail、Scribe

阅读全文>

阅读(9,781) ┆ 评论(0)

HTML5技术的调研以及贴吧应用总结 (2012-7-12 01:07:21)

标签： html5 , 前端开发分类：贴吧技术

文档简介：

贴吧在进行HTML5技术应用的过程中，进行了一系列的技术调研；本文对HTML5的技术调研进行总结，尽可能客观的分析解答对HTML5技术的一些疑问，给出产品、技术上的一些决策建议。

对于文中的内容以及表述，也热切希望能得到大家进一步的指正和交流。

1. HTML5的发展现状及趋势

1.1 HTML5简介

HTML5是一套技术标准、规范，它定义了一系列的API编程接口和HTML规范（本文中将CSS3也默认涵盖到HTML5的技术范畴）；HTML5的运用和推广，需要依赖于各个浏览器厂商对HTML5的支持力度。

详细介绍请参看百度百科：

http://baike.baidu.com/view/951383.htm

阅读全文>

阅读(7,424) ┆ 评论(0)

无线webapp安装更新机制 (2012-7-12 01:07:07)

标签： webapp , 无线分类：贴吧技术

摘要

为了满足移动终端：节省流量、减少请求、提高客户端性能的需求，我们设计了webapp安装更新程序，把js、css、html和图片这些资源，序列化为字符串存入客户端本地存储，并带上版本号来实现资源细粒度更新。

TAG

webapp 安装启动性能优化

1、概述

我们认为webapp是一站式的应用，在一个页面里能完成整站的功能。所以，以前通过页面全刷的跳转，现在变成了通过底层框架来支持的局刷和切换动画。为了支持这些功能，会多出不少的代码，再加上app里的功能代码，我们统称为资源，包括底层库js（zepto、iscroll、baiduTemplate等），通用ui组件和app功能性的js、css、html和图片。

如何处理一个页面里的这么多资源，才能降低对性能的影响呢？为此，我们设计了webapp安装更新程序，可以做到减少资源请求，节省流量，提升客户端性能。

阅读全文>

阅读(5,218) ┆ 评论(0)

第 1 页，共 10 页12345»10...最旧 »

使用hadoop进行大...
“分布式哈希”和“一致...
搜索背后的奥秘——浅谈...
即时通信与浏览器多TA...
解析nginx负载均衡
大话PHP之性能

lbs技术 (1)
分布式基础 (1)
前端技术 (13)
图像处理 (2)
多媒体技术 (3)
大型网站架构 (4)
存储技术 (1)
搜索引擎技术 (2)
搜索技术 (16)
数据挖掘 (3)
数据结构与算法 (3)
无线客户端技术 (1)
未分类 (11)
架构 (1)
框计算 (5)
浏览器技术 (1)
相关性算法 (1)
系统底层 (1)
编程技术 (15)
自然语言处理 (6)
贴吧技术 (21)
运维技术 (1)

2012年十一月
2012年七月
2012年六月
2012年五月
2012年二月
2011年十二月
2011年十一月
2011年十月
2011年七月
2011年六月
2011年五月
2011年四月
2011年一月

百度应用开放平台
百度开发者平台
百度互联网技术社区
百度框计算技术交流平台
泛用户体验博客
无线用户体验博客
百度互联网技术官方博客
百度技术沙龙微群

如何看待 IBM 中国研发部裁员专家大圣经验分享
一、引言在全球信息技术飞速发展的时代，跨国科技企业一直扮演着重要的角色。IBM，作为全球知名的信息技术和业务解决方案公司，在中国市场也有着长期的发展历程。然而，近日IBM中国宣布撤出在华两大研发中心，进行大规模裁员，这一举措引发了广泛的关注和讨论。这不仅对众多IT从业者的职业发展产生了重大影响，也让人们开始思考全球化背景下中国IT产业的竞争力和未来发展方向。本文将从整体分析、人才发展和产业未来三个
IBM 中国研发部裁员风暴，IT 行业何去何从？青云交 java学习教学 IBM 裁员 IT 产业人才发展产业未来自主创新全球格局职业发展裁员风暴中国研发部
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
我要实现财务自由（二十五）贫穷思维实现财务自由日记
王一可能是最近在百度搜索里找了不少关于财务自由的资料，这段时间，百度推荐的内容大多是财务自由、富人与穷人比较相关的信息，想来还真的挺有意思的。像这些APP，设计的理念就是根据用户的需要推荐相似信息，APP设计理念如此，别人给我们的东西，比如知识、信息、态度、期望也是根据对我们的特点提供的，其实我们的选择本来就像一块磁铁，我们选择什么，相关的东西就会来到我们的身边。既然选择权在我们手里，为什么不选择
如何不用PS将模糊图片提升为高清图片 AFR分享社
本文来源于→微信公众号：AFR分享社正文不知道大家平时在工作、学习生活中有没有遇到这几种情况：01.看见一张自己非常中意的图片，想拿它做素材、手机屏保、电脑墙壁纸等，但是它的像素非常的模糊。02.你的客户或者公司老板给你一张较为模糊的图片，要求你把它变高清......面对上面的问题，能处理它们的方法，对于电脑小白来说应该会束手无策，然而有部分人肯定会想到的PS。于是就去百度搜索“PS怎么把模糊的图
梦见表亲 02f44340c4a1
昨天做梦梦见了表亲，然后百度搜索是说此人过得很凄凉，嘻嘻，这一次我真的相信了，我已经过了多久漂泊的日子呢，我早已不知道我现在活着是什么在支撑着我，是被疾病摧残的本来会辉煌一生的学业，还是这虚弱如60岁老太太的身体，还是一刻麻木的心，时时刻刻充满着各种纠结，不安。最近我每天夜里都会哭，我哭什么不知道，我想如何把灵魂安放，我早已失去控制它的一切，我此刻找不到落脚点，下一刻也是悬着的。
【话题】如何看待IBM中国研发部裁员？何遇mirror 话题话题
如何看待IBM中国研发部裁员？近日，IBM中国宣布撤出在华两大研发中心，引发了IT行业对于跨国公司在华研发战略的广泛讨论。这一决定不仅影响了众多IT从业者的职业发展，也让人思考全球化背景下中国IT产业的竞争力和未来发展方向。面对这一突如其来的变化，我们应该如何看待跨国公司的决策？中国IT人才该如何应对？中国IT产业又将何去何从？方向一：整体分析IBM近期在中国的裁员行动反映了跨国企业在面对全球经济
IBM中国研发部裁员风波：挑战与机遇并存，中国IT产业如何破局前行？倔强的石头_ 热点时事跨国公司就业
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：《热点时事》期待您的关注目录引言一、整体分析背景与原因分析可能带来的影响全球IT产业格局变化趋势二、人才发展人才市场影响提升竞争力策略三、产业未来应对策略展望未来引言如何看待IBM中国研发部裁员？近日，IBM中国宣布撤出在华两大研发中心，引发了IT行业对于跨国公司在华研发战略的广泛讨论。这一决定不仅影响了众多I
selenium中键盘操作：Keys类 weixin_41812355 web自动化 selenium python
前言：本文详细介绍了如何使用Selenium库进行键盘操作，包括非组合键如回车、删除等，以及Ctrl+A、Ctrl+C等常见组合键的模拟。通过实例演示了在百度搜索中的应用，并展示了ActionChains类的使用方法。一、导入相关类selenium提供了比较完整的键盘操作，在使用的模拟键盘操作之前需要我们导入Keys类fromselenium.webdriver.common.keysimport
sublime使用 lospark
1.网址输入sublimetext.com在官网上点击download下载最新版本2.安装packagecontrol百度搜索packgecontrol，点击第一个进入网站后，点击右上角第一个，进入找安装脚本3.打开sublime，选择view菜单下showconslole(ctrl+`)复制网站上的脚本，安装packagecontrol4.安装成功后按住ctrl+shift+p，打开安装脚本界面
《都挺好》：直面真实，就挺好平凡女子liz
（图片来源：百度搜索）01《都挺好》大结局了。一开始看的时候是在某一个晚餐时间。电视开始便是因为苏母的离世，紧接着各种人物便各自出场了。曾经看过一句话，“你现在身上的气质，是你曾经走过的路”。一开始大家或许觉得人物性格有些怪，随着剧情的发展，拨开层层的迷雾，其实也就明白了是什么样的曾经成就了今天的苏家三兄妹。这部电视一上映便受到各方的关注，一个很大的原因便是：现实。中国的家庭里或多或少可以从这部剧
个人信息保护法实施后，互联网广告的未来在哪里？数字化营销攻略
随着互联网和移动手机的普及，传统纸媒越来越逐步困难，网络已经发展成为十分重要的媒介形式。其中互联网在线广告已经构成现代社会中各大商家和企业主必不可少的广告模式。互联网广告形式主要分为两种：用户主动寻找的搜索广告，比如百度搜索等；还有就是用户被动推送的广告，各大信息流app中插入的广告，比如头条，知乎，抖音等文章和页面中与内容融为一体的信息流广告。2020根据艾瑞咨询数据显示，网络广告市场中信息流广
代发收录帖子代发百度收录手机聊天员赚钱平台
在网络时代，许多人希望自己的网站或帖子能够被百度搜索引擎收录，以提高曝光率和访问量。为了实现这一目标，一些人考虑使用代发服务，将自己的帖子或内容提交给搜索引擎。本文将介绍代发收录帖子的概念和如何代发百度收录的方法。自助下单：xhs1.net全类目业务，有需求请联系微：jiu991144，jiu994455【tg：a28110454jiuke1】Q：74146394928110454代发收录帖子的概
随便说说电影和人生杨柳依依_b375
放假在家得去看部电影啊！于是找来找去，实在没有其它感兴趣的，便选择了晚上七点二十五的《复仇者联盟4》。说实话，这类题材的电影我一直不感兴趣，前面三部都没有看过。为了能看懂第四部，白天在腾讯上找到了三部连看的视频，准备恶补一下。第一部看了二十分钟，完全不知道在说什么，硬着头皮看到四十分钟时美国队长从天而降，我这才看明白了一些：哦，原来是英雄的故事啊！可惜，我实在耐不住性子往下看，直接去百度搜索了一下
PC版微信多开工具解决方案 noah__zhao 微信
朋友办公用的电脑需要多开微信,但百度搜索一番,这类工具大多开始收费或者自带各种捆绑,求助于我,闲暇之余做了一个简单的工具,给他使用,在这里分享一下。本文默认读者有Python基础知识，能自行阅读理解代码含义。并提供打包后的EXE文件下载。原创首发CSDN文章，转载请注明来源。实现原理：win平台下多次执行start""微信地址"命令来一次性开启多个微信客户端代码运行环境：python3.8以下（为
0307 - 爬虫与反爬虫 ITJason
首先，爬虫是灰色的；其合理利用，取决于爬虫方的心态和能力，也取决于反爬虫的技术。爬虫用的好，可以成就Google、百度这样的公司；用得不好，可能对别人的利益，造成严重的伤害。不管怎样，爬虫极其广泛地存在。最近我也接触了一点，简单说说。先说反爬虫方保护自己的财产，怎么做都不为过（可能吧）。说一个例子，你在百度搜索页面所做的任何操作，包括鼠标移动、页面滚动、点击、甚至什么都不做的等待时间，所有这些信息
大年初一的习俗（二）蓝调烟霞
大年初一晚上要早早地关门睡觉，不要影响猫嫁女，是我们当地的传统习俗之一。后来听到的故事都是说“老鼠嫁女儿”，只有我们这儿说的是“猫嫁女”。曾经有很长一段时间，我也以为是母亲弄错了。直到后来百度搜索到下面这段话：清康熙间著名文学家蒲松龄的《聊斋诗集》中,有一首题作《人日》的七言绝句写道:灵辰剪彩古来兴,闺阁讹言笑益增。此日相传猫嫁女,儿啼呜拍不张灯。这首诗给我们提供了清初山东淄川一带“人日”节俗的具
9月份最新的百度收录软件有哪些？泛码网SEO工具有什么？ aspoping 百度
百度排名优化软件与方法：提升网站排名的策略最新接口多口子-多线程百度强引蜘蛛池工具荣耀版在互联网高速发展的今天，网站排名对于吸引流量和提升品牌知名度至关重要。百度作为中国最大的搜索引擎，其排名机制直接影响着网站的在线可见度。本文将深入探讨如何利用百度排名优化软件和一系列方法，有效提升网站在百度搜索结果中的排名。百度排名优化的重要性在数以亿计的网站中，能够在搜索引擎中获得较高排名，意味着更多的曝光机
两个空闲时间轻松赚钱的方法（纯干货）荒丘_
1.直接在百度搜索：有道众包图片发自App图片发自App有道众包里每个任务所需的时间大约是10-20分钟左右，每单任务的价格大约是1.5-15元，基本上每天抽出两三个小时的时间来做任务，一天七八十，一个月两三千块的收入还是没问题的。图片发自App2.百度知道合伙人百度知道是大家最熟悉的问答模式了,之后当然也出现了像360问答、悟空问答、知乎等等各个问答平台，当然大家最熟悉的还属百度知道了，而且百度
为荣誉而战念薇薇
晚上准时打开电视，准备观看中国女排和意大利的比赛。等到了九点多都没有开始，百度搜索，显示：中国女排和意大利队20:45开始，延期。想着今天不会比赛了，我关了电视。我瞌睡了，准备睡觉了，可还想最后再看看有什么消息。又打开百度搜索，延期竟然变成了1:0，瞬间我睡意全无，赶紧打开电视，中国女排和意大利队的比赛第二局刚开始。中国女排打出了气势和激情，情绪高涨，队员配合默契，第二局获胜。比赛进入第三局，两个
为什么企业需要发布新闻稿？ M事小屁菇
这是坚持写作的第六周，坚持一件事，痛苦且优秀。前段时间，公司对外宣布发布融资新闻，很幸运的将公司品牌和公司品牌+融资两个关键词做到百度热搜快照位，百度搜索结果也增加30多W，觉得非常有成就感。当然这些离不开公司自身重磅新闻、媒体准备、媒体平台选择以及传播协作等。这应该是市场生涯中第二次做到这个效果，毕竟在企业新闻当中，还是很少见到这种百度热点快照位，大家平时看到更多的可能是娱乐新闻和重大新闻才能形
百家号视频代发布百家号软文代发布趣闲赚手机做任务赚佣金
随着互联网的不断发展，自媒体平台已经成为了广告主和创作者推广内容和宣传品牌的重要工具。在中国，百度百家号作为自媒体平台的佼佼者，吸引了众多创作者和广告主。在本文中，我们将探讨百家号视频代发布和百家号软文代发布的概念，以及如何借助这些服务来提高在百度搜索引擎上的可见性和影响力。自助下单：xhs1.net小红书全类目业务，有需求请联系微：jiu991144，jiu994455【tg：a28110454
淘客联盟平台是真的吗?能提出来钱吗高省爱氧惠
大家在百度搜索一下“氧惠”就知道，它是一个大量淘客聚集的网站购物导购平台，它上面的商品大多是在淘宝和天猫上面抓取的。只不过氧惠平台上面拥有店铺里面看不到的内部优惠券。大家通过这个平台可以以超低的优惠价格买到心仪的商品，同时作为淘客又赚取到了属于自己的那份佣金。购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2022全新模式，我的直推也会放到
网爆又一共享单车巨头即将凉凉，你的押金退了吗极客在简书
10月31日下午，一则“ofo开始准备破产重组方案”的消息再度把小黄车推上风口浪尖。继摩拜单车后，又一共享单车巨头凉凉。图片来源于网络根据报道，已有一家大型券商中介机构入场做ofo破产重组的方案，一份半年前ofo的负债表显示，彼时ofo整体负债为64.96亿元，其中，用户押金为36.50亿元，供应链为10.20亿元。（百度搜索：极客小程序，免费注册自己的小程序平台，200多项功能模块一键导入，简单
公司里的年轻人——逗逼日常木木爱电影
01那天中午去食堂吃饭。大家都在排队，研发部的几个美女边排边聊天。“明天我一定买一包新菊花茶送给小胡，臊臊他。”一美女说。“咋了？”“胡继发么，前几天把一包菊花茶放到我桌子上，说送给我喝。结果这几天每天都过来捏几朵捏几朵，今天干脆又拿回去了！”我们几个听的人哈哈大笑。“要我说，你别买菊花茶了，买几支鲜菊花送他得了！”这妹子够狠，刚过完清明节，还记着这茬呢。旁边的年轻人小声嘀咕“你们收集菊花的这个癖
【IEEE】IEEE审稿意见与回复-写作指南五阿哥爱跳舞科研路上欢乐多 IEEE大修审稿意见
IEEE审稿意见与回复审稿意见-写作指南0IEEE审稿流程与状态解读1意见-怎么写（编辑与审稿人）1.常用的审稿意见角度语言方面内容和篇幅方面实验方面结论方面2Reject(unabletoaccept)审稿拒稿意见完整案例2意见回复-指南（作者）2.1指南获取方法1以Wiley为例的回复指南2.2指南获取方法23意见回复-模板获取（作者）百度搜索的一些模板google搜索获取模板推荐模板4意见回
CAJ转换成Word该怎么操作三生石123三生石
日常工作中对CAJ文件解除相对较少，网上下载文件的时候就会有CAJ文件，但是为了方便安全，一般就会将其转换成我们熟悉的Word文档来使用，那么CAJ转换成Word该怎么操作呢？下面就这个介绍一下转换的方法。转换步骤如下：1、首先百度搜索软件关键词迅捷CAJ转换器，找到该软件下载并安装至电脑上。2、打开运行该软件，点击页面左侧的CAJ转Word功能。3、选择点击选择文件字样在弹出的窗口添加需要转换成
超实用、有效、落地引流方法大全（末）倪青语
5、寻找有吸引力的标题：首先要写一个或几个非常有吸引力的标题，标题在一个成功的帖子中要占80%的地位。发帖子时，首先把90%以上的时间用来写标题，10%的时间写内容。标题要利用人性的2大弱点：好奇心和贪婪心。让每一个看上去都无法抗拒，立刻有想点的冲动。百度新闻系引流这个的话，是百度流量拦截的一种，让别人百度搜索关键字就出现你的，也有很多小白的上家在弄。不过估计呢，他们舍不得教给你们，很多上家估计就
是自由的，我想 velynneji
通常上班的流程是，泡茶、开电脑、查看今日事项、和周围打招呼。今天，我到办公室，打开电脑，直接百度搜索：”对外汉语教师“这是我一年多前还是自由职业者时，想要尝试的领域。当时在upwork.com接单子，做各种杂活，收入不高。虽然upwork有比较良性和可持续性的竞争机制，但那毕竟是个平台。为了找到第一个活，我花了一个月的时间研究机制、投简历、选领域。我找到的第一份工作也是我做得最久的一份工作，长达半
百家号代发贴百家号代发推广手机聊天员赚钱平台
当谈到百家号代发贴和百家号代发推广时，我们涉及到一种重要的网络推广策略，这有助于提高您的内容在百度搜索引擎上的曝光度。在本文中，我们将深入探讨百家号代发的概念以及如何有效地进行百家号代发推广，以增加搜索引擎的收录。自助下单：xhs1.net全类目业务，有需求请联系微：jiu991144，jiu994455【tg：a28110454jiuke1】Q：74146394928110454百家号代发贴是什
农村稀缺小生意，推荐几款不起眼的暴力小生意！日常购物技巧呀
大家好，我们又见面了，我是高省app运营遇见晴空，百度搜索高省遇见晴空获取等多相关资讯，今天聊一聊可以在农村做的小项目，有投资小的，有零投资的，大家根据自身需求来做自己适合的工作！大家好，我是高省APP最大团队导师遇见晴空，高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。遇见晴空导师高省邀请码171717，注册送
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

百度搜索研发部

一、基础运行环境

1.简介

一：前言简介

1 背景

1. HTML5的发展现状及趋势

1.1 HTML5简介

1、概述

你可能感兴趣的:(百度搜索研发部)