Ben_Fu

搜广推之特征工程：基本原理和前沿研究（2023）

前言

本文主要结合以往工作经验和前沿论文（截止2023年9月），来分析工业界和学术界中特征工程相关研究点，以及对未来发展的思考。详细报告内容请参考PPT文档：

GitHub - BinFuPKU/CTRRecommenderModels: I have surveyed the technology and papers of CTR & Recommender System, and implemented 25 common-used models with Pytorch for reusage. （对工业界学术界的CTR推荐调研并实现25个算法模型，2023）I have surveyed the technology and papers of CTR & Recommender System, and implemented 25 common-used models with Pytorch for reusage. （对工业界学术界的CTR推荐调研并实现25个算法模型，2023） - GitHub - BinFuPKU/CTRRecommenderModels: I have surveyed the technology and papers of CTR & Recommender System, and implemented 25 common-used models with Pytorch for reusage. （对工业界学术界的CTR推荐调研并实现25个算法模型，2023）https://github.com/BinFuPKU/CTRRecommenderModels

特征工程的意义和发展阶段：

数据和特征决定了效果的上限，算法和模型只是逼近这个上限的手段。
根据场景业务特点设计合理的特征和模型。
目前AutoFE处于初级探索阶段，不够有效，依然考验经验直觉和业务知识。

特征构建

现有搜广推的特征主要分为用户侧特征、物品侧特征和上下文特征：

用户侧:(用户画像)
- 基本属性: id、人口属性(如性别、年龄、学历、职业、位置等)和注册信息(手机品牌、注册时间等)、兴趣爱好、购买力、婚育、薪资、颜值。
- 社交特征: 好友、点赞、关注等。强关系和弱关系。U2U兴趣人群、同小区等。
- 行为特征: 各种行为历史，如曝光、点击、播放、点赞、反对等。显式反馈和隐式反馈。
  - 不同粒度时间窗口: 最近、过去1小时、过去1天、过去1周、过去1月、至今，考虑时间衰减。热度时效性等。
  - 正向/负向: 转发/点赞/踩/跳过等。
  - 统计: 次数/时长/金额/比率/单位价格/活跃情况。
  - 序列特征。
物品侧:(物品画像)
- 基本属性: 品牌、id、类目、标题、价格、产地、适用人群、评分、销量、商家信息、商圈等。
- 内容特征: 基于内容理解技术打上多级分类标签或关键词topic等。知识图谱等。
  - 文本:评论、签名等。通过Ngram/TFIDF/LDA/word2vec/fasttext等挖掘。
  - 图像:通过CNN将图片解析成向量。
- 反馈信息:
  - 点击量、点击率、购买量、CTR、CVR等;月比趋势等.
上下文特征:
- 地理位置(经纬度、城市、距离、IP等)、天气、社会事件、手机品牌、操作系统。
- 时间:季节、工作日、休息日、发薪日、早中晚等。
- 推荐场景特征: APP、浏览器主Feed推荐、相似推荐、当前刷次、翻页动作等;场景平均点击率转化率。搜索词query。
- 网络类型:wifi、4G、5G等。

特征预处理

特征缺失处理：
- 固定值填充: 均值/中位数/众数等。
- 模型预测值填充:xgboost可处理缺失值。
统计量特征数据平滑:
- 贝叶斯平滑:实验多次，随机事件接近其真实概率分布。如利用beta分布(,)建模点击率先验。 $Rate = \frac{C+\alpha }{I+\alpha +\beta }$
- 威尔逊平滑:样本多可信，样本少不可信需要修正。
- 消偏:冷热门类目、长短视频等。相当于提权降权作用。

类别特征处理

单值特征
多值特征：平均池化、最大池化、最小池化、加权池化(注意力融合，类似FiBiNET)。

稠密特征处理

不做离散化：
- Wide&Deep中作为Wide部分处理。
- 需要归一化/标准化/非线性变换（log/sqrt/square）/缩放等。
- 缺点：表达能力弱，无法实现与离散特征之间的交叉，数值敏感缺乏鲁棒性。

两阶段：离散化后嵌入表征学习
- 硬离散化（hard）：
  - 无监督分桶：等距、等频和log离散化floor(log⁡())。
  - 有监督分桶：树模型，如xgboost。
- 优点是方便后续进行特征交叉。
- 缺点：
  - 两阶段误差扩大；
  - 划分点附近相似特征被划分开；
  - 同一桶内左右边界点差异大。

端到端的离散化表征学习
- Key-Value Memory方法[1]：利用记忆网络实现一维到二维转换。

$v=\sum_{i=0}^{N-1}{w_i v_i}$

$w_i = softmax(\frac{1}{|q-k_i + \epsilon |})$

$k_i = \frac{2i+1}{2N}$

AutoDis[2]: 注意力 $\hat{x}_j$ +元嵌入 $ME_j \in \mathbb{R}^{H_j \times d}$

$\hat{x}_j = W_j h_j + \alpha h_j$

$e_j = softmax(\hat{x}_j) \cdot ME_j$

超参数：任意特征的分桶数和维度。

DEER[3]：中值平滑代替注意力，假设 $s_i - s_{i-1} \propto exp(w_i)$

$s_i = s_0 + \sum_{k=0}^{I}{\frac{exp(w_k)}{\sum_{l=1}^{n}{exp(w_l))}}(s_n - s_{0})}$

$f(x) = \frac{s_i - s_{k-1}}{s_k - s_{k-1}} \vec{e}_{s_{k-1}} + \frac{s_k - s_i}{s_k - s_{k-1}} \vec{e}_{s_{k}}$

NaryDis: 自监督对比学习正则项。相近的相似（连续性），远离的不相似（判别性）。
- 超参数：正则项系数∈[0.5,0.9]和编码空间大小∈[1,4]。

特征交叉

为什么需要特征交叉？
- 特征之间存在关联模式，DNN通过隐式方式难以学习到。如年龄、性别和兴趣偏好。
设计角度：
- 二阶和高阶。
- 显式和隐式：手工经验设计或自动交叉。

$\text{Explicit feature interaction:} f_{ij} = \vec{e}_i \otimes \vec{e}_j$

$\text{Implicit feature interaction:} f_{ij} = NN([\vec{e}_i; \vec{e}_j])$

- 线性和非线性。
- Bit-wise和field-wise。
交叉类型：
- 内积（Inner Product）：如 FM、FFM、AFM、DeepFM等。

- 外积（Outer Product ）：如PNN等。
- 哈马达乘积（Hadamard Product）

- 双线性交叉（Bilinear Interaction）

- 注意力机制: AutoInt。
自动特征交叉[5~8]：
- 组合优化问题：采用一些手段（NAS、强化学习、进化算法[8]等）来寻找最优组合。
- AutoFeature[5]：利用神经架构搜索（NAS）技术搜索合适的特征交叉。
  - 特征交叉视为一个子神经网络，利用朴素贝叶斯来学习这些网络有效或无效。
    平衡探索和利用。

高阶交叉
- 典型案例：DCN、xDeepFM等。
- AdnFM深度多层（≤3）交互[9]：
  - 加权池化输入特征。
  - 利用残差连接和注意力获取每层的交互特征，类似DenseNet。

交叉形式
- CAN（Co-Action Network）交叉[10]：
  - Target Item和用户行为序列进行多层次交叉。
  - 效果很好。

EDCN层次交叉[11]：多层反复交叉。

FINAL利用深层网络实现高阶交叉[12]。

特征选择

意义：
- 最大化相关、最小化冗余。
- 降低复杂性，避免过拟合，简化模型，提高泛化能力。
- 节省存储和计算时延。
方法：
- 过滤方法：
  - 无监督：方差、覆盖率
  - 有监督：互信息（类别类型之间）、皮尔逊相关系数（连续类型之间）、单特征AUC等
- 正则法：L2、L1和L0等。
- 封装法：有监督模型。
- 深度模型方法：
  - AdaFS [13]: 特征权重（注意力）的top-k个（超参数）。结果显示选择50%的特征其效果有竞争力。

- - LPFS平滑门控函数[14]: 训练过程中不断衰减，使其自适应学习，激活概率分布更加集中。

$g_{\epsilon}(x) = \frac{x^2}{x^2 + \epsilon} = \begin{cases} & =0 \text{ if } x= 0 \\ & \approx 1 \text{ if } x \neq 0 \end{cases}, \epsilon \text{ is a small positive number}$

类似的工作[15]。

- - AutoFSS [16]: 采用神经架构搜索（one-shot NAS）技术（强化学习）搜索合适的特征子集。

- - Catch [17]: 采用强化学习来搜索合适的特征子集。

特征服务架构

离线：
- 全量生成离线特征并存储，并用于模型训练。
  如采用Hive构建简单特征、Spark构建复杂逻辑的特征。
  模型训练框架采用Tensorflow/Pytorch等。
实时：
- 根据请求（时间窗口）实时生成特征。
- Redis线上存储KV特征。
- 使用消息队列收集数据，如kafka/Flink。
离线在线特征一致性：
- 避免数据穿越。
- 尽量使用同一套处理逻辑。
- 在线埋点存特征到日志处理后喂给离线模型。

公开数据集

淘宝用户购物行为数据集:
- https://tianchi.aliyun.com/dataset/649
- 用户ID；商品ID；商品类目ID；行为类型包括('pv', 'buy', 'cart', 'fav‘)；时间戳
Avazu：https://www.kaggle.com/competitions/avazu-ctr-prediction/data
- id: ad identifier；click: 0/1 for non-click/click； hour: format is YYMMDDHH, so 14091123 means 23:00 on Sept. 11, 2014 UTC；C1 -- anonymized categorical variable；banner_pos；site_id；site_domain；site_category；app_id；app_domain；app_category；device_id；device_ip；device_model；device_type；device_conn_type；C14-C21 -- anonymized categorical variables
Criteo: http://labs.criteo.com/2014/02/kaggle-display-advertising-challenge-dataset/
其他数据集：
- https://www.baltrunas.info/context-aware

未来研究探索方向

新的特征交叉算子。
自动搜索合适的特征交叉，自动特征工程。
和其他问题结合，如多任务多场景。
与语言大模型（LLM）结合，提高特征表达能力。
模型可解释性（如ID嵌入特征）

[1] Multi-modal Representation Learning for Short Video Understanding and Recommendation. ICME Workshops 2019.

[2] An Embedding Learning Framework for Numerical Features in CTR Prediction, KDD 2021.

[3] Dynamic Explicit Embedding Representation for Numerical Features in Deep CTR Prediction, CIKM 2022.

[4] Numerical Feature Representation with Hybrid -ary Encoding, CIKM 2022.

[5] AutoFeature: Searching for Feature Interactions and Their Architectures for Click-through Rate Prediction, CIKM 2020.

[6] Towards Automated Neural Interaction Discovery for Click-Through Rate Prediction, KDD 2020.

[7] AutoGroup: Automatic Feature Grouping for Modelling Explicit High-Order Feature Interactions in CTR Prediction, SIGIR 2020.

[8] Cognitive Evolutionary Search to Select Feature Interactions for Click-Through Rate Prediction, KDD 2023.

[9] AdnFM: An Attentive DenseNet based Factorization Machine for Click-Through-Rate Prediction, ICCDE 2022.

[10] CAN:Feature Co-Action Network for Click-Through Rate Prediction, WSDM 2022.

[11] Enhancing Explicit and Implicit Feature Interactions via Information Sharing for Parallel Deep CTR Models , DLP-KDD 2021.

[12] FINAL: Factorized Interaction Layer for CTR Prediction, SIGIR 2023.

[13] AdaFS: Adaptive Feature Selection in Deep Recommender System, KDD 2022.

[14] LPFS:Learnable Polarizing Feature Selection for Click-Through Rate Prediction, 2022.

[15] Optimizing Feature Set for Click-Through Rate Prediction, WWW 2023.

[16] Automatic Feature Selection By One-Shot Neural Architecture Search In Recommendation Systems, WWW 2023.

[17] Catch: Collaborative Feature Set Search for Automated Feature Engineering, WWW 2023.

React的状态管理——Redux miraculous111 react.js javascript 前端
Redux与计数器配套工具使用ReactToolkit创建counterStore为React注入storeReact组件使用store中的数据React组件修改store中的数据绑定用户交互效果展示action传参Redux异步状态管理React中的Redux就像Vue中的Vuex和Pinia一样，都是状态管理工具，通过这种方式可以很方便的实现各个组件中的通信。下面的代码是通过Redux实现一个
python实现成语接龙 Camellia 泡泡笔记 python
first_idiom='万事如意'end_str=first_idiom[-1]new_li=[first_idiom]li=['发愤图强','笑容满面','意气风发','强颜欢笑']forindexinrange(len(li)):foriinli:ifend_str==i[0]:new_li.append(i)li.remove(i)end_str=i[-1]breakprint(new_l
探索TriCore架构：AURIX芯片的强大内核裴辰垚Simone
探索TriCore架构：AURIX芯片的强大内核g_tricore_architecture项目地址:https://gitcode.com/gh_mirrors/gt/g_tricore_architecture项目介绍TriCore架构是英飞凌（Infineon）公司开发的一种高性能、低功耗的嵌入式处理器架构，广泛应用于汽车电子、工业控制和消费电子等领域。AURIX系列芯片是基于TriCore
深入浅出：序列化与反序列化的全面解析进击的小白菜一些开发常识开发语言开发常识
文章目录1.引言2.什么是序列化？2.1为什么需要序列化？3.什么是反序列化？3.1反序列化的重要性4.序列化与反序列化的实现4.1JSON(JavaScriptObjectNotation)4.2XML(eXtensibleMarkupLanguage)4.3ProtocolBuffers(Protobuf)4.4MessagePack5.安全性考虑6.性能优化7.结论附录：常见问题解答Q1:什
ZTE MU5001 5G Mobile WiFi Router Review 小2不语 5G android
ZTEMU5001isanew5GmobileWiFiHotspotwithWiFi6whichiswidelyavailableformanynetworkprovidersinmanycountries.IfyouhadusedtheZTE4GMobileWiFiRoutersuchasZTEMF970orZTEMF980,youwillfindthenew5GpocketWiFirouter
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
Graylog日志系统超详细部署和配置 kim_liao123 部署 elasticsearch docker
Graylog日志系统部署和配置1.软件介绍：Graylog是一个开源的日志聚合、分析、审计、展现和预警工具。功能上和ELK类似，但又比ELK要简单，依靠着更加简洁，高效，部署使用简单；官方文档：https://docs.graylog.org/en/3.3/pages/users_and_roles.html以下所有部署方式都来源与官方文档2.软件准备：服务端：Mongo：存储graylog的一
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
Jarslink 是一个 SOFA 方舟插件，用于管理多应用部署后端java
前言大家好，我是老马。sofastack其实出来很久了，第一次应该是在2022年左右开始关注，但是一直没有深入研究。最近想学习一下SOFA对于生态的设计和思考。sofaboot系列SOFABoot-00-sofaboot概览SOFABoot-01-蚂蚁金服开源的sofaboot是什么黑科技？SOFABoot-02-模块化隔离方案SOFABoot-03-sofaboot介绍SOFABoot-04-快
pycharm中使用anaconda部署python环境_pycharm部署配置anaconda环境教程 weixin_39796652
本篇文章小编给大家分享一下pycharm部署配置anaconda环境教程，小编觉得挺不错的，现在分享给大家供大家参考，有需要的小伙伴们可以来看看。pycharm部署anaconda环境Pycharm：python编辑器，社区版本Anaconda：开源的python发行版本(专注于数据分析的python版本)，包含大量的科学包环境基本指令(准备工作)：conda--version查看anaconda
字符串作为数组和用指针指向的字符串的区别 kfhj c语言
字符串作为数组和用指针指向的字符串在C语言（以及类似语言如C++）中都有各自的用途和特点。以下是它们之间的主要区别：定义和声明•字符串作为数组：字符串数组是一个字符数组，其中最后一个字符是空字符（’\0’），用于标识字符串的结束。例如：charstr[]=“Hello,World!”;这里，str是一个字符数组，包含了字符串"Hello,World!"和它的结尾空字符。•用指针指向的字符串：字符串
Cesium实践（1）—— Hello World 迦南giser WebGIS #Cesium webgis cesium
文章目录前言Cesium是什么Cesium核心类ViewerSceneEntityDataSourceCollection创建第一个Cesium应用工程搭建Cesium版helloworld总结前言工作大半年来主要的技术栈是mapbox-gl和threejs，但是作为一名GIS专业毕业生，一直对Cesium充满兴趣。Cesium不仅保持了threejs的三维绘制能力，而且内置大量渲染地理数据的AP
c ++零基础可视化——数组 zhangpz_ 算法 c++
c++零基础可视化数组一些知识：关于给数组赋值，一个函数为memset，其在cplusplus.com中的描述如下：void*memset(void*ptr,intvalue,size_tnum);Setsthefirstnumbytesoftheblockofmemorypointedbyptrtothespecifiedvalue(interpretedasanunsignedchar).将p
P3375 【模板】KMP 好好学习^按时吃饭算法
题目来自洛谷网站：思路：从题目名字知道这是KMP模板题目，对于KMP算法，就两步，1、构造next数组。2、在s1中找到s2出现的位置。KMP代码：#includeusingnamespacestd;constintN=1e6+10;chars1[N],s2[N];//全局变量名字不能定义为next//C++标准库中有一个函数名字是nextintnext1[N];//ne数组intmain(){/
代码训练day7哈希表2 徵686 散列表数据结构
1.四数相加IIleetcode454哈希表判断是否存在classSolution{//四数相加ii统计个数publicintfourSumCount(int[]nums1,int[]nums2,int[]nums3,int[]nums4){HashMapmap=newHashMapmagazine.length())returnfalse;//java字符串长度s.length()for(cha
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
C++：函数指针进阶（三）：Lambda函数详解：概念详解 FishAnd_Yu #C++精华 c++C++Lamdba
1：Lambda函数语法C++语法的基本格式为：[capture](parameters)->return_type{/*...*/}（1）[capture]：[]内为外部变量的传递方式，值、引用等，如下[]//表示的是在lambda定义之前的域，对外部参数的调用；[=]//表示外部参数直接传值[&]//表示外部参数传引用，可修改值。当默认捕获符是&时，后继的简单捕获符必须不以&开始。而当默认捕获
npm install 报错 gyp info it worked if it ends with ok npm ERR gyp verb cli [ m0_61083409 前端 html npm 前端 node.js
今天新启动一个项目，在npminstall安装依赖项时出现报错。ERR!code1npmERR!pathC:UsersAdministratorDesktope31mall-admin-webode_modulesode-sassnpmERR!commandfailednpmERR!commandC:Windowssystem32cmd.exe/d/s/cnodescripts/build.jsn
npm错误 gyp错误 vs版本不对 msvs_version不兼容澎湖Java架构师前端 html npm node.js 前端
npm错误gyp错误vs版本不对msvs_version不兼容windowsSDK报错执行更新GYP语句第一种方案第二种方案执行更新GYP语句npminstall-gnode-gyp最新的GYP好像已经不支持Python2.7版本，npm会提示你更新都3.*.*版本安装Node.js的时候一定要勾选以下这个，会自动检测安装缺少的环境第一种方案管理员运行CMD（PowerShell也行）执行更新工具
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
android视频缓存框架 [AndroidVideoCache](https://github.com/danikula/AndroidVideoCache) 源码解析与评估 MrJarvisDong third party 源码
文章目录android视频缓存框架[AndroidVideoCache](https://github.com/danikula/AndroidVideoCache)源码解析与评估引言使用方式关键类解析HttpProxyCacheServer代理缓存服务类**java.net.ProxySelector**代理选择Pinger判断本地serverSocket是否存活GetRequest封装用于获取
【R语言2】Introduction to R 基础知识复习小测试 Pop quiz 不二程序猿 r语言开发语言数据挖掘
【R语言】基础知识点Popquiz前言Question1Question2Question3Question4Question5Question6Question7Question8Question9Question10是兄弟就砍一刀！答案前言在这里会有10道题，每一道都是对R语言的基础了解。有单选题和填空题，答案在最下面。填空题可以放到Rstudio里运行得出答案。Question1Whicho
【读点论文】Chain Replication for Supporting High Throughput and Availability 寻雾&启示分布式系统论文阅读
在分布式系统中，强一致性往往和高可用、高吞吐是矛盾的。比如传统的关系型数据库，其保证了强一致性，但往往牺牲了可用性和吞吐量。而像NoSQL数据库，虽然其吞吐量、和扩展性很高，但往往只支持最终一致性，无法保证强一致性。由此ChainReplicationforSupportingHighThroughputandAvailability提出了链式复制协议，旨在保证高吞吐、高可用的同时，支持数据的强一
Python UV - 安装、升级、卸载云客Coder python uv 开发语言
文章目录安装检查升级设置自动补全卸载UV命令官方文档详见：https://docs.astral.sh/uv/getting-started/installation/安装pipinstalluv检查安装后可运行下面命令，查看是否安装成功uv--version%uv--versionuv0.6.3(a0b9f22a22025-02-24)升级uvselfupdate将重新运行安装程序并可能修改您的
《Oracle DBA入门实战：十大高频问题详解与避坑指南》鸿·蒙数据库 Oracle数据库 DBA入门数据库管理 IT技术干货学习笔记
OracleDBA入门作业十问十答本文为OracleDBA入门作业整理，涵盖工具使用、配置管理及权限控制等核心知识点，适合新手快速上手。如有疑问或补充，欢迎评论区交流！1.DBA常用工具有哪些？OracleUniversalInstaller(OUI)用途：安装、升级或删除软件组件。OracleDatabaseConfigurationAssistant(DBCA)用途：通过图形界面创建、删除或修
SenseVoice 部署记录安静六角开源软件
最近试用了SenseVoice（阿里团队开源的语音转文字）效果可以，可以本地部署，有webui界面，测试了万字以上的转换效果可以。首先部署好conda环境和cuda，这个可以查看他人的文章。步骤1.创建虚拟环境：condacreate-nmainenvpython=3.102.然后安装依赖condaactivatemainenvpipinstall-rC:\Users\xx\Documents\P
langchain4j+Tika小试牛刀 llm
序本文主要研究一下langchain4j结合ApacheTika进行文档解析步骤pom.xmldev.langchain4jlangchain4j-document-parser-apache-tika1.0.0-beta1examplepublicclassTikaTest{publicstaticvoidmain(String[]args){Stringpath=System.getPrope
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
Python实现微信自动发送消息热心市民小汪 python 微信开发语言
实现需求：Python定时发送微信消息importpyautoguiaspgimportpyperclipaspcfromapscheduler.schedulers.blockingimportBlockingScheduler"""实现定时自动发送消息"""#操作间隔为1秒pg.PAUSE=1name='Hello~'msg='是时候点餐啦！！'defmain():#打开微信pg.hotkey
读取一个字符串，字符串可能含有空格，将字符串逆转,原字符串与逆转字符串进行比较@C语言热心市民小汪代码练习 C语言算法学习 c语言开发语言
读取一个字符串，字符串可能含有空格，将字符串逆转原来的字符串与逆转后字符串比较相同，输出0，原字符串小于逆转后字符串输出-1，大于逆转后字符串输出1。例如输入hello，逆转后的字符串为olleh，因为hello小于olleh，所以输出-1SampleInput1helloSampleOutput1-1#include#includeintmain(){charstr[20];charreStr[
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情