aa8102980

第七章人工智能，7.4 数据赋能商家背后的黑科技(作者：空望)

7.4 数据赋能商家背后的黑科技

1.背景

马老师曾提到三次技术革命：“第一次技术革命是体能的释放，是让人的力量更大，第二次技术革命是对能源的利用，使得人可以走得更遥远，而这一次技术革命是IT时代走向DT时代，是真正的大脑的释放。我们其实正在进入一个新的能源的时代，这个时代核心资源已经不是石油，而是数据。”。逍遥子也曾经讲过：“我们用大数据赋能了双11，赋能了我们自己的运营能力。我们还要更上一层楼，利用大数据赋能所有的商家，帮助他们运营好消费者，这样才能让我们在大数据时代践行‘让天下没有难做的生意’的使命。”

新商家事业部自去年12月成立以来，数据赋能商家就是重要的方向之一。我们将之前平台沉淀的数据和算法的能力转过来赋能我们为商家提供的工具和平台，这其中包括客户运营平台、千牛、服务市场等等。很多技术在今年的双11也起到了非常显著的作用，为商家带来实实在在的收益。下面从客户运营平台、千牛头条、服务市场三个产品给大家分享一下我们如何通过ML&AI技术重新定义产品。

2.客户运营平台

客户运营平台旨在为商家提供基于大数据和人工智能的客户精细化运营能力。阿里巴巴2015年提出客户运营战略方向，带领平台的商家从“流量经营”向“客户运营”转型。客户运营的核心理念有两个方面：其一是精细化，其二是从过于关注短期经营的成交目标向关注客户粘性、客户体验、客户忠诚度的目标转变。客户运营平台提供了“访客运营”和“会员粉丝运营”两大利器，借助大数据和人工智能技术，帮助商家提升客户运营的效率。2016年双11，超过23万商家通过客户运营平台实现了店铺的个性化运营和粉丝会员的精准营销，显著提升了成交转化。。下面以访客运营为例，介绍AI分群引擎的应用。

访客运营通过对访客的细分和精准营销策略来提升转化的效果。如下图所示，是某美妆店铺的访客分群个性化店铺首页策略示例，左侧和右侧分别是针对水乳类和面膜类偏好人群的个性化首页，通过面向细分的人群投放有针对性的内容，可以显著提升客户体验和访客成交转化率。类似的分群运营策略还可以应用在详情、微淘等场景。

图：访客运营示例：个性化店铺首页

有别于普通的营销平台，阿里巴巴客户运营平台通过AI能力，实现了对访客的实时分群，也就是说当客户进入店铺的一瞬间，客户运营平台的AI引擎会对用户所属的人群进行实时预测，得到此时此刻的最佳分群结果。下图是AI分群引擎架构图：

AI实时分群的三大特点如下：

行业级别的模型同一个特征在不同的行业会有不同的重要性，例如地域属性，对于美妆行业用户是否偏好保湿产品具有较强的预测能力，因为北方干燥，南方潮湿，而对于快消行业，比如用户是否会喜欢吃某种口味的零食，地域属性预测能力就会比较弱。因此同一个特征在不同的行业会有不同的权重。
长期、近期和实时相结合的特征体系例如用户对男装、女装、童装三类服饰商品的偏好，既受用户的人口统计学特征，比如性别、年龄段的影响，又受随机实时情境的影响，比如女性客户可能会为男友或家人购买男装，因此当我们按照偏好对客户分群时，既需要考虑长期稳定的属性和行为，又需要结合实时的行为和需求。
店铺分群自适应以美妆行业为例，从用户在平台层面上的行为来看，大部分用户可能会偏好美白、保湿功效的产品，而具体到某个品牌，其主营的产品品类和平台总体的品类成交分布很可能有较大偏差，比如一些品牌可能是主打彩妆，另外的一些品牌则主打紧致类的产品。当我们用平台整体数据建立的模型对用户在某个店铺的分群归属进行预测的时候，很可能会出现偏差。为了使得AI引擎能够适应店铺多样化的情况，我们从两个角度进行了升级，其一是引入店铺内销量分布作为分群结果的先验，其二是引入了增强学习技术（多臂老.虎.机.MAB）为每个商家自动调整模型参数。

对比于静态的人口统计学分群方法，AI分群具有实时性高、精准性好、店铺自适应等特点，商家实际使用的效果提升也更加显著。

阿里巴巴作为一个新零售平台，平台上的商家具有很高的多样性。客户运营平台基于增强学习技术的自适应技术，能够使得AI分群自动适应每个店铺的策略特点。通过该方法的应用，在一级类目偏好分群的场景下，成交转化率提升超过10%，同时个性化的渗透率大幅提升40%。

3. 双11大促店铺承接页个性化技术

今年双11阿里巴巴首次实现了全面的全站个性化，包括从会场到大促承接页到店铺再到详情，而大促店铺承接页是连接会场与店铺的桥梁，大促承接页的整体活动氛围和布局由平台确定，商家可以通过页面装修工具来装修商品模块、营销模块等内容。2016年双11大促承接页首次实现了全面的个性化，实现了显著的成交转化提升。

大促承接页个性化属于单个店铺内的个性化，相比于平台级的个性化场景（例如手机淘宝猜你喜欢、有好货等），具有一些特有的挑战。平台级的个性化我们可以想象为把平台的大量商品作为候选商品，形成一个虚拟店铺，用户在平台上的行为都是这个虚拟店铺内的行为；店铺内的个性化，候选商品为单个店铺的商品，用户在单个店铺内的行为是非常稀疏的，必须要考虑借助用户在平台整体的行为来做好店铺内的个性化。面向店铺内个性化的特点，我们的AI个性化引擎框架主要包括matching框架和ranking框架两个部分。

matching框架解决的是用户偏好意图的覆盖，即基于单店的小数量级商品尽可能全面地匹配用户的偏好和意图，matching框架还有一个重要的作用是为ranking提供输入特征；ranking框架解决的是个性化商品列表的最优排序问题，它基于历史反馈数据、用户特征、商品特征、用户与商品的交叉特征等训练面向特定业务目标的模型。

在matching阶段，我们可插拔的框架支持多种matching方法：

基于图挖掘的matching方法包括adsorption、adar、jacacard、simrank、simrank++以及基于大规模流式计算的增量ItemCF方法；
基于索引的方法包括minhash、simhash等hashing-based的方法，利用局部一跳信息建立商品索引；
基于Graph Embedding的方法 Graph Embeding也是一种商品索引，与hashing-based方法的不同之处在于它可以利用图的全局信息、多跳信息来建模，具有更高的覆盖度；
基于语义匹配的方法例如基于用户偏好的商品属性与商品本身的属性进行匹配；
基于流式计算的方法基于流式计算引擎，实时更新商品之间的关联关系，更好地捕捉线上流量的变化
面向场景的适配基于排序学习技术，可以将上述方法的输出进行面向场景的重新排序和打分，使得matching层面向特定场景调优

我们创新地提出了面向电商场景的大规模分布式Graph Embeding的算法。商品Embedding算法可以将一个现实生活中的商品实体表示成低维空间里的一个向量，使得我们可以仅通过这些向量之间的空间位置关系就能得到商品之间的某些联系。由于我们可以将学习出来的Embedding向量作为更上层机器学习任务的输入，这就使得Embedding这样的表示学习非常有潜力。在双11中，我们设计实现了一种能够保持非对称关系的Graph Embedding算法，来对商品进行Embedding。由于用户对大部分商品（长尾）的点击行为非常稀疏，我们选择将用户的点击序列拼接成商品点击转换图的形式，来试图缓解稀疏性问题以提高商品Embedding的质量。另一方面，为了表示商品之间的非对称关系（例如购买手机后可能会对手机壳感兴趣，但反之不成立），我们用两个Embedding向量来表示一个商品的不同角色（已被看过和待预测）。我们在构建好的商品图中，对每个商品节点按照带重启动的随机游走进行路径采样，并且仅按照采样的正方向分别对两个Embedding向量进行更新。我们基于分布式平台ODPS Graph首次实现了亿级别节点、百亿级边的大规模图数据的Embedding，并且在理论上，我们还证明了基于这种采样方式的Graph Embedding算法能够保持原图节点之间的Rooted PageRank的相似度关系，相关工作已被人工智能顶级国际会议AAAI 2017接收。

在ranking阶段，我们通过亿级特征的大规模稀疏模型，包括LR、FTRL、DNN（深度学习），十亿级样本的训练，实现精准的个性化排序。特征的体系包括用户、商品、matching特征、场景相关的反馈类特征、以及场景化（context）特征，在特征实时性方面我们会结合长期特征、短期特征和实时特征，在追踪线上变化的同时能够保持较高的覆盖度和稳定性；在样本层面，通过日志去噪、样本采样策略、样本构造策略（页面级样本和模块级样本），优化样本构造；在模型层面，通过天级、小时级和实时模型，结合面向不同目标的模型来综合优化业务目标，比如我们会利用多个模型对点击、加购、成交等目标进行建模，并实时结合多个模型来优化最终的业务目标。我们的分布式GBDT排序学习算法能够支持不同类型的排序函数，包括pairwise ranking和listwise ranking，能够从样本和特征两个维度对数据进行拆分并进行并行化训练，可以支持百亿级样本。深度学习模型训练基于阿里巴巴集团多机多卡的分布式GPU训练平台，可支持大规模亿级稀疏特征、亿级样本的神度学习模型快速训练。我们对深度学习实时预测的性能进行了深入优化，预测性能是普通实现的10倍以上。

通过算法细节的不断调优，双11承接页个性化效果显著，相比于非个性化页面，个性化页面的成交转化有超过20%的提升，带来了十亿级别的成交提升。

4. 千牛头条技术介绍

4.1 产品概述

千牛头条是一个定位于通过内容传播与运营，满足商家内容消费需求的商业媒体平台。为了满足商家获取实时、个性化资讯的需求，同时提高千牛平台的流量效率，为千牛头条上线了一套个性化的资讯推荐系统。

图：千牛头条双11和热门频道

目前个性化算法支持了热门feeds流、双11频道，后续会支持更多的频道和场景。

4.2千年头条推荐整体框架

图：千牛头条推荐系统总体框架

千牛头条资讯推荐系统的总体框架如图3所示，整个框架可分为离线、近实时、实时三部分。

离线部分主要负责用户Profile构建以及关联数据挖掘；近实时部分主要包括新发布资讯的实时分析引擎，模型流式更新引擎；实时部分基于通用的推荐pipeline，并结合离线、近实时模块的产出结果，完成整套的推荐逻辑。

4.3 技术创新点

基于期望偏好的用户profile

为了全方位地刻画用户兴趣，从关键词、类目、行业等维度对用户兴趣进行建模。在计算用户profile过程时引入期望偏好，期望偏好是根据行为分布计算的用户预期行为分布，通过用户的期望偏好分布和实际偏好比较得到偏好分，最后用伽马泊松分布对偏好分进行平滑。

资讯实时分析引擎

对新发布的资讯进行实时文本分析，包括分词、关键词抽取，通过行业profile和Multi-task语义向量生成行业标签，并对资讯建立倒排索引，实现实时更新。技术上集成使用TextRank，Mutual Information, Log Odds Ratio三种关键词抽取算法实现精准抽取；Multi-task语义向量模型与传统的Word2Vector词向量模型不同，使用词的meta data数据，使得模型在给定上下文的情况下，同时学习词的分布和词meta信息分布。

Online Bayesian Logistic Regression模型

千牛头条用户在百万量级，每天的新资讯相对较少，每篇资讯能够累计较多的用户行为，为此采用了PerArticle的模型方法，即针对每篇资讯单独训练一个Online Bayesian Logistic Regression(BLR)模型，精细化地刻画每篇资讯。相比传统的LR模型，BLR模型认为模型参数本身是有先验分布的，具有更优的泛化能力，上线后ctr也有20%的提升。

其中σ(w^T x)就是LR模型的预测函数，q(w|D)就是Bayesian模型学习的参数分布。
在线Bayesian学习算法如下：
a）m_i=0,q_i=λ, 每一个参数有有一个独立的高斯先验N(m_i,q_i^(-1))
b）得到一批数据(x_j,y_j ),j=1,…,n
c）优化目标函数
d）Laplace approximation求解目标函数，得到模型的均值，方差

高阶泛化统计类特征

模型使用的特征包含用户特征、资讯特征、用户与资讯的交叉特征等，其中用户与资讯的交叉特征是关键特征。传统的做法直接对用户特征和资讯特征进行交叉，这种方法很容易导致特征爆炸，交叉后大量冗余的特征容易导致模型过拟合；为了解决上述问题，采用了一种根据业务经验进行特征交叉，然后对交叉特征计算统计量的方法，该方法可以很好地解决特征组合爆炸问题，同时生成的统计类特征有较好的泛化性。

资讯冷启动

时效性在资讯推荐中至关重要，而新资讯由于缺乏线上反馈导致CF等基于行为的推荐算法失效。
从文章维度来看新文章没有用户行为，但是从新文章包含的关键词、主题等维度看，历史上有很多文章也都包含这些特征，因此可以根据新文章包含关键词、主题的历史表现推断新文章的表现。

4.4 业务成果

千牛头条经历了两次大的算法升级，核心指标如点击率有了显著的提升，第一次升级增加了基于用户行为的个性化；第二次升级引入文本算法以及在线排序模型。

5. 数据赋能服务市场

5.1背景介绍

服务市场是面向淘系商家提供多样化服务的交易平台，目前覆盖淘系活跃卖家90%以上。其特点是：用户访问频次低、访问路径短、行为少，订购呈现周期性。原来的服务市场千人一面，不能很好匹配商家实际需求，导购效率较低。

为解决以上问题，我们设计了服务市场个性化框架（如下图），在个性化搜索和推荐场景中取得了显著的效果。其中搜索点击率提升10%，空结果率降低400%；千次展示成交数提升20%；推荐点击提升90%，千次展示成交数提升200%，转化率比服务市场整体高70%。

图：个性化导购框架

框架分为在线计算和离线计算，在线计算负责实时的商家行为分析，商品召回，个性化排序；离线部分负责商家/服务特征更新，订购模型训练以及候选商品池计算。

图：多样化的个性化推荐算法场景

5.2 关键技术点

实时偏好识别

服务市场的用户访问频次低，识别用户的实时偏好有助于更准确的匹配用户需求。实时偏好包括实时商品偏好和实时类目偏好两个维度，使用时间衰减累计+用户实时访问反馈调整的方式来构建用户实时偏好模型。在实际使用时，根据历史累计的数据选取TopN产生实时偏好。

匹配召回

服务市场搜索召回面临问题：搜索无结果、搜索结果相关性不高以及搜索结果不够优质。针对上述问题，使用核心词抽取和query扩展对原query进行语义分析和补充。包括：基于语义embedding对搜索词进行自适应分词和向量化表示；为保证核心词与原query语义相似，综合语义单元的类目分布熵、与原query的邻接熵，与原query类目匹配度进行核心词抽取；为了扩大query召回，根据用户搜索补充了与原query相关的其他搜索核心词。补充后的搜索词大幅降低了搜索无结果率，搜素点击率和转化率也得到明显提升。个性化推荐召回以实时商品偏好，实时类目偏好，近期搜索，历史订购商品为基础，配合相似商品，搭配商品，类目优质商品进行扩大召回，从而构建个性化推荐的优质多样的商品池。

模型排序

个性化推荐的模型排序部分负责对召回的商品池结合当前商家店铺和商家行为特征进行个性化排序针。对特定的排序模型组装合适的模型特征（包括单一特征，组合交叉特征，以及ID类特征等），然后根据CTR/CVR模型生成预测分数；同时结合商家订购服务的特点，以及推荐多样性等策略的考虑，对分数进行重排。

转载于:https://www.cnblogs.com/hujiapeng/p/6236846.html

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

第七章 人工智能，7.4 数据赋能商家背后的黑科技(作者：空望)