hulu beijing

技术博客|第12期:多模态多兴趣多场景技术在Disney流媒体推荐召回中的应用

2022年第012篇

随着网络基础设施的发展，YouTube、Facebook、TikTok、Netflix 等内容平台上每天都会为大量用户提供服务。作为内容平台的重要组成部分，端上流媒体平台（如 Netflix、Hulu、Disney+）通常通过订阅的方式为客户提供在线视频点播 (VOD) 以及直播内容 (Live)，以满足用户对于高质量视频内容的需求。为了帮助订阅用户找到感兴趣的内容，流媒体服务通常会构建页面级别的推荐系统，以展现个性化内容。推荐系统的好坏决定了用户满意度，并直接影响平台的商业指标。

现代推荐系统通常遵循“召回-(粗排)-精排-重排”的多阶段级联范式 [1,2]。作为推荐系统的最底层，召回阶段会从候选集合中检索相对少量的相关内容提供给后续阶段进行更细粒度的排序。因此，召回阶段决定了总体候选视频集合的质量，通常成为整个推荐系统的瓶颈。

早期的推荐系统通过采用协同过滤的方式进行召回 [3,4]。随着深度学习的发展，最近的工业级推荐系统多数倾向于利用双塔模型进行召回 [1,5,6]。双塔模型分别生成用户（user）和视频（item）的 embedding 向量，并通过内积等方式计算用户对视频的偏好。在线上推理阶段，工业界通常采用最近邻检索 [7-10] 等方法根据 user embedding 从视频库中检索最相似的视频。双塔模型可以有效利用用户和视频中的丰富特征捕获复杂的特征交互提升个性化，且允许高效的检索，因此在工业场景下广受青睐。

图 1：矩阵式布局的流媒体平台的个性化页面展示。

尽管双塔模型在各种工业应用中被使用，但以往的方法并没有充分考虑 Disney 流媒体平台的如下特点（尤其是元信息的利用，以及多场景的特点），因而直接将这些方法照搬到我们的平台上并不能得到最理想的推荐结果：

丰富的元信息。流媒体平台中的视频通常包含异构的元信息，包括视频 id、题材、系列、品牌、演员信息、视频特征、文本特征等。虽然已有方法使用多模态融合的方式进行元信息聚合，或者利用元信息训练出 graph embedding 进行单独一路召回 [11,12]，但如何更有效地利用这些特征仍然是一个有挑战性的问题。
用户的多兴趣。Disney 流媒体服务的节目大致可以分为点播剧集、电影和直播内容。不同类别的用户行为反映了用户在平台上粗粒度的多兴趣。用户在同一类别中也会表现出细粒度的多兴趣。例如，某个订阅用户可能同时观看过点播的纪录片、喜剧和悲剧。为了更好地理解用户，召回模型应该有能力建模用户多样化的兴趣。
平台的多场景。流媒体推荐天然面临着多场景的问题。从订阅用户的角度，推荐系统需要为选择不同订阅套餐（导致可观看的内容不同）、来自不同地区和国家的用户提供服务。从产品的角度，流媒体平台通常采用一种矩阵式的页面布局（如图1）呈现符合不同主题的推荐结果。由于用户行为在不同场景之间的行为普遍存在差异，采用单一模型不能够区分场景的差异，而构建多个召回模型也会由于不能捕捉场景间的共同特征而导致次优的推荐结果。
视频数量的有限性。与电商和短视频场景不同，Disney 流媒体平台仅向订阅者提供数量有限的高质量和原创内容。受益于有限的视频集合，召回模型可以精确地为每个候选视频打分，且不需要使用任何近似方法进行检索。这种灵活性允许了比双塔结构更复杂的模型构建方式。

基于上述提到的 Disney 流媒体平台的特点，我们提出了基于多模态多兴趣多场景技术的召回模型M5(Multi-Modal Multi-Interest Multi-Scenario Matching)，以向订阅用户提供更好的推荐服务。

Disney 流媒体服务主要向用户呈现感兴趣的视频，包括点播剧集、点播电影和直播节目。作为推荐系统的最底层，召回阶段的目标是从候选集合中 I 为给定用户 u 找出 N 个最符合其兴趣的视频。这个过程可以被形式化地表示为：

其中 f(u,i) 是模型预测的用户对目标视频的偏好打分。

为了给出准确的预测，我们在 Disney 流媒体召回中使用了丰富的特征，主要分为以下几个类别：

用户特征：包含年龄、性别、用户统计类特征（如用户观看某种类别视频的次数）；
行为特征：行为特征是最重要的一种用户画像，包括高频的隐式用户观看行为以及低频的喜欢、不喜欢等用户主动操作。每个行为序列被聚合到剧集级别，以对同一剧集的重复消费进行去重（例如，“辛普森一家” 和 NBA 的内容在每个行为特征中只出现一次）；否则，这些重复性和周期性的内容消费将会主导行为序列的构成。除此之外，每个行为的细粒度描述也被加到每个行为当中，以弥补在聚合过程中的信息损失，在后文中我们将具体介绍。为了简单起见，我们只在后文考虑用户的历史观看行为，其他的行为（诸如喜欢、不喜欢等）都遵循相似的处理方式；
上下文特征：包含设备、小时、日期等特征。同时还有类似于“用户最后一个行为至今的时间”捕捉行为的新鲜度；
目标特征：与行为特征中的每个视频相同。

如下图所示，M5 的整体架构遵循双通道双塔的模式。M5 在最底层通过多模态 embedding 层将每个剧集 id 编码成基于 id 和基于内容关系图 (content graph, cg)的 embedding，以充分挖掘 Disney 流媒体中丰富的元数据。为了在保留多模态语义的同时有效地召回，M5 扩展了以往常见的双塔架构，以双通道的形式分别计算基于 id 和 cg 的用户-视频偏好。其中，user embedding 通过并行的多兴趣抽取层和多场景融合层生成，item embedding 通过对候选视频集合在 id 和 cg 的 embedding table 查找得到。最终 M5 利用动态加权层合并多模态预测结果并生成统一的召回打分。

图 2：M5 的整体模型结构。其中 b1, b2, … 代表用户的观看行为特征。xu, xs, xc 分别表示用户、场景和上下文特征。EID 和 ECG 表示 ID 和 CG 的 embedding table。

embedding 层主要将稀疏特征转换为低维稠密向量。与大多数的召回系统不同，M5 利用 Disney 流媒体服务中丰富的元信息为每个视频生成了对应的 cg embedding，作为对仅从用户行为日志训练的普通 id embedding 的补充。

多模态 embedding：多模态 embedding 作用于行为特征和目标特征，它将每个剧集id 映射到 id embedding 和 cg embedding。id embedding 是通过随机初始化或者从先前的增量结果生成的，这种方法在工业界使用广泛。与之相比，cg embedding 由一个预训练的基于内容增量更新的内容关系图初始化。图节点包含 id、标签、演员信息、视觉信息和文本信息，每个节点表示特定的模态，且 id 节点会和对应的元信息节点连接。为了更好地利用视觉信息和文本信息，我们使用预训练的模型生成视觉和文本表示 [13,14]。M5 采用经典的 word2vec [15] 以及 GraphSAGE [16] 训练关系图的 embedding。我们也尝试了一些新方法 [17]，但没能带来进一步的效果提升。

共享 embedding：共享 embedding 负责处理除剧集 id 之外的特征，它和普通的 embedding 操作没有任何区别。

多兴趣抽取层根据用户的行为特征生成聚合的表示。为了明确地描述用户粗粒度和细粒度的偏好，M5 将用户的行为分类，并在每个行为上面附加辅助特征进行更精确地刻画。M5使用 self-attention以及subsidiary-intensity (SIN)模块处理 id embedding。为了保留 content graph 中的元信息，M5 只使用 SIN 模块对 cg embedding 聚合。

行为分类和辅助特征：Disney 流媒体平台会为用户提供点播剧集，点播电影以及直播内容。根据离线的数据分析，我们发现用户对这些类别的兴趣是完全不同的。例如，经常观看 NCAA 和 NBA 直播的用户并不会经常观看点播的体育剧集或电影。因此，M5 显式地将用户行为按照类别分桶以刻画用户的粗粒度兴趣。除此之外，M5 还在每个行为上添加辅助特征，以捕捉用户的细粒度兴趣。具体来说，M5 记录剧集级别的“剧集观看次数”、“播放时长”辨别每个用户行为的强度，同时抽取“上次观看到现在的时长”描绘行为的序列信息以及新鲜度。

Self-Attention 多兴趣抽取：M5 在 id embedding 的行为序列上采用多层双向 Transformer [18] 提取用户的多样化兴趣并捕获序列内的复杂关系。由于 Transformer 在业界被广泛使用，我们在这里不描述它的模型结构，具体细节可以参考原论文 [18]。我们在这里想探讨的是 self-attention 在推荐模型中正确的使用姿势。在刚开始尝试 self-attention 模型的时候，我们发现效果并没有想象中的明显。之后，我们试图通过 scaling 提升模型效果，结果发现模型变宽变深反而导致性能下降。熟悉 CV 和 NLP 的读者应该对这种情况非常意外，因为将模型变大（尤其是 Transformer）在 CV 和 NLP 领域是提升性能的一种通用范式。通过对比推荐模型和其它领域的模型结构，我们猜测是 self-attention 部分没有得到充分的训练才导致了上述的反常现象。因此，我们在 self-attention 的输出上添加了一个 Masked-language-Modeling (MLM) [14] 的辅助 loss 增加训练信号。更准确的说，在每个输入序列上，我们随机 mask 掉一部分的用户行为，并在 self-attention 模块的输出端对这些 mask 的位置进行重建。使用这个技巧之后，我们发现 self-attention 的性能得到了显著的提升，且 scaling 策略也能为模型带来持续的优化。

图 3：Self-Attention 多兴趣抽取模块

Subsidiary-Intensity 兴趣聚合：SIN 模块参考了 DIN 的 local activation unit [19]，使用 point-wise 的注意力机制为每个行为打分。SIN 对每一个行为的剧集 embedding 和辅助特征的 embedding 做特征交叉，并和原始特征一起放入 MLP 生成兴趣打分。其中，MLP 的最后一层使用指数激活层，以保证打分语义上的非负性。同时，SIN 使用全0初始化 MLP 的最后一层，这样在初始时所有的打分结果都等于1，从而允许网络在训练过程中逐渐地学习到每个行为的重要性。对于 id 通道，SIN 模块作用于 self-attention 基于 id embedding 的输出结果；对于 cg 通道，SIN 的结果会直接作用在原始的 cg embedding 上面，这样可以保留足够的元信息。

图 4：Subsidiary-Intensity 兴趣聚合模块

为了更好地适应 Disney 流媒体中天然的多场景属性，M5 在多场景融合层使用 SMoE 以及场景id辨别场景之间的异同，并通过 disagreement loss 鼓励专家的多样性。SMoE 是 MMoE 模型[20]的一种拓展。为了更好地学习不同场景的区别，我们直接将场景 id 作为特征加入到网络的输入，并通过内积的形式将其和其他特征做交叉以捕捉高阶的语义。根据得到的输入特征，我们利用 MoE 的专家网络学习场景之间的通用知识，并通过门控单元控制专家结果的使用。SMoE 为每个场景保留不同的门控子网络以及后处理子网络，以更好地区分场景之间的差别。同时，为避免专家网络学习相同或者相似的语义特征，M5 还借鉴了 disagreement loss 对专家进行约束[21]。多场景融合并行地作用在双通道的行为序列上，最终得到基于id和cg的 user embedding。

图 5：SMoE 模型结构

为了充分利用目标测的多模态信息，我们使用动态加权层计算最终的用户对视频的偏好。对于 id 和 cg 的 user embedding 以及候选集合的 id 和 cg 的 item embedding，M5 分别计算基于 id 和 cg 的用户-视频打分：

之后，M5 会根据用户相关特征计算 id, cg 打分的权重，并对结果进行加权平均：

M5 从形式上可以被看作是一种特殊的多路（通道）召回。但是与普通的多路召回不同，M5 并行地建模多模态（多通道）预测结果，并基于动态加权得到唯一的混合打分进行检索。这种做法比普通的多路召回更平滑且准确，且能够在不同通道间共享知识和参数。值得注意的是，M5 也能够作用于大规模候选集合的场景。一种最简单的做法是把计算出来的动态权重直接乘到对应的 user embedding 上面，然后基于 ANN 或者 MIPS 对 item 进行检索。可以证明，这种检索方式和直接计算每一个 item 的打分是等价的。

我们在 Disney+ 和 Hulu 平台分别收集了一个月的数据做训练和评估。对于 Hulu，它的多场景表现在用户的订阅类型（点播、直播）以及样本的来源上（优化场景内部样本和优化场景外部样本）。对于 Disney+，它的多场景表现在来自不同国家和地区的用户上。

我们比较了一些业界常用的方法 [1,22-25]，并使用 Hit Ratio (HR) 评估模型的离线结果。显然，M5 大幅超过了所有的对比方法，在 Hulu/Disney+ 的所有场景下都实现了超过 10%/5% 的HR 提升，证明了多模态多兴趣多场景技术对 Disney 流媒体召回的重要性。此外，多模态、多兴趣和多场景建模的设计都能够改进推荐性能，并提供近乎正交的提升。

更具体地，由于平台中的用户行为刻画了最精准的用户信息，多兴趣抽取对两个场景都很关键。多场景技术能够为 Hulu 场景带来很大的指标提升（ Scenario 2 和 4），这是因为 Hulu 的点播和直播订阅用户行为差异很大。与之相比，在给定特征下，Disney+ 不同地区的用户意图并没有很明显的差异。此外，尽管 id embedding 能够在大规模流媒体平台得到充分的训练，多模态 embedding 所带来的元信息仍然稳定地提升模型的召回能力。

表 1：M5 在 Hulu 和 Disney+ 的离线实验结果

我们通过Disney流媒体的在线实验平台将 M5 部署到Hulu和Disney+最热门的For You集合上面进行在线 A/B 实验。我们使用 HPV (hours per visitor，平均用户观看时长) 衡量模型的在线性能，因为它与我们最终的商业目标息息相关。在Hulu场景下，线上的 baseline 是一个基于大量特征工程的 Youtube DNN；在Disney+场景下，线上的 baseline是一个基于变分自动编码器的模型。可以看到，M5在各种场景下都显著超越了 baseline 方法。M5 已经在Hulu和 Disney+ 全量上线，为业务增长持续地做出贡献。

图 6：M5 在 Hulu 和 Disney+ 的在线实验结果。

Pengyu Zhao，内容发现部门高级算法工程师

内容发现部门(Content Discovery Org.)是迪士尼流媒体核心研发部门，主攻Hulu、Disney+、Star+等迪士尼流媒体产品线的三大业务方向：搜索、个性化推荐、内容推广。在每个业务方向上都和人工智能技术深度融合，涉及AI平台的搭建、前沿算法的研究、以及工程系统的集成，致力于为迪士尼流媒体用户提供最佳的视频观看体验。

自成立伊始，该部门始终将内容的精准传递作为首要业务目标，深入结合工程、算法和数据，利用人才优势与人工智能基础解决业务问题。

职位信息: 职位列表链接

感兴趣的同学发送简历至：[email protected]

（烦请标注申请职位+姓名）

[1] Paul Covington, Jay Adams, and Emre Sargin. 2016. Deep neural networks for youtube recommendations. In Proceedings of the 10th ACM conference on recommender systems. 191–198

[2] Zhe Wang, Liqin Zhao, Biye Jiang, Guorui Zhou, Xiaoqiang Zhu, and Kun Gai. 2020. COLD: Towards the Next Generation of Pre-Ranking System. arXiv preprint arXiv:2007.16122 (2020).

[3] James Davidson, Benjamin Liebald, Junning Liu, Palash Nandy, Taylor Van Vleet, Ullas Gargi, Sujoy Gupta, Yu He, Mike Lambert, Blake Livingston, et al. 2010. The YouTube video recommendation system. In Proceedings of the fourth ACM conference on Recommender systems. 293–296.

[4] Badrul Sarwar, George Karypis, Joseph Konstan, and John Riedl. 2001. Item-based collaborative filtering recommendation algorithms. In Proceedings of the 10th international conference on World Wide Web. 285–295.

[5] Chao Li, Zhiyuan Liu, MengmengWu, Yuchi Xu, Huan Zhao, Pipei Huang, Guoliang Kang, Qiwei Chen,Wei Li, and Dik Lun Lee. 2019. Multi-interest network with dynamic routing for recommendation at Tmall. In Proceedings of the 28th ACM international conference on information and knowledge management. 2615–2623.

[6] Xinyang Yi, Ji Yang, Lichan Hong, Derek Zhiyuan Cheng, Lukasz Heldt, Aditee Kumthekar, Zhe Zhao, Li Wei, and Ed Chi. 2019. Sampling bias-corrected neural modeling for large corpus item recommendations. In Proceedings of the 13th ACM Conference on Recommender Systems. 269–277.

[7] Herve Jegou, Matthijs Douze, and Cordelia Schmid. 2010. Product quantization for nearest neighbor search. IEEE transactions on pattern analysis and machine intelligence 33, 1 (2010), 117–128.

[8] Jeff Johnson, Matthijs Douze, and Hervé Jégou. 2019. Billion-scale similarity search with gpus. IEEE Transactions on Big Data 7, 3 (2019), 535–547.

[9] Yu A Malkov and Dmitry A Yashunin. 2018. Efficient and robust approximate nearest neighbor search using hierarchical navigable small world graphs. IEEE transactions on pattern analysis and machine intelligence 42, 4 (2018), 824–836.

[10] Marius Muja and David G Lowe. 2014. Scalable nearest neighbor algorithms for high dimensional data. IEEE transactions on pattern analysis and machine intelligence 36, 11 (2014), 2227–2240.

[11] Jizhe Wang, Pipei Huang, Huan Zhao, Zhibo Zhang, Binqiang Zhao, and Dik Lun Lee. 2018. Billion-scale commodity embedding for e-commerce recommendation in alibaba. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 839–848.

[12] Yinwei Wei, Xiang Wang, Liqiang Nie, Xiangnan He, Richang Hong, and Tat-Seng Chua. 2019. MMGCN: Multi-modal graph convolution network for personalized recommendation of micro-video. In Proceedings of the 27th ACM International Conference on Multimedia. 1437–1445.

[13] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. 2016. Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition. 770–778.

[14] Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. 2019. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). 4171–4186.

[15] Mikolov, Tomas, et al. "Efficient estimation of word representations in vector space." arXiv preprint arXiv:1301.3781 (2013).

[16] Will Hamilton, Zhitao Ying, and Jure Leskovec. 2017. Inductive representation learning on large graphs. Advances in neural information processing systems 30 (2017).

[17] Rex Ying, Ruining He, Kaifeng Chen, Pong Eksombatchai, William L Hamilton, and Jure Leskovec. 2018. Graph convolutional neural networks for web-scale recommender systems. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 974–983.

[18] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Łukasz Kaiser, and Illia Polosukhin. 2017. Attention is all you need. In Proceedings of the 31st International Conference on Neural Information Processing Systems. 6000–6010.

[19] Guorui Zhou, Na Mou, Ying Fan, Qi Pi, Weijie Bian, Chang Zhou, Xiaoqiang Zhu, and Kun Gai. 2019. Deep interest evolution network for click-through rate prediction. In Proceedings of the AAAI conference on artificial intelligence. 5941–5948.

[20] Jiaqi Ma, Zhe Zhao, Xinyang Yi, Jilin Chen, Lichan Hong, and Ed H Chi. 2018. Modeling task relationships in multi-task learning with multi-gate mixture-of-experts. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 1930–1939.

[21] Jian Li, Zhaopeng Tu, Baosong Yang, Michael R Lyu, and Tong Zhang. 2018. Multi-head attention with disagreement regularization. arXiv preprint arXiv:1810.10183 (2018).

[22] Balázs Hidasi and Alexandros Karatzoglou. 2018. Recurrent neural networks with top-k gains for session-based recommendations. In Proceedings of the 27th ACM international conference on information and knowledge management. 843–852.

[23] Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, and Wenwu Ou. 2019. Behavior sequence transformer for e-commerce recommendation in Alibaba. In Proceedings of the 1st International Workshop on Deep Learning Practice for High-Dimensional Sparse Data. 1–4.

[24] Fuyu Lv, Taiwei Jin, Changlong Yu, Fei Sun, Quan Lin, Keping Yang, and Wilfred Ng. 2019. SDM: Sequential deep matching model for online large-scale recommender system. In Proceedings of the 28th ACM International Conference on Information and Knowledge Management. 2635–2643.

[25] Yukuo Cen, Jianwei Zhang, Xu Zou, Chang Zhou, Hongxia Yang, and Jie Tang. 2020. Controllable multi-interest framework for recommendation. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2942–2951.

输入某年某月某日，判断这一天是这一年的第几天python 发现文化fu python python
题目：输入某年某月某日，判断这一天是这一年的第几天python输入某年某月某日，判断这一天是这一年的第几天python思路：*判断闰年能被4整除但不能被100整除，年份能被400整除#方法1sum=0if(year%4==0andyear%100!=0)oryear%400==0:feb=29else:feb=28month_day=[0,31,feb,31,30,31,30,31,31,30,3
RSA加密算法不会搬砖的淡水鱼网络服务器安全
RSA加密算法：数学魔术背后的安全守护者RSA加密算法（Rivest-Shamir-Adleman）是一种广泛使用的公钥加密算法，它在信息安全领域具有重要作用。RSA是由罗纳德·李维斯特（RonRivest）、阿迪·萨莫尔（AdiShamir）和伦纳德·阿德曼（LeonardAdleman）在1977年一起提出的。当时他们三人都在麻省理工学院工作。RSA就是他们三人姓氏开头字母拼在一起组成的。RS
基础算法--欧拉函数不会搬砖的淡水鱼基础算法算法 java 数据结构
欧拉函数（Euler’stotientfunction），也称为费马函数，是一个与正整数相关的数论函数，用符号φ(n)表示。欧拉函数φ(n)定义为小于或等于n的正整数中与n互质的数的个数。RSA加密算法（Rivest-Shamir-Adleman）就是通过欧拉函数进行公钥加密。具体而言，对于给定的正整数n，欧拉函数φ(n)计算满足以下条件的k的个数：1≤k≤n，且k与n互质（即k和n的最大公约数为
基础算法--背包问题不会搬砖的淡水鱼基础算法算法 java 动态规划贪心算法
背包问题概念完全背包（无限背包）0-1背包概念背包问题是一个经典的组合优化问题，其目标是在给定的一组物品中选择一些物品放入背包中，使得物品的总价值最大化，同时要求背包的总重量不超过背包的容量限制。背包问题有两种常见的变体：完全背包和0-1背包。鉴于完全背包计算过程相对0-1背包简单，这里先讲完全背包。完全背包（无限背包）在完全背包问题中，每个物品可以选择放入背包中的次数是无限的，即可以重复选择。每
python练习3：输入某年某月某日，判断这一天是这一年的第几天？柯.姐姐 python
#输入某年某月某日，判断这一天是这一年的第几天？list=[0,31,59,90,120,151,181,212,243,273,304,334]year=int(input('请输入年份：'))month=int(input('请输入月份：'))day=int(input('请输入天：'))ifmonth>0andmonth2:result=result+1print("这是第%d天"%resu
CUDA编程基础清澜算法面试人工智能 c++算法 nvidia cuda编程
一、快速理解CUDA编程1.1CUDA简介CUDA（ComputeUnifiedDeviceArchitecture）是由NVIDIA推出的并行计算平台和应用程序接口模型。它允许开发者利用NVIDIAGPU的强大计算能力来加速通用计算任务，而不仅仅是图形渲染。通过CUDA，开发者可以编写C、C++或Fortran代码，并将其扩展以在GPU上运行，从而显著提高性能，特别是在处理大规模数据集和复杂算法
初学python100例-案例4 计算一年第几天多种不同解法少儿编程案例讲解小兔子编程初学python100例 python学习 python100例 python计算天数 python算法 python案例
题目输入某年某月某日，判断这一天是这一年的第几天？解法1程序分析1、以5月2日为例，应该先把前四个月的加起来，2、然后再加上2天即本年的第几天，3、特殊情况，闰年且输入月份大于2时需考虑多加一天：4、闰年1、年份能被4整除；2、年份若是100的整数倍的话需被400整除，否则是平年。程序源代码：year=int(input('year:\n'))month=int(input('month:\n')
Python 的类中，self 是一个特殊的参数可可乐不加冰知识学习专栏 python 开发语言
在Python的类中，self是一个特殊的参数，它代表类的实例本身。self是方法的第一个参数，用于访问实例的属性和方法。下面我将从多个角度解释self的含义、作用以及如何使用它。1.self表示类的实例本身在Python中，当你创建一个类的实例时，实际上是在内存中创建了一个对象。self参数代表的就是这个对象本身。通过self，你可以在类的方法中访问和修改实例的属性。2.为什么需要self？se
Trae AI 上新 SSHremote：服务器 Python 接口日志排查实战指南芯作者 DD：日记人工智能深度学习机器学习
在当今的软件开发中，服务器端的稳定性和可靠性至关重要。然而，生产环境中的问题往往难以预测，尤其是接口返回502错误却无日志记录的情况，更是让开发者头疼不已。幸运的是，字节跳动推出的AI原生IDE——Trae，近期上线的SSHremote功能，为远程服务器日志排查提供了全新的解决方案。本文将结合实战案例，深入探讨如何利用TraeAI的SSHremote功能高效排查Python接口日志问题，并分享创新
Python入门程序练习004：输入某年某月某日，判断这一天是这一年的第几天？若北辰 Python实战练习
【程序4】题目：输入某年某月某日，判断这一天是这一年的第几天？1.程序分析：其实这一题的难度不在于编程，而在于对闰年有没有一些基本的认识，相信很多人都知道闰年，但是又不太清楚具体怎么判断闰年。在下面两个条件中只要满足一个即是闰年：1、能被4整除但是不能被一百整除2、能被四百整除。为了方便记忆，总结为：四年一闰,百年不闰,四百年再闰那么判断出闰年和平年（除了闰年其他都是平年）之后呢，其实只要记住：闰
Python后端学习系列（10）：分布式系统与数据一致性（使用分布式锁、分布式事务等） DoYangTan python 学习分布式
Python后端学习系列（10）：分布式系统与数据一致性（使用分布式锁、分布式事务等）前言随着业务规模的不断扩大以及对系统性能、可扩展性的更高要求，后端应用往往会朝着分布式系统的方向发展。然而，分布式系统带来诸多优势的同时，也面临着如数据一致性等复杂的挑战。本期我们就聚焦于分布式系统中的关键问题——数据一致性，深入探讨分布式锁、分布式事务等相关知识以及保障数据一致性的策略与实践，让我们一起深入学习
泛目录程序：2025快云站群程序的SEO优化功能云惠科技大数据泛目录
快云站群程序的SEO优化功能围绕搜索引擎算法设计，具体包含以下核心模块：1.关键词智能布局密度检测与优化：自动分析内容关键词密度，建议合理区间（2%-8%），避免堆砌或遗漏；多词策略支持：可针对单篇内容设置主关键词+长尾词组合，覆盖更多搜索场景；标题/摘要自动生成：根据关键词智能生成高点击率的标题和Meta描述，提升搜索展示效果。2.内链自动化系统内容关联推荐：基于语义分析，自动在文章中插入相关内
python进阶，类的继承，封装，多态，super 胡萝卜糊了 python 开发语言
#单继承#子类只继承一个父类classPerson:defsay(self,value):print('say:',value)defwalk(self,value):print('walk:',value,'km')#Student类继承PersonclassStudent(Person):defstudy(self,value):print('study:',value)#Teacher类继承
python进阶，迭代器和生成器，函数式编程，闭包，装饰器胡萝卜糊了 python 开发语言
l=[1,2,3,4]it=iter(l)print(next(it))print(next(it))print(next(it))print(next(it))#while循环l=[1,2,3,4]len=len(l)i=0it=iter(l)whilei=self.end:raiseStopIterationself.current+=1returnself.current-1it=MyIte
Day6：python面向对象编程——构建可扩展的订单管理系统 weixin_44650422 python 开发语言
目标：掌握类与对象的核心概念，实现模块化的订单业务逻辑一、类与对象：订单管理系统核心1.基础订单类classOrder:"""订单基类"""def__init__(self,order_id,customer):self.order_id=order_id#订单号self.customer=customer#客户名self.items=[]#商品列表self.total=0.0#总金额defadd
python assert()函数欢天喜地小姐姐 python编程学习 python
1.断言函数作用断言函数是对表达式布尔值的判断，要求表达式计算值必须为真。可用于自动调试。如果表达式为假，触发异常；如果表达式为真，不会报错。2.使用assert判断数组是否相等np.array.any()和numpy.array.all()np.array.any()是或操作，任意一个元素为True，输出为True。np.array.all()是与操作，所有元素为True，输出为True。当我们
【LeetCode 热题100】 23. 合并 K 个升序链表的算法思路及python代码 pljnb LeetCode热题100 算法 leetcode 链表
23.合并K个升序链表给你一个链表数组，每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中，返回合并后的链表。示例1：输入：lists=[[1,4,5],[1,3,4],[2,6]]输出：[1,1,2,3,4,4,5,6]解释：链表数组如下：[1->4->5,1->3->4,2->6]将它们合并到一个有序链表中得到。1->1->2->3->4->4->5->6示例2：输入：lists=[
【Leetcode刷题随笔】59 螺旋矩阵 Poor_DayDreamer leetcode数组篇 Medium Tag leetcode 矩阵算法
1.题目描述给定一个正整数n，生成一个包含1到n2所有元素，且元素按顺时针顺序螺旋排列的nxn正方形矩阵matrix。可结合以下原题链接阅读。原题链接：59螺旋矩阵2.解题思路本题为模拟矩阵填充过程，不需要设计算法，只要完成正确的填充过程即可。首先初始化一个nxn的二维矩阵（涉及到动态内存分配），从矩阵左上角开始往顺时针填充，关键在于填充的转角处不要重复填充，所以对于每条边都要遵循严格的统一规则，
人生重开模拟器 -deepseek版 Cccc吃吃吃 python 开发语言
人生重开模拟器是一个有趣的文字类游戏，玩家可以通过选择不同的选项来体验不同的人生轨迹。下面是一个简单的Python实现，模拟了人生重开的过程。玩家可以通过输入数字来选择不同的选项，游戏会根据选择生成不同的人生结局。```pythonimportrandomdefprint_intro():print("欢迎来到人生重开模拟器！")print("你将重新开始你的人生，通过不同的选择体验不同的人生轨迹
大数据最新大数据StarRocks(七)：数据表创建(2) 2401_84182271 程序员大数据
2.1表分为内部表和外部表默认未内部表，3.0版本开始集成外部数据建议使用catalog，外部表的建表方式将被弃用2.2列定义语法：col_namecol_type[agg_type][NULL|NOTNULL][DEFAULT"default\_value"][AUTO_INCREMENT][ASgeneration_expr]col_name：列名称注意，在一般情况下，不能直接创建以以__op
算法入门——二分法 Able Zhao 650829 算法数据结构 c++蓝桥杯
二分法真的很容易出错！！！在用dp学习之后总结了一下二分法二分查找关键总结一、核心思想分治策略：每次将搜索范围缩小一半，适用于有序数组。时间复杂度：O(logn)，比线性查找高效得多。二、关键点前提条件有序性：数组必须有序（升序或降序），否则需先排序（但排序成本O(nlogn)）。静态性：适合静态数据或低频更新的数据（高频更新建议用哈希表或树结构）。两种边界问题左边界：第一个等于目标的位置（或第一
PTA天梯赛Python7-52 古风排版胡同Alley python
中国的古人写文字，是从右向左竖向排版的。本题就请你编写程序，把一段文字按古风排版。输入格式：输入在第一行给出一个正整数N（<100），是每一列的字符数。第二行给出一个长度不超过1000的非空字符串，以回车结束。输出格式：按古风格式排版给定的字符串，每列N个字符（除了最后一列可能不足N个）。输入样例：4Thisisatestcase输出样例：asaTstihetsices代码长度限制16KB时间限制
详细介绍 Jupyter nbconvert 工具及其用法：如何将 Notebook 转换为 Python 脚本源代码杀手 python使用技巧 python jupyter ide
nbconvert是Jupyter提供的一个非常强大的工具，允许用户将JupyterNotebook文件（.ipynb）转换成多种格式，包括Python脚本（.py）、HTML、PDF、LaTeX等。你可以通过命令行来运行nbconvert，也可以在JupyterNotebook中通过一些自定义的设置来实现转换。安装nbconvert通常情况下，nbconvert会随Jupyter一起安装，因此不
python -- assert函数我不是程序员‍ python知识 python
一、assert函数在Python中，assert语句用于调试和测试代码。它用于检查某个条件是否为真。如果条件为假，assert语句会抛出一个AssertionError异常，并可以选择性地附加一条错误消息。assert语句的基本语法是：assertcondition,optional_messagecondition:一个布尔表达式。如果结果为True，程序继续执行。如果为False，会触发As
CTF杂项挑战：使用已知字典破解ZIP文件密码 0dayNu1L Web安全 CTF web安全网络安全
在CTF比赛中，杂项挑战通常包含一些非传统的题目，其中破解ZIP文件密码是一个常见的任务。本文将介绍两种在已知密码字典文件的情况下，破解ZIP文件密码的方法：一种是使用Python脚本进行暴力破解，另一种是通过zip2john和john命令结合进行破解。0dayNu1L-CSDN博客请一键三连吧！！！❤❤❤目录方法一：使用Python脚本进行暴力破解步骤方法二：使用zip2john和john命令结
文本转语音的Python库（pyttsx3）数产第一混子 python库 python
一、pyttsx3的概述pyttsx3isatext-to-speechconversionlibraryinPython.pyttsx3是Python中的文本到语音转换库。二、pyttsx3的安装pipinstallpyttsx3三、小试牛刀importpyttsx3engine=pyttsx3.init()engine.say("Iwillspeakthistextrightnow")engi
区块链赋能：用Python开发去中心化投票系统 Echo_Wish Python！实战！区块链 python 去中心化
区块链赋能：用Python开发去中心化投票系统在这个互联网迅猛发展的时代，投票系统不仅仅停留在政务领域，它已成为社区治理、企业决策甚至区块链DAO（去中心化自治组织）中重要的机制。然而，传统投票系统往往集中化，存在信任和数据安全问题。区块链技术以其不可篡改性和透明性为去中心化投票提供了理想的解决方案。在这篇文章中，我将通过Python语言，结合区块链智能合约，教你如何从零开发一个去中心化的投票系统
Python助力区块链互通——跨链桥接的实现与实践 Echo_Wish Python！实战！区块链 python 开发语言
Python助力区块链互通——跨链桥接的实现与实践区块链技术的繁荣发展带来了巨大的生态创新，但也因各链之间的割裂局面限制了它们的潜力。例如，你或许想在以太坊上使用来自比特币的资产，却因两条链不互通而不得不求助于中心化交易所。要打破“链间壁垒”，跨链桥接（Cross-chainBridge）应运而生。今天，我以Echo_Wish的视角，通过Python代码实践，带你深入了解跨链桥接的工作原理，技术实
python pyttsx3文本转语音_python 利用pyttsx3文字转语音木大木大本太 python pyttsx3文本转语音
#-*-coding:utf-8-*-importpyttsx3f=open("all.txt",'r')line=f.readline()engine=pyttsx3.init()whileline:line=f.readline()print(line,end='')engine.say(line)engine.runAndWait()f.close()importwin32com.clien
技术沙龙 | 从高并发架构到企业级区块链探索零售创新 weixin_33984032 区块链 python 数据库
2019独角兽企业重金招聘Python工程师标准>>>伴随消费新理念的不断升级和技术创新发展，零售业逐渐被推到风口浪尖，对此京东曾表示，推动“无界零售”时代的到来理念，倡导实现成本、效率、体验的升级才是终极目标。此概念一出，零售行业的侧重点开始由销售端向技术端倾斜，趁着一年一度618来临之际，京东云特别在上海举办了主题为"从高并发架构到企业级区块链，探索无界零售的数字化创新"的技术沙龙活动。本次活
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

技术博客|第12期:多模态多兴趣多场景技术在Disney流媒体推荐召回中的应用

你可能感兴趣的:(大数据,算法,编程语言,python,推荐系统)