智源社区

《因果科学周刊》第4期：因果赋能推荐系统

为了帮助大家更好地了解因果科学的最新科研进展和资讯，我们因果科学社区团队本周整理了第4期《因果科学周刊》，推送近期因果科学值得关注的论文和资讯信息，同时我们也将向大家介绍社区正在推进的活动——因果科学与Casual AI读书会第8期中的主要报告内容、观点。

本期作者：侯茹闫和东陈晗曦龚鹤扬陈天豪杨二茶

因果科学社区简介：它是由智源社区、集智俱乐部共同推动，面向因果科学领域的垂直型学术讨论社区，目的是促进因果科学专业人士和兴趣爱好者们的交流和合作，推进因果科学学术、产业生态的建设和落地，孕育新一代因果科学领域的学术专家和产业创新者。

因果科学社区欢迎您加入！

因果科学社区愿景：回答因果问题是各个领域迫切的需求，当前许多不同领域（例如 AI 和统计学）都在使用因果推理，但是他们所使用的语言和模型各不相同，导致这些领域科学家之间沟通交流困难。因此我们希望构建一个社区，通过组织大量学术活动，使得科研人员能够掌握统计学的核心思想，熟练使用当前 AI 各种技术（例如 Pytorch/Pyro 搭建深度概率模型），促进各个领域的研究者交流和思维碰撞，从而让各个领域的因果推理有着共同的范式，甚至是共同的工程实践标准，推动刚刚成型的因果科学快速向前发展。具备因果推理能力的人类紧密协作创造了强大的文明，我们希望在未来社会中，因果推理融入到每个学科，尤其是紧密结合和提升 AI ，期待无数具备攀登因果之梯能力的 Agents (Causal AI) 和人类一起协作，共建下一代的人类文明！

如果您有适当的数学基础和人工智能研究经验，既有科学家的好奇心也有工程师思维，希望参与到”因果革命“中，教会机器因果思维，为因果科学作出贡献，请加入我们微信群：扫描下面社区小助手二维码加入（请备注“因果科学”）????

当今的信息革命时代，信息处理和利用能力是 AI 智能水平的一个重要方面。而因果推理能够帮助我们利用 Lorenzian imagined space 中信息进行决策(Schölkopf B., 2019)，因果推理是下一代 AI 的必要组件(Pearl J., 2019, Elias B., 2020)。推荐是信息提取的一种特殊形式，它利用过去的行为和用户相似性来生成一系列信息，这些信息是根据最终用户的喜好量身定制的。

图1：推荐系统的角色(Ricardo Baeza-Yates)

在最近举行的推荐系统最重要的会议 RecSys 2020 中，可以看到学术界和工业界一个重要趋势是有关的 bias 的研究，也就是推荐系统出现的各种偏差让其推荐非预期的 Item。推荐系统的任务被经典地定义为预测用户的偏好和用户评分。然而，它本质上是要回答一个反事实问题：“如果我们‘强迫’用户去看电影，评分会是多少?” 如何使用观测数据正确的训练推荐算法，甚至评估(NOT A/B 测试) 评估推荐系统的性能，使用因果推理 debias 成为其中一个非常 Promising 的方向(Wang Y., 2019, Sharma A., 2015)。

图2: 因果推荐的基本数学形式

此次我们邀请亚利桑那州立大学博士郭若城推荐了一些有关 Causal + RecSyc 的前沿论文，下面是我们的整理：

1.论文推荐

1.1 Unbiased learning to rank

Joachims, Thorsten, Adith Swaminathan, and Tobias Schnabel. "Unbiased learning-to-rank with biased feedback." In Proceedings of the Tenth ACM International Conference on Web Search and Data Mining, pp. 781-789. 2017.

翻译摘要：

在人机交互系统中，隐式反馈（例如，点击量，停留时间等）是一个丰富的数据来源。虽然隐式反馈有很多优势（例如，搜集成本低、以用户为中心、及时），它的固有偏差不利于它的有效使用。例如，在搜索排序中，某个结果的位置偏差强烈影响它的点击量，因此，直接使用点击量作为Learning-to-Rank方法（译者注：以下简称LTR）的训练数据会产生次优结果。为了克服这种偏差，我们提出了反事实推理框架，即使在有偏数据下，它也能通过经验风险最小化为无偏的LTR提供理论基础。使用这个框架，我们推导了倾向加权排序的支持向量机用于隐式反馈的判别式学习，这里点击量模型被用来估计倾向性。不同于大部分传统的使用点击量模型去除数据偏差的方法，在没有重复查询的情况下，我们的方法依然能够训练排序函数。除了理论推导，实证分析表明我们提出的学习方法对处理偏差非常有效、对噪声和倾向模型的误识别有稳健性、并且是有效率的。我们也展示了这个方法在现实世界的适用性，在运行的搜索引擎上，它能够持续改善检索水平。

译者：侯茹

Wang, Xuanhui, Nadav Golbandi, Michael Bendersky, Donald Metzler, and Marc Najork. "Position bias estimation for unbiased learning to rank in personal search." In Proceedings of the Eleventh ACM International Conference on Web Search and Data Mining, pp. 610-618. 2018.

翻译摘要：众所周知，点击量学习的挑战是它的固有偏差，尤其是位置偏差。传统的点击量模型旨在从查询和文档相关性提取信息，在提取相关性信息之后就会去掉估计的偏差。不同于此，最新的无偏Learning-to-Rank方法能够有效地利用偏差，进而着眼于估计偏差而非相关性[20, 31]。现有的方法在小范围的产品流量中随机化搜索结果来估计位置偏差。这不能达到理想结果，因为结果的随机化对用户的搜索体验有不好的影响。本文比较了不同的结果随机化方法并展示了它们对于用户搜索的不利影响。然后，我们研究了如何在不依赖随机化的情况下，从常规的点击量数据推断位置偏差。我们提出了基于回归的期望最大化算法，在位置偏差点击量模型的基础上，能够处理用户搜索中的大量稀疏数据。我们评估了我们的期望最大化算法和Learning-to-Rank方法提取的偏差。我们的结果表明，不使用结果随机化而直接从常规的点击量提取位置偏差是有前景的。提取的偏差能显著改善Learning-to-Rank算法。进一步，我们比较了逐点和逐对的Learning-to-Rank模型。结果表明逐对的模型能更有效地利用估计的偏差。

译者：侯茹

Ai, Qingyao, Keping Bi, Cheng Luo, Jiafeng Guo, and W. Bruce Croft. "Unbiased learning to rank with unbiased propensity estimation." In The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval, pp. 385-394. 2018.

翻译摘要：

用有偏的点击数据学习如何排名是众所周知的挑战。为了学习如何排名，人们探索出多种方法去除点击数据中的偏差，如点击模型、结果交错，还有最近的基于反倾向加权（IPW）的学习如何排名的无偏框架。忽略它们之间的不同点，最近大多数研究致力于从排名算法的学习中单独估计点击偏差（称为倾向模型）。为了估计点击倾向，他们有的进行了在线结果随机化，但这会影响用户体验；有的进行离线参数估计，但对点击数据有特殊要求，而且优化目标（如点击似然）不是直接和排名系统的性能有关。在这个工作中，我们通过结合倾向模型和排名模型来解决这些问题。我们发现从点击数据中估计一个倾向模型是学习无偏排名的一个对偶问题。基于这点观察，我们提出了对偶学习算法（DLA），它可以学习一个无偏的排名器和一个无偏的倾向模型。DLA是自动地无偏地学习排名的框架，因为它从未进行预处理的有偏点击数据中直接学习无偏排名模型。它可以适应偏差分布的变化，可以应用到在线学习中。我们的实验使用了合成的数据集和真实世界的数据集，结果显示：用DLA训练模型的性能明显超过了基于结果随机化的学习排名的算法，和通过用从点击模型中提取的相关性信号训练的模型。

译者：闫和东

Guo, Ruocheng, Xiaoting Zhao, Adam Henderson, Liangjie Hong, and Huan Liu. "Debiasing Grid-based Product Search in E-commerce." In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, pp. 2852-2860. 2020.

翻译摘要：

随着电子商务在日常生活的广泛使用，丰富的隐式反馈数据为训练和测试网购搜索排序算法提供了基础。尽管便于搜集，隐式反馈数据有多种固有偏差，因为现有的搜索排序算法使得用户的反馈仅局限在接触到的产品，并且受产品展示方式的影响。大部分现有的方法在基于列表的网页搜索场景中实现无偏的排序学习。然而，这些方法不能直接用于电子商务网站，有下述两个原因。第一，在电子商务网站中，搜索引擎结果页面以2维格点表示，而现有的方法并不考虑基于列表的网页搜索和基于格点的产品搜索的用户行为差异。第二，在电子商务网站有多种类型的隐式反馈（例如，点击和购买），我们的目标是将所有类型的隐式反馈作为监督信号。本文考虑了基于格点的产品搜索场景，将无偏的排序学习拓展到电子商务搜索。我们提出了新颖的框架，一方面形成了在无偏的排序学习中使用多种隐式反馈的理论基础，另一方面包含了行省略和缓慢衰减的点击模型，在基于格点产品搜索的逆向倾向评分中抓取独特的用户行为模式。在大量现实世界中不同浏览设备和产品的电子商务搜索记录数据集上的试验表明，我们提出的框架优于最先进的无偏排序学习算法。这些结果同时揭示了在不同浏览设备和产品中用户行为模式如何变化。

译者：侯茹

1.3 Debiasing Recommendation systems

翻译摘要：

译者：侯茹

Schnabel, Tobias, Adith Swaminathan, Ashudeep Singh, Navin Chandak, and Thorsten Joachims. "Recommendations as treatments: Debiasing learning and evaluation." ICML 2016..

翻译摘要：

大部分推荐系统的评估和训练数据是受限于选择偏差的，这种偏差要么通过用户自身选择产生、要么通过推荐系统的行为产生。本文中，我们提出一种通过因果推断调整模型和估计器的原则性方法来解决选择偏差的问题。这种方法可以在有偏数据上导出无偏的性能估计器，结合矩阵分解的方法显著提升了在真实世界数据中的预测性能。我们从理论和经验上刻画了该方法的鲁棒性，并且发现它具有高度的可行性和可扩展性。

译者：陈晗曦

Chen, Minmin, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, and Ed H. Chi. "Top-k off-policy correction for a REINFORCE recommender system." In Proceedings of the Twelfth ACM International Conference on Web Search and Data Mining, pp. 456-464. 2019.

翻译摘要：

工业界推荐系统会处理非常大的动作空间(action spaces)——数百万 Items 来进行推荐。同时，他们需要服务数十亿的用户，这些用户在任意时间点都是唯一的，使得用户状态空间（user state space）很复杂。幸运的是，存在海量的隐式反馈日志（比如：用户点击，停留时间等）可用于学习。从日志反馈中学习是有偏的，这是因为只有在推荐系统上观察到的反馈是由之前版本的推荐系统选中的。在本文中，我们提出了一种通用的方法，在 Youtube 生产环境上的 Top-k 推荐系统中，使用一个基于策略梯度的算法（policy-gradient-based algorithm，比如：REINFORCE），来解决这样的偏差。该论文的主要贡献有：1）将 REINFORCE 扩展到生产环境推荐系统上，动作空间有数百万；2）使用 off-policy correction 来解决在从多种行为策略中收集的日志反馈的数据偏差；3）提出了一种新的 Top-K off-policy correction 来解释我们一次推荐多个 Items 的策略推荐；4）展示了探索的价值我们通过一系列仿真和 Youtube 的多个真实环境，来展示我们的方法的效果。

译者：龚鹤扬

Yang, Longqi, Yin Cui, Yuan Xuan, Chenyang Wang, Serge Belongie, and Deborah Estrin. "Unbiased offline recommender evaluation for missing-not-at-random implicit feedback." In Proceedings of the 12th ACM Conference on Recommender Systems, pp. 279-287. 2018.

翻译摘要：

隐式反馈推荐器 (Implicit-feedback Recommenders, ImplicitRec) 只利用诸如点击这样的积极的“用户-项目”互动来学习个性化用户偏好。不同推荐器通常使用从在线平台收集的数据集进行离线评估和比较。这些平台受到流行度偏差的影响（比如，受欢迎的项目更容易被呈现给用户并得到互动），因此日志的“基准真相数据”（监督学习的标注数据）存在完全非随机缺失(Missing-Not-At-Random, MNAR)。所以被广泛使用的总体平均评估器(Average-Over-All, AOA)在评估受欢迎的项目的准确推荐时是有偏差的。在这篇文章中，我们（a）研究了AOA的评估偏差，以及（b）使用逆倾向评分(Inverse-Propensity-Scoring, IPS)技术为隐式MNAR数据集开发一个无偏且实用的离线评估器。通过使用四个真实世界数据集和四个广泛使用的算法的广泛实验，我们表明（a）流行度偏差广泛出现在项目呈现和互动中；（b）AOA用于评估ImplicitRec时，由于MNAR数据导致的评估偏差在大多数情况下普遍存在；（c）根据平均绝对误差(MAE)，无偏估计显著减少了雅虎音乐数据集中超过30%的AOA评估偏差。

译者：陈天豪

Bonner, Stephen, and Flavian Vasile. "Causal embeddings for recommendation." In Proceedings of the 12th ACM Conference on Recommender Systems, pp. 104-112. 2018.

翻译摘要：

许多现有应用使用推荐的方式来修改自然用户的行为，例如提升销量或网站的浏览时间。这导致了最终的推荐目标与经典设定产生不一致，在经典设置中，通过预测user-item matrix中缺少的条目或最可能的下一个事件，通过与用户过去行为的一致性来评估推荐候选。为了弥补这种不一致，我们优化了一个用于相对用户自然行为增加预期输出的推荐策略。我们展示了这个策略和在完全随机的推荐策略下学习预测推荐输出是等价的。最后，我们提出一种新的领域自适应算法，它从包含偏差推荐策略产生的数据中学习，预测随机推荐策略下的推荐输出。我们将我们的方法和现有的SOTA分解方法进行比较，并且和新的因果推荐方法比较，结果取得了显著的提升。

译者：陈晗曦

2. 会议：RecSys 2020等

RecSys 2020(14th ACM Conference on Recommender Systems Online, Worldwide, 22nd-26th September 2020) 是推荐系统方向最重要的一个会议，它展现了的一个重要趋势是强调 B sias，Ricardo Baeza-Yates 做了一个关于此主题的报告来系统梳理各种不同的 bias 有关研究。

图3: 推荐系统中的 Bias

除了 RecSys 之外，其他与推荐系统相关的重要会议包括 sigkdd, wsdm, sigir 等。

3. 近期社区活动

2020年11月15日上午9点，“因果科学与Causal AI”读书会进行了第8期的线上论文分享，主题是“因果机器学习”。

分享者：郭若城，亚利桑那州立大学在读博士

个人主页：https://www.public.asu.edu/~rguo12

让我们考虑两种动物，会学人说话的鹦鹉和乌鸦喝水中的乌鸦。我们知道鹦鹉只会模仿人类的语音，却不知道语言的意义。而乌鸦可以认识到放入石子就可以使水面上升这一层因果关系。我们可以把鹦鹉看作是能做curve fitting的机器学习模型而把乌鸦看作是体现变量之间因果关系的因果模型。比起问它们谁更聪明，我想更有意义的做法是结合他俩的技能，帮助我们解决实际问题。在机器学习在很多任务中已取得成功的今天，我们想回答的问题是：因果推断能否帮助机器学习在一些任务中做得更好，以及因果推断能否受益于新的机器学习算法？在这次的读书会中，我会从这两个方面来介绍一些现存的结合因果推断和机器学习的研究方向。在传统的利用观测性数据的因果推断中，很多模型往往通过很强的、可能不能被满足的假设来避免考虑hidden confounders。而最近的一些工作中，我们发现利用深度学习模型我们可以利用观测性数据中附带的网络信息弱化这一假设，提升因果推断模型的表现。机器学习模型的一些问题也可以利用其背后的因果模型来解决或者缓解。这里的第一个问题是，如何使神经网络更加鲁棒？从因果性的角度，鲁棒意味着我们要避免学习到spurious correlation？比如在动物图像分类中，骆驼常常出现在沙漠中，如何能避免分类器利用沙漠背景来预测骆驼这个类？最近，在Invariant Risk Minimization (IRM) 这个工作中，作者们把具体问题中因果关系的限制条件转化成了机器学习模型中的inductive bias，从而达到这一目的。而在我们的工作中，我们发现IRM是一个过于宽泛的条件。针对这一问题我们提出了一个简单有效的解决方案。第二个问题是，在使用用户反馈作为标签的机器学习任务中，如何做到利用历史数据在线下对新模型进行评测和优化，使其线上效果得到提升。在最近的推荐系统和搜索的工作中，人们发现把用户反馈标签的因果图融入模型设计将使我们在这一任务中做得更好。

演讲大纲：

Machine learning for causal inference

* Learning causality with networked observational data

Causality-aware machine learning

* Out-of-distribution prediction with causal inductive bias

* Unbiased interactive machine learning

在机器学习已经在很多任务中已经取得成功的今天，我们想回答的问题是：因果推断能否帮助机器学习在一些任务中做得更好以及，因果推断能否受益于新的机器学习算法？在这次的读书会中，郭若城将会从这两个方面来介绍一些现存的结合因果推断和机器学习的研究方向。在传统的利用观测性数据的因果推断中，很多模型往往通过很强的，可能不能被满足的假设来避免考虑hidden confounders。而最近的一些工作中，他们发现利用深度学习模型可以利用观测性数据中附带的网络信息弱化这一假设，提升因果推断模型的表现。

读书会精彩问答：

整理：杨二茶

Q：请问一下若城，是否关注过因果推断和推荐系统match的工作？以及这些工作是否涉及cofounding的问题？

A：用推荐系统的离线数据去match在线distribution曾经有一篇顶会文章叫Causal embedding accommodation用过这个思想。机器学习中提confounding其实是很奇怪的，我们知道，confounding导致bias的原因是因为causal effect estimation。所以当你需要测度T—>Y的因果效应，你去建立confounder的实质是为了建立其他变量的关系，因此，你必须得有数据分布上的变化，才能去解决confounding的问题。机器学习很少去探究一个变量T到另一个变量Y的影响，你只想预测Y而已。推荐系统中也有很多研究，推荐系统对population有什么因果效应，这种情况也是可以通过condition on X来解决。

Q：有没有一些文章来解决bias的问题？举个例子，如果这个场景是给病人吃药，但药有不同成分，不同病人的成分组合不同，对病人抽样有bias，那么我们如果进行debias的工作呢？我们主观上0的分类并不一定是真实场景中的分类？如果我找到一个confounder，但同时confounder又有很多的话，应该如何处理？

A：causal inference的核心解决的就是这个问题，通过control confounder来解决miss的confounder来建模。所以其本质是一个unobserved cofounder的问题，因为你不可能知道所有的confounder，所以你只能尽量发现更多的confounder来预测treatment effect。不控制confounder的话，就很难去掉这种干扰的影响。其实现在，除了随机实验以外，我们还没有其他办法可以去掉其他confounder（对主效应）的影响。

了解读书会具体规则、报名读书会请点击下方文章：因果科学与 Causal AI 系列读书会 | 众包出书

时间：9月20日起，每周日晚19:00-21:00，持续约2-3个月

模式：线上闭门读书会；收费-退款的保证金模式；读书会成员认领解读论文

费用：299元/人

内容安排：

图注：针对读书会的主题，由发起人龚鹤扬设置好了内容框架，每个主题下有一个负责人来负责维护组织相关内容，目前已经定好的如图所示，欢迎对主题感兴趣的联系相关负责人，以及来认领相关主题。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

《因果科学周刊》第4期：因果赋能推荐系统

你可能感兴趣的:(算法,大数据,编程语言,python,机器学习)