python机器学习建模

信用卡欺诈检测：2021 年顶级机器学习解决方案

在公众号「python风控模型」里回复关键字：学习资料

从电子商务支付系统出现的那一刻起，总是有人会找到新的方法来非法获取某人的资金。这已成为现代时代的一个主要问题，因为只需输入您的信用卡信息即可轻松在线完成所有交易。即使在 2010 年代，许多美国零售网站用户在使用两步验证进行网上购物之前就已经成为网上交易欺诈的受害者。当数据泄露导致金钱失窃并最终失去客户忠诚度和公司声誉时，组织、消费者、银行和商家都会面临风险。

2017 年，未经授权的信用卡操作达到了惊人的 1670 万受害者。此外，据美国联邦贸易委员会 (FTC) 报告，2017 年信用卡欺诈索赔数量比上一年高出 40%。加利福尼亚州报告了大约 13,000 起案件，佛罗里达州报告了 8,000 起案件，这两个州是此类犯罪人均最多的州。到 2020 年，所涉金额将超过约 300 亿美元。以下是一些信用卡欺诈统计数据：

机器学习信用卡欺诈检测和传统欺诈检测有什么区别？

基于机器学习的欺诈检测：

自动检测欺诈
实时流媒体
验证方法所需的时间更少
识别数据中隐藏的相关性

常规欺诈检测：

确定方案的决策规则应手动设置。
需要大量时间
需要多种验证方式；从而给用户带来不便
仅发现明显的欺诈活动

什么是信用卡欺诈检测？

“欺诈检测是一系列旨在防止通过虚假借口获取金钱或财产的活动。”

欺诈可以以不同的方式在许多行业实施。大多数检测方法结合了各种欺诈检测数据集，形成有效和无效支付数据的连接概览，以做出决策。该决定必须考虑 IP 地址、地理位置、设备标识、“BIN”数据、全球纬度/经度、历史交易模式和实际交易信息。在实践中，这意味着商家和发卡行部署基于分析的响应，这些响应使用内部和外部数据来应用一组业务规则或分析算法来检测欺诈。

使用机器学习进行信用卡欺诈检测是数据科学团队进行数据调查的过程，并开发了一个模型，该模型将在揭示和防止欺诈交易方面提供最佳结果。这是通过将卡用户交易的所有有意义的特征（例如日期、用户区域、产品类别、金额、供应商、客户的行为模式等）结合在一起来实现的。然后通过一个经过巧妙训练的模型来运行信息，该模型会发现模式和规则以便它可以对交易是欺诈还是合法进行分类。

信用卡诈骗及防范技巧

秩	类别	报告数量
1	互联网服务	62,942
2	信用卡	51,129
3	卫生保健	47,410
4	电视和电子媒体	38,336
5	外币优惠和伪造支票诈骗	27,443
6	计算机设备和软件	18,350
7	投资相关	14,884

克隆交易。

克隆交易通常是一种与原始交易类似的交易或复制交易的流行方法。当组织试图通过向不同部门发送相同的发票来多次从合作伙伴那里获得付款时，就会发生这种情况。

基于规则的欺诈检测算法的传统方法不能很好地将欺诈交易与不规则或错误交易区分开来。例如，用户可能会不小心点击提交按钮两次或订购同一产品两次。
更好的选择是，如果系统能够将欺诈交易与错误交易区分开来。在这里，机器学习方法将更有效地区分由人为错误和真实欺诈引起的克隆交易。

帐户盗窃和可疑交易。

当个人的个人信息（例如社会安全号码、秘密问题答案或出生日期）被犯罪分子窃取时，他们可以使用这些信息进行财务操作。许多欺诈交易都与身份盗用有关，因此金融欺诈预防系统应最关注创建对用户行为的分析。

如果客户付款的方式有一定规律，例如某人每周同一时间访问某个酒吧一次，并且总是花费大约 40 到 60 美元。如果使用同一个帐户在位于城镇另一部分的酒吧支付超过 60 美元的款项，则这种行为将被视为不正常。下一步是向卡号所有者发送验证请求，以验证他或她是否进行了交易。

标准偏差、平均值和高/低值等指标对于发现不规则行为最有用。将单独的付款与个人基准进行比较，以识别具有高标准偏差的交易。然后，如果发生这种偏差，最好的选择是验证帐户持有人。

虚假申请欺诈。

应用程序欺诈通常伴随着帐户/身份盗窃。这意味着某人以另一个人的名义申请新的信用账户或信用卡。首先，犯罪分子窃取将作为其虚假申请的支持证据的文件。

异常检测有助于识别交易是否有任何异常模式，例如日期和时间或商品数量。如果算法发现这种异常行为，银行账户的所有者将受到一些验证方法的保护。

信用卡略读（电子或手动）。

信用卡窃取是指使用可读取和复制原始卡信息的设备制作信用卡或银行卡的非法副本。欺诈者使用名为“撇渣器”的机器提取卡号和其他信用卡信息，将其保存并转售给犯罪分子。

与身份盗窃的情况一样，通过电子或手动卡的副本进行的可疑交易将因交易信息而被披露。分类技术可以根据硬件、地理位置和有关客户行为模式的信息来定义交易是否具有欺诈性。

帐户接管。

欺诈者可以向持卡人发送欺骗性电子邮件。这些消息看起来非常合法（例如，非常相似的银行 URL 和值得信赖的徽标），就好像它们是由银行发送的一样。实际上，此类消息可用于窃取某人的个人信息、银行帐号和在线密码。如果您点击错误的链接或提供有价值的信息以响应来自虚假银行网站的消息，则在几个小时内，您的银行账户将被犯罪分子转移到他们持有的账户中。

为了避免这种欺诈模式，人工智能驱动的解决方案依赖于神经网络或模式识别。神经网络可以学习可疑的模式以及检测类别和集群以使用这些模式进行欺诈检测。

信用卡诈骗是如何发生的？

信用卡欺诈通常是由于持卡人对其数据的疏忽或网站安全性遭到破坏。这里有些例子：

消费者向不熟悉的人透露他的信用卡号。
卡片丢失或被盗，被其他人使用。
邮件从目标收件人处窃取并被犯罪分子使用。
企业员工复制其所有者的卡片或卡号。
制作假信用卡。

当您的卡丢失或被盗时，可能会发生未经授权的收费；换句话说，发现它的人使用它进行购买。不法分子还可以伪造您的姓名并使用该卡或通过手机或电脑订购一些商品。此外，还存在使用假信用卡的问题——一张具有从持有人那里窃取的真实账户信息的假卡。这是特别危险的，因为受害者拥有他们的真实卡，但不知道有人复制了他们的卡。这种欺诈性卡片看起来非常合法，并且带有原始卡片的标识和编码磁条。欺诈性信用卡通常在多次成功付款后被犯罪分子销毁，就在受害者意识到问题并报告之前。

信用卡欺诈检测系统和实施人工智能欺诈检测系统的步骤

信用卡欺诈检测系统：

从第三方反欺诈公司提取的现成欺诈风险评分。
从先前数据中学习并估计欺诈性信用卡交易的概率的预测机器学习模型。
设置交易必须通过才能获得批准的条件的业务规则（例如，没有 OFAC 警报、SSN 匹配、低于存款/取款限额等）。

在这些欺诈分析技术中，预测性机器学习模型属于智能互联网安全解决方案。

AI欺诈检测系统实施步骤：

数据挖掘。意味着对数据进行分类、分组和分段，以搜索数百万笔交易以查找模式并检测欺诈。
模式识别。意味着检测可疑行为的类别、集群和模式。此处的机器学习代表选择最适合某个业务问题的模型/模型集。例如，神经网络方法有助于自动识别欺诈交易中最常见的特征；如果您有大量交易样本，此方法最有效。

一旦机器学习驱动的欺诈保护模块被集成到电子商务平台中，它就会开始跟踪交易。每当用户请求交易时，它都会被处理一段时间。根据预测的欺诈概率水平，存在三种可能的结果：

如果概率小于 10%，则允许交易。
如果概率介于 10% 和 80% 之间，则应应用额外的身份验证因素（例如一次性 SMS 代码、指纹或秘密问题）。
如果概率超过 80%，则交易被冻结，因此应手动处理。

使用基于 AI 的方法进行支付欺诈检测的要求

要为信用卡欺诈分析运行 AI 驱动的策略，应满足许多关键要求。这些将确保模型达到其最佳检测分数。

数据量。

训练高质量的机器学习模型需要大量的内部历史数据。这意味着如果您之前没有足够的欺诈和正常交易，则很难在其上运行机器学习模型，因为其训练过程的质量取决于输入的质量。因为很少有训练集包含两个类中等量的数据样本的情况，所以使用降维或数据增强技术。

数据质量。

模型可能会因历史数据的性质和质量而存在偏差。这种说法意味着，如果平台维护者没有对数据进行整齐、适当的收集和排序，甚至将欺诈交易的信息与正常交易的信息混合在一起，那么很可能会导致模型结果出现重大偏差。

因素的完整性。

如果您有足够多的结构良好且无偏见的数据，并且您的业务逻辑与机器学习模型完美匹配，那么欺诈检测很可能对您的客户和您的业务有效。

先进的信用卡欺诈识别方法及其优势

高级信用卡欺诈识别方法分为：

无监督。如PCA、LOF、One-class SVM、Isolation Forest。
监督。例如决策树（例如 XGBoost 和 LightGBM）、随机森林和 KNN。

我们已经介绍了机器学习用于欺诈检测的工作原理的基本愿景。现在让我们深入研究使之成为可能的确切模型。

无监督。

无监督机器学习方法使用未标记的数据来查找信用卡欺诈检测数据集中的模式和依赖关系，从而可以通过相似性对数据样本进行分组，而无需手动标记。

**PCA（主成分分析）**可以执行探索性数据分析，以揭示数据的内部结构并解释其变化。PCA 是最流行的异常检测技术之一。

PCA 搜索特征之间的相关性——在信用卡交易的情况下，可能是时间、地点和花费的金额——并确定哪些值的组合会导致结果的可变性。这种组合的特征值允许创建名为主_成分_的更紧密的特征空间。

**LOF（Local Outlier Factor）**是帮助了解某个数据样本成为异常值（异常）的可能性有多大的分数因子。这是另一种最流行的异常检测方法。

为了计算 LOF，考虑相邻数据点的数量来计算其密度并将其与其他数据点的密度进行比较。如果某个数据点与其近邻相比具有低得多的密度，则它是一个异常值。

**一类 SVM（支持向量机）**是一种分类算法，有助于识别数据中的异常值。该算法允许人们处理与数据不平衡相关的问题，例如欺诈检测。

One-class SVM 背后的想法是仅对大量合法交易进行训练，然后通过将每个新数据点与它们进行比较来识别异常或新奇事物。

**隔离森林 (IF)**是决策树系列中的一种异常检测方法。IF 区别于其他流行的异常值检测算法的主要思想是它精确检测异常而不是分析正数据点。隔离森林由决策树构建，其中数据点的分离首先发生，因为在所选特征的最小值和最大值中随机选择一个分割值。

随后，如果我们有一组合法交易，隔离森林算法将根据它们的价值来定义欺诈性信用卡交易——这通常与正交易的价值非常不同（即它们发生在离正常数据点更远的地方）特征空间）。

监督

有监督的 ML 方法使用标记的数据样本，因此系统将预测这些标记在未来数据之前看不见。在受监督的 ML 欺诈识别方法中，我们定义了决策树、随机森林、KNN 和朴素贝叶斯。

K-Nearest Neighbors是一种分类算法，它根据多维空间中的距离计算相似性。因此，数据点将被分配到最近邻居所具有的类别。

这种方法不易受到噪声和数据点缺失的影响，这意味着可以在更短的时间内组成更大的数据集。此外，它非常准确，并且需要开发人员进行较少的工作来调整模型。

**XGBoost (Extreme Gradient Boosting)和Light GBM (Gradient Boosting Machine)**是一种单一类型的梯度提升决策树算法，它的创建是为了速度以及最大化计算时间和内存资源的效率。该算法是一种混合技术，其中添加新模型以修复由现有模型引起的错误。

Light GBM 与其他基于树的技术的不同之处仅在于它遵循叶子方向而不是水平方向来构建条件（图 1,2）。一般来说，所有基于树的梯度提升算法背后的思想都是一样的。

为了将交易归类为欺诈性费用，许多决策树的结果（概率）被汇总——而每个未来的决策树都根据其前辈所犯的错误来改进其结果。

随机森林是一种由许多决策树组成的分类算法。每棵树都有带条件的节点，这些节点定义了基于最高值的最终决策。

用于欺诈检测和预防的随机森林算法有两个主要因素，使其擅长预测事物。第一个是随机性，这意味着数据的行和列是从数据集中随机选择的，并适合不同的决策树。假设树 1 接收前 1,000 行，树 2 接收 4,000 到 5,000 行，而树 3 有 8,000 到 9,000 行。

第二个因素是多样性，这意味着有一片树林有助于最终决策，而不仅仅是一棵决策树。这里最大的优势是这种多样性降低了模型过度拟合的机会，而_偏差_保持不变。

可以使用不同的 ML 模型来检测欺诈；它们中的每一个都有其优点和缺点。有些模型很难解释、解释和调试，但它们具有很好的准确性（例如神经网络、Boosting、Ensembles 等）；其他的更简单，因此它们可以很容易地被解释和可视化为一堆规则（例如决策树）。

每当有新数据到达时，不断训练欺诈检测模型非常重要，因此可以学习新的欺诈模式/模式并尽早检测欺诈数据。关于更多风控模型知识，请参考《python金融风控评分卡模型和数据分析》，提供逻辑回归评分卡，集成树xgboost，lightgbm，catboost，svm，神经网络等诸多主流算法实战案例。

常见的信用卡欺诈问题

让我们回答一些经常与信用卡欺诈相关的有趣问题。

谁应对信用卡欺诈负责？

在美国，联邦法律（即《公平信用账单法案》）为持卡人设定了 50 美元的责任限额，无论未经授权的用户收取多少费用。此规则适用于不安全的在线连接或数据泄露的情况。

如果受害者在未经授权的交易发生之前报告卡丢失或被盗，他或她将不承担任何费用。

个人信息被盗是很危险的，因为虽然受害者不承担任何经济损失，但他或她可能会花几年时间处理犯罪分子造成的所有金融和信用欺诈。

银行会调查信用卡欺诈吗？

在用户通知银行他或她注意到可疑的信用卡交易后，银行会开始信用卡欺诈调查。

受害者必须立即通知银行有关欺诈交易的信息，并且不得迟于事件发生后的 60 天。他或她必须提供有关损失的确切金额、日期以及交易看似欺诈的原因的描述的信息。然后，银行开始调查，必须在不超过 45 天内解决。如果 10 天后银行发现欺诈确实发生，银行必须向受害者赔偿被盗的金额。

银行必须将调查结果书面通知持卡人。如果这些文件影响了银行的决定，持卡人有权要求银行在调查过程中创建或收集的任何文件的副本。

总结

欺诈是整个信用卡行业的一个主要问题，随着电子货币转账的日益普及，该行业变得越来越大。为有效防范导致银行账户信息泄露、盗刷、伪造信用卡、每年数十亿美元被盗以及声誉和客户忠诚度损失的犯罪行为，信用卡发卡机构应考虑实施高级信用信用卡欺诈预防和欺诈检测方法。基于机器学习的方法可以根据每个持卡人的行为信息不断提高欺诈预防的准确性。

Python 18.3 async/await weixin_34221332 python
async/await用asyncio提供的@asyncio.coroutine可以把一个generator标记为coroutine类型，然后在coroutine内部用yieldfrom调用另一个coroutine实现异步操作。为了简化并更好地标识异步IO，从Python3.5开始引入了新的语法async和await，可以让coroutine的代码更简洁易读。请注意，async和await是针对c
AGI的决策系统：从短期反应到长期规划 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
文章标题：AGI的决策系统：从短期反应到长期规划关键词：AGI，决策系统，短期反应，长期规划，算法模型，系统集成摘要：本文旨在深入探讨人工智能（AGI）决策系统的设计和实现，重点从短期反应到长期规划的转变。首先，我们将回顾AGI的发展历程和决策系统的基本概念，接着详细解析短期反应系统和长期规划系统的原理与实现。随后，本文将探讨如何将两种系统有效集成，并讨论数据收集与处理、机器学习模型在决策中的应用
详解Python Google Protocol Buffer 职场亮哥
本篇主要介绍如何在Python语言中使用GoogleProtocolBuffer（后续都简写为PB），包括以下几个部分：为什么要使用PB？安装GooglePB自定义.proto文件编译.proto文件解析目标py文件序列化和反序列化更复杂的Message动态编译为什么要使用PB？PB（ProtocolBuffer）是Google开发的用于结构化数据交换格式，作为腾讯云日志服务标准写入格式。因此用于
ML .NET 二手车价格预测之评估（三） zLulus C#.net 机器学习深度学习
在模型生成后，可以通过Evaluate方法进行评估//注意，这里使用txt或者tsv格式的文件stringtestCsvPath=Path.Combine(AppDomain.CurrentDomain.BaseDirectory,"TrainData","test-data2.txt");stringmodelDirectory=Path.Combine(AppDomain.CurrentDom
大语言模型LLM基础扫盲速通版 SmallerFL NLP&机器学习语言模型人工智能自然语言处理 llm chatgpt
文章目录1.什么是LLM？2.LLM如何工作？3.LLM开发的关键里程碑4.训练可用LLM模型的完整流程5.LLM具备的能力6.领先的LLM模型包含哪些？7.建议从头开始训练LLM吗？8.LLM的训练数据源包含哪些？9.其他关于LLM的常见问题9.1Transformer在LLM中有何意义？9.2在LLM中，微调(fine-tuning)是什么？9.3模型大小如何影响LLM的性能？9.4LLM能生
BFCL介绍以及本地模型评测大致流程 SmallerFL NLP&机器学习 llm functioncall toolcall bfcl
文章目录1.BFCL介绍2.主要构成2.1架构图2.2代码组成2.2数据类型3.评测本地模型3.1增加handler3.2增加配置3.2.1配置bfcl/model_handler/handler_map.py3.2.2配置bfcl/eval_checker/model_metadata.py3.2.3（可选）配置bfcl/constant.py4.启动评测1.BFCL介绍BerkeleyFunc
Python 安装库报错 “python setup.py egg_info did not run successfully.“ SmallerFL 其他问题 fix Mac 环境设置安装 Python相关 python 开发语言人工智能 nlp
文章目录1.Python安装库报错2.问题解决3.参考1.Python安装库报错有时Python用pipinstall安装库的时候会报错，pythonsetup.pyegg_infodidnotrunsuccessfully.，我在安装deepspeed报错示例如下：Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-er
【AI技术】Edge-TTS 国内使用方法一者仁心 AI AI编程 TTS
介绍：TTS软件效果里，微软推出的免费使用的Edge-TTS平台是效果比较好的，但是目前该平台开始对国内阻止使用了。这里给大家和我一样使用该python库的小伙伴一个临时的解决方法。提示：建议大家还是要么迁移到国内的收费平台或者是一些免费的开源框架（paddlespeech、gpt-sovits）解决方案：这个TTS服务在Edge浏览器中其实也有嵌入，并且国内一样可以使用，经过和官方的访问地址对比
2023第十四届蓝桥杯Python大学生A组真题？（真题+附链接）大C爱编程蓝桥杯职场和发展
第十四届蓝桥杯大赛软件赛省赛Python大学A组试题A:特殊日期本题总分：5分【问题描述】记一个日期为yy年mm月dd日，统计从2000年1月1日到2000000年1月1日，有多少个日期满足年份yy是月份mm的倍数，同时也是dd的倍数。【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数，在提交答案时只填写这个整数，填写多余的内容将无法得分。试题B:分糖果本题总分：5
Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型伊织产研 Firefly-LLaMA2 LLaMA-2
文章目录关于模型列表&数据列表训练细节增量预训练&指令微调数据格式&数据处理逻辑增量预训练指令微调模型推理权重合并模型推理部署关于github:https://github.com/yangjianxin1/Firefly-LLaMA2-Chinese本项目与Firefly一脉相承，专注于低资源增量预训练，既支持对Baichuan2、Qwen、InternLM等原生中文模型进行增量预训练，也可对L
Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理 lichunericli 人工智能 pytorch llama
原文地址：meta-llama-3-optimized-cpu-inference-with-hugging-face-and-pytorch了解在CPU上部署Meta*Llama3时如何减少模型延迟2024年4月19日万众期待的Meta第三代Llama发布了，我想确保你知道如何以最佳方式部署这个最先进的（SoTA）LLM。在本文中，我们将重点讨论如何执行只权重量化（WOQ）来压缩8B参数模型并改
vLLM-prefix浅析（System Prompt，大模型推理加速） javastart aigc 大模型 prompt prompt transformer 性能优化 AIGC
原文：vLLM-prefix浅析（SystemPrompt，大模型推理加速）简介本文浅析了在大模型推理加速方面一个非常优秀的项目vLLM的一个新特性Prefix。在Prompt中有相同前缀时可以提高吞吐量降低延迟，换句话说可以省去这部分相同前缀在自注意力阶段的重复计算。更新2024.1.18：Prefix已经合并到主分支上了！如果你的vLLM不能使用也许是时候升级一下体验下新功能哩！https:/
Llama3本地部署的解决方案 herosunly llama3 llama 本地部署 API 解决方案
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了Llama3本地部署的解决方案，希望对学习大语言模型的同学们有所帮助。文
Qwen1.5：使用VLLM加速推理模型（包含：OpenAI如何调用）写bug如流水大模型 vllm Qwen1.5 openAI
如何安装和配置VLLM库在开始使用VLLM库之前，首先需要确保安装正确的版本。以下指南将帮助你完成安装和配置。安装VLLM库根据你的需求选择合适的版本进行安装。如果你只需要基本功能，可以安装版本0.3。使用以下命令安装：pipinstallvllm==0.3如果你需要使用GPTQ-int8量化模型，那么应该安装0.4或更高版本：pipinstallvllm>=0.4启动模型服务在安装完毕后，可以通
如何使用Llama-2-7b-chat-hf模型进行对话生成娄泳含
如何使用Llama-2-7b-chat-hf模型进行对话生成Llama-2-7b-chat-hf项目地址:https://gitcode.com/mirrors/NousResearch/Llama-2-7b-chat-hf引言在当今的数字化时代，自然语言处理（NLP）技术的发展日新月异，对话生成模型作为其中的重要组成部分，已经在多个领域展现出巨大的应用潜力。无论是智能客服、虚拟助手，还是教育辅导
PyOxidizer：现代Python应用打包与分发工具胡霆圣
PyOxidizer：现代Python应用打包与分发工具PyOxidizerAmodernPythonapplicationpackaginganddistributiontool项目地址:https://gitcode.com/gh_mirrors/py/PyOxidizerPyOxidizer是一个用于生成内嵌Python解释器的二进制文件的实用工具，主要使用Rust编程语言开发，同时也包含一
探索Llama Recipes：Meta Llama模型的实用示例库郁英忆
探索LlamaRecipes：MetaLlama模型的实用示例库去发现同类优质开源项目:https://gitcode.com/在机器学习和自然语言处理的世界中，MetaLlama模型是一颗璀璨的新星，以其强大的对话理解和生成能力而受到广泛关注。现在，有了llama-recipes这个开源项目，开发者可以轻松上手并充分利用这些模型。本文将引导您了解这个项目，它的技术优势，适用场景以及鲜明特点。项目
ML.NET速览 aixing8475 人工智能操作系统 runtime
什么是ML.NET？ML.NET是由微软创建，为.NET开发者准备的开源机器学习框架。它是跨平台的，可以在macOS，Linux及Windows上运行。机器学习管道ML.NET通过管道(pipeline)方式组合机器学习过程。整个管道分为以下四个部分：LoadData加载数据TransformData转换数据ChooseAlgorithm选择算法TrainModel训练模型示例建立一个控制台项目。
深入解析vLLM：加速大模型推理的高效框架秋声studio 口语化解析人工智能模型调优 nlp vLLM
深入解析vLLM：加速大模型推理的高效框架引言在现代深度学习应用中，大型语言模型（如GPT、GLM、LLaMA、Qwen等）的推理速度和资源利用率成为关键挑战。vLLM(VirtualLargeLanguageModel)是由伯克利大学LMSYS组织开源的大语言模型高速推理框架，旨在极大地提升实时场景下的语言模型服务的吞吐量与内存使用效率。本文将深入探讨vLLM的工作原理及其优化技术。一、vLLM
将Python程序打包为Windows可执行文件格式 CherylNatsu Python 技术文档 python windows extension microsoft parsing exe
花一天时间随便找了几篇文章入门Python，并且写了几个Python小程序想和朋友分享一下顺便推荐这个很棒的编程语言，但是遗憾的是朋友的电脑没有安装Python，而且还是用Windows系统，所以最好的办法是把Python程序转换为Windows上的可执行文件。首先要下载“适当版本“的Python：http://www.python.org/getit/还需要一个叫py2exe的程序：http:/
JVM - 内存划分、类加载、GC 机制、常见参数、简单调优陈亦康面试总结 jvm 面试
目录前言一、JVM内存划分二、类加载2.1、类加载是在干什么？2.2、类加载的过程2.3、何时触发类加载？2.4、双亲委派模型（重点考察）2.4.1、什么是双亲委派模型？2.4.2、涉及到的类加载器2.4.3、详细过程图解三、GC（垃圾回收机制）3.1、STW问题（StopTheWorld）3.2、GC回收哪部分内存？3.3、垃圾对象的判定算法3.3.1、引用计数法（非JVM采取的办法）3.3.2
Redis、MongoDB 和 MySQL评估 wdxylb redis mongodb mysql
Redis、MongoDB和MySQL是三种不同类型的数据库系统，各自有独特的特点和适用场景。MySQL是一个关系型数据库管理系统（RDBMS），而Redis和MongoDB是非关系型数据库（NoSQL）。以下是对这三者的比较以及它们在实际应用中的使用情况。RedisvsMySQL类型和数据模型：Redis：内存数据库（也可以持久化到磁盘）。支持多种数据结构（字符串、哈希、列表、集合、有序集合等）
字节启动AGI长期研究计划，代号Seed Edge 大力财经 agi edge 前端
1月23日，据媒体报道，字节豆包大模型团队已在内部组建AGI长期研究团队，代号“SeedEdge”，鼓励项目成员探索更长周期、具有不确定性和大胆的AGI研究课题。接近字节的知情人士透露，SeedEdge的目标是探索AGI的新方法，代号名中Seed是豆包大模型团队名称，Edge代表最前沿的AGI探索。SeedEdge鼓励跨模态、跨团队合作，为项目成员提供宽松的研究环境，实行采用更长周期的考核方式，以
Streamlit，一个超强的 Python 应用开发库！一行玩python python 开发语言
大家好，我是“一行”。今天，我们要来聊一个非常酷的Python库——Streamlit。如果你有过构建Web应用的经验，或者你对快速搭建交互式应用感兴趣，那么Streamlit会是一个非常棒的工具。它可以让你用极少的代码，快速创建出功能强大且美观的Web应用。无论你是数据分析师、机器学习工程师，还是Python初学者，Streamlit都能帮你轻松实现数据可视化、模型展示等功能。今天我们就从基础开
python 开发app 三希 python 开发语言
在Python中开发应用程序（通常指的是移动应用）有多种方法。以下是两种常见的技术栈：KivyKivy是一个开源Python库，用于快速开发跨平台的触控应用。它支持Android、iOS、Windows、MacOS和Linux。以下是使用Kivy开发的基本步骤：1.安装Kivy:在命令行中使用pip安装Kivy：pipinstallkivy2.创建你的应用:创建一个简单的Python文件，比如ma
大数据Lambda架构奋进学堂系统架构设计师考试架构
Lambda架构介绍Lambda是用于同时处理离线和实时数据，可容错、可扩展的分布式系统架构。有批处理层、加速层、服务层。同时以流计算和批处理计算合并视图。Lambda架构的批处理层采用不可变存储模型，不断地往主数据集后追加新的数据。Lambda架构优缺点<
在Python中实现一个简单的社交媒体应用清水白石008 Python题库 python python 媒体开发语言
在Python中实现一个简单的社交媒体应用社交媒体应用是现代互联网的重要组成部分，允许用户分享信息、交流和互动。在这篇博文中，我们将使用Python构建一个简单的社交媒体应用，涵盖用户注册、发布动态、评论和查看动态等基本功能。我们将使用Flask框架作为后端，SQLite作为数据库，前端使用HTML和Bootstrap进行简单的界面设计。一、项目准备1.环境设置首先，确保你已经安装了Python和
Python的那些事第二篇：编程界的“交通规则”基本语法与编程的“食材”和“容器”数据类型与变量暮雨哀尘 Python的那些事 python vscode visual studio pycharm 开发语言 windows
摘要Python以其简洁易懂的语法和强大的功能，成为了编程界的“小白福音”。本文将带你从Python的基本语法入手，深入探讨标识符命名规则、缩进的重要性、注释的使用，以及数据类型与变量的定义和操作。通过幽默的语言和丰富的实例代码，我们将一步步揭开Python的神秘面纱，让你在轻松愉快的氛围中掌握这门强大的编程语言。1.Python基本语法1.1标识符命名规则在Python的世界里，标识符就像是给变
【使用PyQt创建美观和功能丰富界面】 Dreams°123 pyqt microsoft python
使用PyQt创建美观和功能丰富界面-适用于APP一、基本概念与环境搭建二、布局管理三、部件使用与定制四、信号与槽机制深入应用五、样式表（stylesheet）和主题应用一、基本概念与环境搭建安装PyQt使用以下命令安装PyQt：pipinstallPyQt5（如果使用Python3）。理解信号与槽机制信号（Signal）：是对象发出的事件通知，例如按钮的点击、文本框内容的改变等。槽（Slot）：是
python+selenium获取cookie session_Python3+Selenium获取session和token供Requests使用教程 weixin_39997695 session
#!/usr/bin/python3#coding:utf-8importtimefromseleniumimportwebdriverfromselenium.webdriver.support.waitimportWebDriverWaitfromselenium.webdriver.supportimportexpected_conditionsasECfromselenium.webdri
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S