dzysunshine

FinGPT——金融领域开源大模型

文章目录

背景
论文摘要
相关工作
- 大型语言模型（LLMs）和ChatGPT
- 金融领域的LLMs
- 为什么需要开源的金融LLMs？
以数据为中心的方法用于FinLLMs
- 金融数据和独特特性
- 应对处理金融数据的挑战
FINGPT 概述：FINLLM 的开源框架
- 数据来源
- 面向金融NLP的实时数据工程流程
- 大型语言模型（LLM）
- 应用
结论
未来工作

背景

FinGPT 是2023年6月哥伦比亚大学联合上海纽约大学推出全新大模型产品，这是一款面向金融领域的大模型产品。

论文：https://arxiv.org/abs/2306.06031
github：https://github.com/AI4Finance-Foundation/FinGPT

论文摘要

大型语言模型（LLMs）展示了在不同领域中革新自然语言处理任务的潜力，引发了金融领域的极大兴趣。获取高质量的金融数据是金融语言模型（FinLLMs）面临的首要挑战。虽然像BloombergGPT这样的专有模型利用了其独特的数据积累优势，但目前需要一些开源的替代方案，以实现互联网规模的金融数据的民主化。

在本文中，我们介绍了一个针对金融行业的开源大型语言模型FinGPT。与专有模型不同，FinGPT采用了以数据为中心的方法，为研究人员和实践者提供了可访问和透明的资源来开发他们的FinLLMs。我们强调了自动数据筛选流程和轻量级低秩适应技术在构建FinGPT中的重要性。此外，我们展示了一些潜在的应用，例如机器人顾问、算法交易和低代码开发。通过开源AI4Finance社区的协作努力，FinGPT旨在刺激创新，民主化FinLLMs，并在开放金融中开辟新的机会。两个相关的代码库分别是：https://github.com/AI4Finance-Foundation/FinGPT，https://github.com/AI4Finance-Foundation/FinNLP。

人工智能的持续扩展和演进为大型语言模型的普及提供了肥沃的土壤，从而在不同领域的自然语言处理中带来了一场变革性的转变。这一巨大的变化引发了人们对这些模型在金融领域潜在应用的浓厚兴趣。然而，很明显，获取高质量、最新的相关数据是开发高效的开源金融语言模型的关键因素。

在金融领域利用语言模型面临着复杂的障碍。这些障碍包括获取数据的困难、处理多样化的数据格式和类型、处理数据质量的不一致性，以及对最新信息的基本需求。特别是，由于不同的数据介质，如Web平台、API、PDF文档和图像，历史或专业金融数据的提取变得复杂。

在专有领域，像BloombergGPT这样的模型利用其对专业数据的独占访问来训练针对金融领域的语言模型。然而，其数据收集和训练协议的限制性可访问性和透明性凸显了对更开放和包容性的替代方案的需求。为了满足这一需求，我们正在见证向开源领域中民主化互联网规模的金融数据的趋势转变。

在本文中，我们针对与金融数据相关的上述挑战，并介绍了一个名为FinGPT的端到端开源框架，用于构建金融领域的大型语言模型（FinLLMs）。FinGPT采用以数据为中心的方法，强调数据获取、清理和预处理在开发开源FinLLMs中的关键作用。通过倡导数据可访问性，FinGPT旨在促进金融领域的研究、协作和创新，为开放金融实践铺平道路。

我们的贡献总结如下：

民主化：作为一个开源框架，FinGPT旨在民主化金融数据和FinLLMs，揭示开放金融中未开发的潜力。

以数据为中心的方法：认识到数据筛选的重要性，FinGPT采用了以数据为中心的方法，并实施了严格的数据清理和预处理方法，以处理各种数据格式和类型，从而确保高质量的数据。

端到端框架：FinGPT采用了一个全面的框架，用于构建FinLLMs，包括四个层次：

（1）数据源层：该层确保全面的市场覆盖，并通过实时信息捕获来解决金融数据的时间敏感性。

（2）数据工程层：为实时NLP数据处理进行了优化，该层应对金融数据中的时间敏感性和低信噪比的固有挑战。

（3）LLMs层：该层专注于一系列的微调方法，减轻金融数据的高度动态性，确保模型的相关性和准确性。

（4）应用层：展示实际应用和演示，该层突出了FinGPT在金融领域的潜在能力。

以数据为中心的方法用于FinLLMs

对于金融大型语言模型（FinLLMs），成功的策略不仅仅依赖于模型架构的能力，而且同样依赖于训练数据。我们的数据中心方法优先考虑收集、准备和处理高质量的数据。

金融数据和独特特性

金融数据来自各种不同的来源，具有独特的特性。我们深入探讨了不同金融数据来源的具体细节，例如金融新闻、公司报告、社交媒体讨论和公司公告。

金融新闻，提供了有关世界经济、特定行业和个别公司的重要信息。这种数据来源通常具有以下特点：

及时性：金融新闻报道具有及时性和最新性，通常捕捉到金融世界中最近的发展动态。
动态性：金融新闻中所包含的信息是动态变化的，会随着经济条件和市场情绪的演变而迅速变化。
影响力：金融新闻对金融市场具有重大影响力，影响着交易员的决策，有可能导致剧烈的市场波动。

公司报告和公告，是企业向监管机构提交的官方文件，提供了有关公司的财务状况和战略方向的见解。这些文件具有以下特点：

细节度：这些文件提供了关于公司财务状况的详细信息，包括资产、负债、收入和盈利能力等方面的数据。
可靠性：公司报告包含由监管机构审核的可靠和经过验证的数据。
周期性：公司报告是周期性的，通常每季度或每年提交一次，定期提供公司财务状况的快照。
影响力：公司公告常常对市场产生重大影响，影响股价和投资者情绪。

与金融相关的社交媒体讨论，可以反映公众对特定股票、行业或整体市场的情绪。这些讨论往往呈现出以下特点：

多样性：社交媒体讨论在语调、内容和质量上差异很大，因此它们是丰富而复杂的信息源。
实时情绪：这些平台通常能够捕捉到实时的市场情绪，可以检测到公众舆论的趋势和变化。
波动性：在社交媒体上表达的情绪可以非常波动，对新闻事件或市场变动作出迅速反应。

趋势，往往可以通过像Seeking Alpha、Google Trends和其他面向金融的博客和论坛等网站观察到，它们提供了对市场动向和投资策略的关键见解。它们具有以下特点：

分析师观点：这些平台提供了来自经验丰富的金融分析师和专家的市场预测和投资建议。
市场情绪：这些平台上的讨论可以反映出对特定证券、行业或整体市场的集体情绪，为了解当前市场情绪提供了宝贵的见解。
广泛覆盖：趋势数据涵盖了多样的证券和市场领域，提供了全面的市场覆盖。

每个数据来源都提供了对金融世界的独特见解。通过整合这些多样化的数据类型，像FinGPT这样的金融语言模型可以促进对金融市场的全面理解，并支持有效的金融决策。

应对处理金融数据的挑战

我们将处理金融数据面临的三个主要挑战总结如下：

高度的时间敏感性：金融数据具有高度的时间敏感性。市场影响力的新闻或更新一经发布，投资者仅有短暂的时间窗口来最大化他们的α值（衡量投资相对回报的指标）。

高度的动态性：金融领域不断演变，每天都有大量的新闻、社交媒体帖子和其他与市场相关的信息涌现。频繁重新训练模型以适应这些变化是不现实且成本高昂的。

低信噪比：金融数据通常表现出较低的信噪比，这意味着有用的信息往往被大量的无关或噪音数据所淹没。从这些海量信息中提取有价值的见解需要先进的技术手段。

解决这些挑战对于有效利用财务数据和最大限度地发挥FinLLMs的潜力至关重要。

FINGPT 概述：FINLLM 的开源框架

FinGPT代表了一个创新的开源框架，专门用于在金融领域应用大型语言模型（LLMs）。如图1所示，FinGPT由四个基本组件组成：数据源、数据工程、LLMs和应用程序。每个组件在维护FinGPT的功能和适应性方面发挥着关键作用，以应对动态的金融数据和市场状况。

数据源层：FinGPT流程的起点是数据源层，该层协调从各种在线来源获取广泛的金融数据。通过整合来自新闻网站、社交媒体平台、财务报表、市场趋势等数据，确保全面的市场覆盖。目标是捕捉市场的每一个细微差别，从而应对金融数据固有的时间敏感性。

数据工程层：该层专注于实时处理自然语言处理（NLP）数据，以解决金融数据中的高时间敏感性和低信噪比的挑战。它采用最先进的NLP技术来过滤噪声并突出最重要的信息。

LLMs层：作为核心层，它涵盖了各种微调方法，重点是轻量级调整，以保持模型的更新和相关性。通过保持更新的模型，FinGPT可以处理高度动态的金融数据，确保其回应与当前的金融环境保持一致。

应用程序层：FinGPT的最后一个组件是应用程序层，旨在展示FinGPT的实际应用性。它提供金融任务的实践教程和演示应用程序，包括机器人顾问服务、量化交易和低代码开发。这些实际演示不仅为潜在用户提供指导，还强调了LLMs在金融领域的变革潜力。

数据来源

FinGPT的第一个阶段涉及从各种在线来源收集广泛的金融数据。这些来源包括但不限于：

金融新闻：诸如路透社、CNBC、雅虎财经等网站是丰富的金融新闻和市场更新的来源。这些网站提供有关市场趋势、公司收益、宏观经济指标和其他金融事件的宝贵信息。

社交媒体：Twitter、Facebook、Reddit、微博等平台提供了大量关于公众情绪、热门话题和对金融新闻和事件的即时反应的信息。

报告文件：金融监管机构的网站，如美国证券交易委员会（SEC），提供公司报告文件的访问。这些报告文件包括年度报告、季度盈利报告、内幕交易报告和其他重要的公司特定信息。证券交易所的官方网站（如纽约证券交易所、纳斯达克、上海证券交易所等）提供了关于股票价格、交易量、公司上市、历史数据和其他相关信息的重要数据。

趋势数据：网站，如Seeking Alpha、Google Trends和其他金融专注的博客和论坛，提供分析师的观点、市场预测、特定证券或市场领域的动态以及投资建议。

学术数据集：提供经过精心策划和验证的信息，用于复杂的金融分析的基于研究的数据集。
为了利用这些多样化数据源的丰富信息，FinGPT采用了能够从结构化和非结构化数据中进行数据获取的工具，包括API、网络抓取工具和直接访问数据库（如果可用）。此外，系统设计旨在遵守这些平台的服务条款，确保数据收集是合法和合规的。

数据API：在FinGPT框架中，API不仅用于初始数据收集，还用于实时数据更新，确保模型训练使用的是最新的数据。此外，实施了错误处理和速率限制策略，以尊重API的使用限制，并避免数据流中的中断。

面向金融NLP的实时数据工程流程

金融市场实时运作，对新闻和情绪高度敏感。证券价格可以因为新信息的出现而迅速变动，而处理信息的延迟可能导致错失机会或增加风险。因此，在金融NLP中，实时处理至关重要。

实时NLP流程的主要挑战在于高效管理和处理持续涌入的数据。流程的第一步是建立一个系统来实时接收数据。这些数据可以从我们的数据源API中实时获取。下面是设计数据获取的实时NLP流程的步骤：

数据清洗：实时数据可能含有噪声和不一致性。因此，实时数据清洗包括删除不相关的数据、处理缺失值、文本归一化（如转换为小写）和错误纠正。

分词：在实时应用中，需要即时进行分词。这涉及将文本流分解为更小的单元或标记。
停用词去除和词干提取/词形还原：对于实时处理，可以使用预定义的停用词列表从标记流中过滤掉这些常见词。同样，可以应用词干提取和词形还原技术将单词缩减为其词根形式。

特征提取和情感分析：特征提取涉及将原始数据转化为机器学习模型可理解的输入。在实时系统中，这通常需要是一个快速高效的过程。可以使用TF-IDF、词袋模型或嵌入向量（如Word2Vec）等技术。还可以对清洗后的数据进行情感分析，将文本片段分类为积极、消极或中性。

提示工程：创建有效的提示，以指导语言模型生成期望的输出。
警报/决策制定：一旦输入提示，需要将结果传达或采取相应行动。这可能涉及根据特定条件触发警报、通知实时决策过程或将输出输入到另一个系统中。

持续学习：在实时系统中，模型应该能够适应数据的变化。可以实现持续学习系统，定期使用新数据对模型进行重新训练，或使用在线学习算法，每个新数据点都可以更新模型。

监控：实时系统需要持续监控，以确保其正常运行。流程中的任何延迟或问题都可能产生即时影响，因此重要的是建立强大的监控和警报机制。

大型语言模型（LLM）

一旦数据被正确准备好，就可以与LLM一起用于生成有洞察力的金融分析。LLM层包括：

LLM API：来自已建立的LLM的API提供基本的语言功能。

可训练模型：FinGPT提供可训练的模型，用户可以在其私有数据上进行微调，以定制金融应用。

微调方法：各种微调方法使得FinGPT能够适应个性化的机器顾问。

为什么要对LLM进行微调而不是从头开始重新训练？

利用现有的大型语言模型（LLM）并对其进行微调，为金融领域提供了一种高效、经济实惠的替代方案，避免了昂贵且耗时的从头训练模型的成本。

虽然BloombergGPT在金融特定能力方面非常出色，但它需要大量计算资源。它的训练过程大约使用了130万个GPU小时，根据AWS云计算的2.3美元费率计算，训练成本惊人地高达约300万美元。与BloombergGPT等高计算成本模型相比，FinGPT通过专注于对顶级开源LLM的轻量级调整，提供了一种更为可行的解决方案。调整的成本大大降低，估计每次训练不到300美元。

这种方法确保了及时的更新和适应性，这在不断变化的金融领域中至关重要。作为开源项目，FinGPT不仅促进了透明度，还允许用户进行定制，迎合了个性化金融咨询服务的兴起趋势。最终，FinGPT的经济实惠、灵活的框架有潜力实现金融语言建模的民主化，并促进以用户为中心的金融服务。

通过低秩适应（LoRA）进行微调

在FinGPT中，我们利用一份新颖的金融数据集对预训练的LLM进行微调。众所周知，高质量的标注数据对于许多成功的LLM（包括ChatGPT）至关重要。然而，获取这种顶级标注数据往往在时间和资源上代价高昂，并且通常需要金融专业人士的专业知识。

如果我们的目标是利用LLM来分析与金融相关的文本数据，并在量化交易中提供帮助，那么充分利用市场固有的标注能力似乎是明智的选择。因此，我们使用每条新闻项的相对股价变动百分比作为输出标签。我们根据新闻项的情感将这些标签划分为三个类别——正面、负面和中性，并建立了阈值。

在相应的提示工程过程中，我们还提示模型从正面、负面和中性输出中选择一个。这种策略确保了对预训练信息的最佳利用。通过使用LLM的低秩适应（LoRA），我们将可训练参数的数量从61.7亿减少到仅仅367万。

通过股票价格的强化学习（RLSP）进行微调

类似地，我们可以将股票价格的强化学习（RLSP）替代ChatGPT中的人类反馈强化学习。这种替代的原因在于，股票价格提供了一个可量化、客观的度量标准，反映了市场对新闻和事件的情绪。这使得股票价格成为我们训练模型的一个强大、实时的反馈机制。

强化学习（RL）允许模型通过与环境的交互和接收反馈来学习。在RLSP的情况下，环境是股票市场，反馈以股票价格的变动形式提供。这种方法使得FinGPT能够改进其对金融文本的理解和解读，提高其预测市场对各种金融事件的响应能力。通过将新闻情绪与相关股票的后续表现联系起来，RLSP提供了一种有效的微调FinGPT的方式。实质上，RLSP使得模型能够推断市场对不同新闻事件的反应，并相应地调整其理解和预测。

因此，将RLSP集成到FinGPT的微调过程中为改进模型对金融市场的理解和预测准确性提供了强大的工具。通过使用实际股票价格的变动作为反馈，我们直接利用市场的智慧来使我们的模型更加有效。

应用

FinGPT可以在金融服务领域广泛应用，帮助专业人士和个人做出明智的金融决策。潜在的应用包括：

机器顾问：提供个性化的财务建议，减少常规面对面咨询的需求。

量化交易：为明智的交易决策提供交易信号。

投资组合优化：利用众多经济指标和投资者资料构建最佳投资组合。

金融情绪分析：评估不同金融平台上的情绪，提供深入的投资指导。

风险管理：通过分析各种风险因素制定有效的风险策略。

金融欺诈检测：识别潜在的欺诈交易模式，提升金融安全性。

信用评分：根据金融数据预测信用状况，帮助贷款决策。

破产预测：基于财务和市场数据预测公司的潜在破产或破产。

并购预测：通过分析财务数据和公司概况预测潜在的并购活动，帮助投资者预测市场动向。

ESG（环境、社会、治理）评分：通过分析公共报告和新闻文章评估公司的ESG评分。

低代码开发：通过用户友好的界面促进软件的创建，减少对传统编程的依赖。

金融教育：作为人工智能导师，简化复杂的金融概念，提高金融素养。

通过连接这些独立但相互关联的组件，FinGPT为在金融领域利用人工智能提供了一种全面和可行的解决方案，促进了金融行业中的研究、创新和实际应用。

结论

综上所述，将大型语言模型（LLMs）与金融领域进行深度融合带来了独特的复杂性和广阔的机遇。在金融数据中，高时间敏感性、动态的金融环境以及低信噪比等挑战需要高效的解决方案。FinGPT通过利用现有的LLMs并对其进行细化调整以适用于特定的金融应用，以创新的方式应对这些挑战。与BloombergGPT等模型相比，这种方法显著降低了适应成本和计算需求，为金融语言建模提供了更加可访问、灵活和具有成本效益的解决方案。因此，它能够持续更新以确保模型的准确性和相关性，这在动态和时间敏感的金融世界中至关重要。

未来工作

金融大型语言模型（FinLLMs）展示了未来的愿景，即个性化的机器人顾问或助手将成为每个人的选择。它旨在实现对高质量金融建议的民主化访问，利用先进的语言建模技术理解大量的金融数据，并将其转化为可操作的洞察力。以下蓝图概述了FinLLM未来的发展方向:

个性化：FinLLM战略的核心是个性化微调的概念。通过使用LoRA和QLoRA等技术，FinLLM使用户能够根据其特定需求定制模型，从而创建个人化的机器人顾问或助手。这与金融服务领域的定制化趋势相一致，因为消费者越来越需要与其独特的风险配置和财务目标相符的个性化建议。

开源和低成本适应：FinLLM倡导开源价值观，以低成本（通常在100到300美元之间）为用户提供将大型语言模型（LLMs）适应到其需求的工具。这不仅使得先进的金融建模技术民主化，还培育了一个充满活力的开发者和研究者社区，共同推动金融人工智能领域的发展。

获取高质量的金融数据：FinLLM不仅提供建模技术，还提供高质量的金融数据。这确保用户拥有有效训练模型所需的数据，同时简化数据整理过程。此外，通过提供带演示的数据整理流程，进一步增强了用户利用其金融数据的潜力。

你可能感兴趣的:(垂直领域大模型,金融领域)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
三大师传 beca酱
巴尔扎克的作品被誉为“法国社会的一面镜子”。文学大师维克多·雨果对巴尔扎克的评价是：“在最伟大的人物中间，巴尔扎克是名列前茅者；在最优秀的人物中间，巴尔扎克是佼佼者之一。”一个原本寂寂无名的小人物，从地中海的某个海岛上，只身一人来到巴黎，没有朋友，也没有名望。作为一个一文不名的外乡人，凭着赤手空拳赢得了巴黎，征服了整个法兰西，并且赢得了世界。这个人就是十九世纪法国伟大的军事家、政治家，法兰西第一帝
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
我的烦恼余建梅
我的烦恼。女儿问我：“你给学生布置什么作文题目？”“《我的烦恼》。”“他们都这么大了，你觉得他们还有烦恼吗？”“有啊！每个人都会有自己烦恼。”“我不相信，大人是没有烦恼的，如果说一定有的话，你的烦恼和我写作业有关，而且是小烦恼。不像我，天天被你说，有这样的妈妈，烦恼是没完没了。”女儿愤愤不平。每个人都会有自己的烦恼，处在上有老下有小的年纪，烦恼多的数不完。想干好工作带好孩子，想孝顺父母又想经营好自
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
谁家酒器最绝唱，藏在酒厂人未知？景阳冈酒厂先秦藏品大揭秘李虓酒评论
文/王赛时中国的酒器酒具历史久远，举世闻名。从北京的故宫博物院、中国国家博物馆，到世界各国的大型博物馆，都以能够收藏中国古代酒具而夸耀。但很少有人知道，在山东阳谷景阳冈酒厂，默默地收藏了两千件中国酒器。这些酒器，就封藏在景阳冈的酒道馆里。其中有一些青铜酒器，一睡就是三、四千年，堪称无声国宝，堪作无字史书！今天，我将引领诸位首先窥视一下景阳冈酒道馆的9件先秦藏品，你自己来说震撼不震撼。提示：这只是景
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
2019-08-08 65454
东莞家庭聚会出行旅游去哪里玩住？想起来有很久没有和家里人聚会啦，这次组织家人来到威廉古堡别墅轰趴，一大家子27个人，在别墅订了一天办，玩的非常的开心，小孩子玩游戏机，也很放心不会丢，我们就在唱歌、打麻将、打桌球一系列的活动，还准备小次等小孩生日在别墅举办，还可以给孩子做一个生日的策划
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin