phasorhand

LightGBM 参数及调优

翻译自Understanding LightGBM Parameters (and How to Tune Them)

10 分钟阅读
作者 MJ Bahmani
2022 年 1 月 25 日更新

我已经使用lightGBM有一段时间了。对于大多数扁平数据问题，这是我的首选算法。它有很多突出特性，我建议你浏览一下。

但我一直很想了解哪些参数对性能的影响最大，以及我应该如何调整 lightGBM 参数以充分利用它。

我想我应该做一些研究，更多地了解 lightGBM 参数…并分享我的研究过程。

具体来说我做了以下事项：

深入研究LightGBM 的文档
浏览 Laurae 文章Lauraepp：xgboost / LightGBM 参数
查看LightGBM源代码
进行一些实验

在此过程中，我获得了有关 lightGBM 参数的更多知识。我希望在阅读完这篇文章后，您将能够回答以下问题：

LightGBM 中实现了哪些 Gradient Boosting 方法，它们有什么区别？
哪些参数通常很重要？
哪些正则化参数需要调整？
如何在 python 中调整 lightGBM 的参数？

梯度提升方法（Gradient Boosting methods）

使用 LightGBM，您可以通过boosting参数指定使用不同类型的 Gradient Boosting 方法，例如：GBDT、DART 和 GOSS

在接下来的部分中，我将解释和比较这些方法。

lgbm gbdt（gradient boosted decision trees梯度提升决策树）

该方法是传统的梯度提升决策树，首次在这篇文章中提出，XGBoost 和 pGBRT 等一些优秀算法库都基于它实现。

如今，gbdt 因其准确、效率和稳定性而被广泛使用。您可能知道 gbdt 是决策树的集成模型，但它到底是什么意思？

相关文章：理解梯度裁剪（以及它如何解决爆炸梯度问题）

我总结的要点如下。

它基于三个重要原则：

弱学习者（决策树decision trees）
梯度优化（Gradient Optimization ）
提升技术（Boosting Technique）

基于第一个原则， gbdt 方法中有很多决策树（弱学习器）。这些树是按如下顺序构建的：

第一棵树学习如何拟合目标变量
第二棵树学习如何拟合第一棵树的预测值和真实值之间的残差（差异）
第三棵树学习如何拟合第二棵树的残差，依此类推。

所有这些树都是通过在整个系统中传播误差梯度来训练的。

gbdt 的主要缺点是在每个树节点中找到最佳分割点是耗时且消耗内存的操作，其他 Gradient Boosting 方法试图解决该问题。

DART gradient boosting

在这篇出色的论文中，您可以了解有关 DART 梯度提升的所有信息，它通过使用神经网络中的 dropout、standard方法，来改进模型正则化并处理一些其他less-obvious方法。

也就是说，gbdt 存在过拟合的问题，也就是在迭代末尾处添加的树往往只会影响少数实例的预测，而对剩余实例的预测影响甚微。添加 dropout 会使后续迭代中的树更泛化，从而提高性能。

lgbm goss（基于梯度的单侧采样）

lightgbm名字的由来最重要的原因就是使用了基于这篇论文的Goss方法，而Goss 是更新和更轻（lighter）的 gbdt 实现（因此是light gbm）。

标准 gbdt 是可靠的，但在大型数据集上不够快。因此，goss 提出了一种基于梯度的采样方法，以避免搜索整个搜索空间。我们知道，对于每个数据实例，当梯度较小时，意味着不用担心数据是否经过良好训练，而当梯度较大时，应该再次重新训练。所以我们这里有两类数据实例，具有大梯度和小梯度的数据实例。因此，goss 保留所有具有大梯度的数据，并对具有小梯度的数据进行随机抽样（这就是为什么它被称为 One-Side Sampling）。这使得搜索空间更小，goss 可以更快地收敛。最后，为了更深入地了解 goss，您可以查看这篇博文。

让我们将这些差异放在一个表格中：

方式	注意	需要改变的参数	优势	劣势
Lgbm gbdt	这是默认的boosting方式	因为 gbdt 是 lgbm 的默认参数，所以您不必为它更改其余参数的值（但是tuning仍是必须的！）		过拟合、耗时、耗内存
Lgbm dart	尝试解决gbdt中过拟合的问题	drop_seed: 选择dropping models 的随机seed uniform_dro: 如果你想使用uniform drop设置为true, xgboost_dart_mode: 如果你想使用xgboost dart mode设置为true, skip_drop: 在boosting迭代中跳过dropout过程的概率 drop_rate: dropout率，在 dropout 期间要丢弃的先前树的一小部分？	更高的准确率	配置太多
Lgbm goss	goss 通过分离出具有较大梯度的实例，为 GBDT 提供了一种新的采样方法	top_rate：大梯度数据的保留率 other_rate：小梯度数据的保留率	更快的收敛速度	数据集较小时过拟合

笔记：如果将 boosting 设置为 RF，则 lightgbm 算法的行为类似于随机森林，而不是 boosting 树！根据文档，要使用 RF，您必须使用 bagging_fraction 和 feature_fraction 小于 1。

正则化

在本节中，我将介绍 lightgbm 的一些重要的正则化参数。显然，这些是您需要调整以对抗过度拟合的参数。

您应该知道，对于小型数据集（<10000 条记录），lightGBM 可能不是最佳选择。调整 lightgbm 参数可能对您没有帮助。

此外，lightgbm 使用leaf-wise树生长算法，而 XGBoost 使用了depth-wise树生长算法。Leaf-wise 方法允许树更快地收敛，但增加了过度拟合的风险。

也许来自 PyData 会议之一的这个演讲让您对 Xgboost 和 Lightgbm 有更多的了解。值得观看！

Note：如果有人问你 LightGBM 和 XGBoost 的主要区别是什么？您可以轻松地说，它们的区别在于它们的实现方式。

根据lightGBM 文档，当面临过度拟合时，您可能需要进行以下参数调整：

使用小的 max_bin
使用小的 num_leaves
使用 min_data_in_leaf 和 min_sum_hessian_in_leaf
通过设置 bagging_fraction 和 bagging_freq 使用 bagging
通过设置 feature_fraction 使用特征子采样
使用更大的训练数据
尝试使用 lambda_l1、lambda_l2 和 min_gain_to_split 进行正则化
尝试使用 max_depth 来避免生长深树

在接下来的部分中，我将更详细地解释这些参数中的每一个。

lambda_l1

Lambda_l1（和 lambda_l2）对 l1/l2 的控制以及与 min_gain_to_split 一起用于对抗过度拟合。我强烈建议您通过调参（在后面的部分中探讨）来找出这些参数的最佳值。

num_leaves

当然num_leaves是控制模型复杂性的最重要参数之一。使用它，您可以设置每个弱学习器拥有的最大叶子数。大的 num_leaves 增加了训练集的准确性，也增加了过拟合的风险。根据文档，一种简单的计算方法是num_leaves = 2^(max_depth)但是，考虑到在 lightgbm 中，叶子树比层次树更深，您需要小心过度拟合！因此，需要将num_leaves与max_depth一起调优。

lightgbm 文档上的照片

subsample

使用subsample（或 bagging_fraction），您可以指定每次树构建迭代使用的行的百分比。这意味着将随机选择一些行来拟合每个学习器（树）。这提高了泛化能力，并且也提高了训练速度。

我建议对基线模型使用较小的子样本值，然后在完成其他实验（不同的特征选择，不同的树结构）后增加这个值。

feature_fraction

feature_fraction或 sub_feature 处理列采样，LightGBM 将在每次迭代（树）上随机选择特征子集。例如，如果将其设置为 0.6，LightGBM 将在训练每棵树之前选择 60% 的特征。

此功能有两种用法：

可用于加速训练
可用于处理过拟合

max_depth

此参数控制每个训练树的最大深度，并将影响：

num_leaves 参数的最佳值
模型表现
训练时间

注意如果您使用较大的max_depth值，您的模型可能会过拟合 。

max_bin

分箱是一种在离散视图（直方图）中表示数据的技术。Lightgbm 使用基于直方图的算法在创建弱学习器的同时找到最佳分割点。因此，每个连续的数字特征（例如视频的观看次数）都应该被分成离散的 bin。

LightGBM 和 XGBoost上的照片解释

此外，在这个GitHub r epo 中，您可以找到一些全面的实验，这些实验充分解释了更改 max_bin 对 CPU 和 GPU 的影响。

500 次迭代后的时钟时间 – GitHub 存储库

如果您将 max_bin 定义为 255，则意味着每个特征最多可以有 255 个唯一值。较小的 max_bin 会带来更快的速度，较大的值会提高准确性。

训练参数

当你想训练你的 lightgbm时，可能会遇到一些典型问题：

训练是一个耗时的过程-num_iterations
处理计算复杂度（CPU/GPU RAM 限制）-early_stop_rounds
处理分类特征-categorical_feature
处理样本不均衡问题-unbalanced dataset
对自定义指标的需求-feval
需要针对分类或回归问题进行的调整

在本节中，我们将尝试详细解释这些要点。

num_iterations（迭代次数）

num_iterations 指定提升迭代的次数（要构建的树）别名num_boost_round。您构建的树越多，您的模型就越准确，其代价是：

训练时间更长
过拟合的可能性更高

从较少数量的树开始构建基线，然后通过增加树的数量挤压出性能。

建议使用较小的learning_rate和较大的num_iterations。此外，使用 early_stopping_rounds参数（早停法），解决num_iterations过高却没有学到任何有用东西的问题。

early_stopping_rounds

如果验证指标在最后一轮提前停止后没有改善，则此参数将停止训练。这应该与迭代次数成对定义。如果将其设置得太大，则会增加过度拟合的机会（但您的模型可能会更好）。

经验法则是将其设置为 num_iterations 的 10%。

lightgbm categorical_feature

使用 lightgbm 的优点之一是它可以很好地处理分类特征。是的，这个算法非常强大，但是你必须小心如何使用它的参数。lightgbm 使用一种特殊的整数编码方法（由Fisher提出）来处理分类特征

实验表明，这种方法比常用的one-hot encoding带来更好的性能。

它的默认值是“auto”，这意味着：让 lightgbm 决定这意味着 lightgbm 将推断哪些特征是分类的。

它并不总是很好用（一些实验说明了为什么在这里和这里），我强烈建议您使用此代码手动设置分类特征

cat_col = dataset_name.select_dtypes(‘object’).columns.tolist()

但是幕后发生了什么以及 lightgbm 如何处理分类特征？

根据 lightgbm 的文档，我们知道树学习器不能很好地使用一种热编码方法，因为它们在树中生长得很深。在所提出的替代方法中，树学习器是最优构造的。例如，对于具有 k 个不同类别的一个特征，有 2^(k-1) – 1 个可能的分区，并且使用Fisher方法可以通过在值的排序直方图上找到最佳分割方式来改进**k * log(k)**在分类特征中。

lightgbm is_unbalance vs scale_pos_weight

您在二元分类问题中可能面临的问题之一是如何处理不平衡的数据集。显然，您需要平衡正/负样本，但您如何在 lightgbm 中做到这一点？

lightgbm 中有两个参数可以让你处理这个问题is_unbalance 和 scale_pos_weight，但它们之间有什么区别以及如何使用它们？

当您设置 Is_unbalace: True 时，算法将尝试自动平衡主导标签的权重（与训练集中的 pos/neg 分数）
如果您想更改scale_pos_weight（默认为 1，这意味着假设正标签和负标签相等）以防不平衡数据集，您可以使用以下公式（基于 lightgbm 存储库上的这个问题）正确设置它

sample_pos_weight = 负样本数/正样本数

lgbm feval

有时你想定义一个自定义的评估函数来衡量你的模型的性能，你需要创建一个feval函数。

Feval 函数应该接受两个参数：

preds
train_data

并返回

eval_name
eval_result
is_higher_better

让我们逐步创建一个自定义指标函数。

定义一个单独的python函数

def  feval_func (preds, train_data) : 
   # 定义一个计算结果
    return ( 'feval_func_name' , eval_result, False )

将此函数用作参数：

print( '开始训练...' )
lgb_train = lgb.train(...,
                      metric=None，
                      feval=feval_func)

Note：要使用 feval 函数而不是 metric，您应该将 metric 参数设置为“None”。

分类参数与回归参数

我之前提到的大多数事情对于分类和回归都是正确的，但有些事情需要调整。

具体来说，您应该：

参数名称	针对分类的参数值	针对回归的参数值
objective	binary或者multiclass	regression
metric	Binary_logloss、AUC或其他	RMSE、mean_absolute_error或其他
is_unbalance	True 或者 false	—
scale_pos_weight	仅在二分类或多分类中使用	—
num_class	仅在多分类中使用	—
reg_sqrt	—	用于拟合 sqrt(标签) 而不是大范围标签的原始值

最重要的lightgbm参数

我们已经在前面的部分中回顾并了解了一些关于 lightgbm 参数的知识，但是有关于提升树的文章，却没有提及来自 Laurae 的令人印象深刻的基准测试，都是不完整的。

您可以了解 lightGBM 和 XGBoost 的许多问题的最佳默认参数。

你可以在这里查看，但一些最重要的要点是：

参数名称	默认值	可选	参数类型	别名	约束或注意	用于
objective	regression	regression, binary	枚举值	objective_type,app	当你改变它会影响其他参数	指定模型类型
metric	null	20多种参数	多枚举	metrics, metric_types	null 表示将自动使用与指定objective对应的指标	指定metric，支持多个metric
boosting	gbdt	gbdt, rf, dart, goss	枚举值	boosting_type	如果您将其设置为rf，相当于使用bagging approach方法	boosting方法
lambda_l1	0.0	[0, ∞]	浮点数	reg_alpha	lambda_l1 >= 0.0	正则化
bagging_fraction	1	[0, 1]	浮点数	subsample	0.0 < bagging_fraction <= 1.0	随机选择部分数据而不重新采样
bagging_freq	0	[0, ∞]	整形	subsample_freq	要启用 bagging，bagging_fraction 也应设置为小于 1.0 的值	0 表示禁用 bagging；k 表示在每 k 次迭代中执行 bagging
num_leaves	31	[1, ∞]	整形	num_leaf	1 < num_leaves <= 131072	指定一棵树的最大叶子数
feature_fraction	1.0	[0,1]	浮点数	sub_feature	0.0 < feature_fraction <= 1.0	如果将其设置为 0.8，LightGBM 将选择 80% 的特征
max_depth	-1	[-1, ∞]	整形	max_depth	越大通常越好，但过拟合风险会增加	限制树模型的最大深度
max_bin	255	[2, ∞]	整形	histogram binning	max_bin > 1	eal with over-fitting？
num_iterations	100	[1, ∞]	整形	num_boost_round, n_iter	num_iterations >= 0	boosting迭代次数
learning_rate	0.1	[0, 1]	浮点数	eta	learning_rate > 0.0，常用：0.05	在 dart 中，它也会影响dropped trees的归一化权重
early_stopping_round	0	[0, ∞]	浮点数	early_stopping_round	如果validation在最近一次early_stopping 中没有改善，将停止训练	模型性能、迭代次数、训练时间
categorical_feature	空字符串	指定列索引值	多整数或字符串	cat_feature	—	处理类别特征
bagging_freq	0	[0, ∞]	整形	subsample_freq	0表示禁用 bagging；k 表示在每 k 次迭代中执行 bagging	要启用 bagging，bagging_fraction 也应设置为小于 1的值
verbosity	0	[-∞, ∞]	整形	verbose	< 0: Fatal, = 0: Error (Warning), = 1: Info, > 1: Debug	调试时使用
min_data_in_leaf	20	min_data	整形	min_data	min_data_in_leaf >= 0	可用于处理过拟合

Note：您永远不应将任何参数值设为默认，应该根据您的问题进行调整。也就是说，这些参数是您的调整算法超参数的一个很好的起点

也可以看看

可视化机器学习实验的指标和超参数的最佳工具

Python 中的超参数调整：完整指南 2020

python中Lightgbm参数调优示例（lightgbm调优）

最后，在解释了所有重要参数之后，是时候进行一些实验了！

我将使用流行的 Kaggle 竞赛之一：Santander Customer Transaction Prediction。

我将使用这篇文章来解释如何在 Python中对任何脚本运行超参数调整。

值得一读！

在我们开始之前，一个重要的问题！我们应该调整哪些参数？

注意您要解决的问题，例如 Santander 数据集高度不平衡，并且应该在调整时考虑到这一点！ Laurae2lightgbm的贡献者之一在这里很好地解释了这一点。
有些参数是相互依赖的，必须一起调整或按个调整。例如，min_data_in_leaf 取决于训练样本的数量和 num_leaves。

Note：为超参数创建两个字典是个好主意，一个包含您不想调整的参数和值，另一个包含您想要调整的参数和值范围。

SEARCH_PARAMS = { 'learning_rate'：0.4，
                  'max_depth'：15，
                  'num_leaves'：20，
                  'feature_fraction'：0.8，
                  'subsample'：0.2 }

FIXED_PARAMS={ 'objective' : 'binary' ,
               'metric' : 'auc' ,
               'is_unbalance' : True ,
               'boosting' : 'gbdt' ,
               'num_boost_round' : 300 ,
               'early_stopping_rounds' : 30 }

通过这样做，您可以将基线值与搜索空间分开！

请注意，由于最近的API 更新，这篇文章也需要一些更改——我们正在努力！同时，请查看Neptune 文档，其中所有内容都是最新的！

现在，这就是我们要做的。

第一步，我们在Notebook中生成代码。它是公开的，您可以下载它。
第二步，我们在Neptune.ai上跟踪每个实验的结果。

见Naptune

可能有用: 如何借助 Neptune-LightGBM 集成跟踪模型训练元数据

结果分析

如果您看了上一节，您会注意到我已经对数据集进行了超过 14 次不同的实验。在这里，我将解释如何逐步调整超参数的值。

创建基线训练代码：

from sklearn.metrics import roc_auc_score, roc_curve
from sklearn.model_selection import train_test_split
import neptunecontrib.monitoring.skopt as sk_utils
import lightgbm as lgb
import pandas as pd
import neptune
import skopt
import sys
import os

SEARCH_PARAMS = {'learning_rate': 0.4,
                'max_depth': 15,
                'num_leaves': 32,
                'feature_fraction': 0.8,
                'subsample': 0.2}

FIXED_PARAMS={'objective': 'binary',
             'metric': 'auc',
             'is_unbalance':True,
             'bagging_freq':5,
             'boosting':'dart',
             'num_boost_round':300,
             'early_stopping_rounds':30}

def train_evaluate(search_params):
   # you can download the dataset from this link(https://www.kaggle.com/c/santander-customer-transaction-prediction/data)
   # import Dataset to play with it
   data= pd.read_csv("sample_train.csv")
   X = data.drop(['ID_code', 'target'], axis=1)
   y = data['target']
   X_train, X_valid, y_train, y_valid = train_test_split(X, y, test_size=0.2, random_state=1234)
   train_data = lgb.Dataset(X_train, label=y_train)
   valid_data = lgb.Dataset(X_valid, label=y_valid, reference=train_data)

   params = {'metric':FIXED_PARAMS['metric'],
             'objective':FIXED_PARAMS['objective'],
             **search_params}

   model = lgb.train(params, train_data,                     
                     valid_sets=[valid_data],
                     num_boost_round=FIXED_PARAMS['num_boost_round'],
                     early_stopping_rounds=FIXED_PARAMS['early_stopping_rounds'],
                     valid_names=['valid'])
   score = model.best_score['valid']['auc']
   return score

使用您选择的超参数优化库（例如 scikit-optimize）

neptune.init('mjbahmani/LightGBM-hyperparameters')
neptune.create_experiment('lgb-tuning_final', upload_source_files=['*.*'],
                              tags=['lgb-tuning', 'dart'],params=SEARCH_PARAMS)

SPACE = [
   skopt.space.Real(0.01, 0.5, name='learning_rate', prior='log-uniform'),
   skopt.space.Integer(1, 30, name='max_depth'),
   skopt.space.Integer(10, 200, name='num_leaves'),
   skopt.space.Real(0.1, 1.0, name='feature_fraction', prior='uniform'),
   skopt.space.Real(0.1, 1.0, name='subsample', prior='uniform')
]
@skopt.utils.use_named_args(SPACE)
def objective(**params):
   return -1.0 * train_evaluate(params)

monitor = sk_utils.NeptuneMonitor()
results = skopt.forest_minimize(objective, SPACE, 
                                n_calls=100, n_random_starts=10, 
                                callback=[monitor])
sk_utils.log_results(results)

neptune.stop()

尝试不同类型的配置并在Neptune中跟踪您的结果

在 Neptune 中运行比较 | 在应用程序中查看

最后，在下表中，您可以看到参数发生了哪些变化。

超参数	调参前	调参后
learning_rate	0.4	0.094
max_depth	15	10
num_leaves	32	12
feature_fraction	0.8	0.1
subsample	0.2	0.75
boosting	gbdt	dart
Score(auc)	0.8256	0.8605

最后的想法

长话短说，你学到了：

lightgbm的主要参数是什么
如何使用 feval 函数创建自定义指标
主要参数有哪些好的默认值
查看如何调整 lightgbm 参数以提高模型性能的示例

和一些其他的东西有关更详细的信息，请参阅资源。

资源

Laurae extensive guide with good defaults etc
LightGBM Python-package
LightGBM’s documentation
LightGBM: A Highly Efficient Gradient Boosting
Decision Tree
Greedy Function Approximation A Gradient Boosting Machine

#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f