xiedelong

智能营销增益模型（Uplift Modeling）实践整理

一、uplift 思想（因果推断）

常用的点击率预测模型，称为响应模型（response model），即预测用户看到商品（Treatment）后点击（购买）的概率。但在营销的发放优惠券这种场景下，很自然会想到，用户是本来就有购买的意愿还是因为发放了优惠券诱使用户购买？

对有发放优惠券这种有成本的营销活动，我们希望模型触达的是营销敏感的用户，即发放的优惠券促使用户购买，而对优惠券不敏感的用户——无论是否发券都会购买——最好不要发券，节省成本。营销活动中，对用户进行干预称为treatment，例如发放优惠券是一次treatment。我们可以将用户分为以下四类：

persuadables：不发券就不购买、发券才会购买的人群，即营销敏感人群
sure thing：无论是否发券，都会购买，自然转化
lost causes：无论是否发券都不会购买，这类用户实在难以触达到，直接放弃
sleeping dogs：与persuadables相反，对营销活动比较反感，不发券的时候会有购买行为，但发券后不会再购买。

假设有 N 个用户，Y*i*(1) 表示我们对用户 i 干预后的结果，比如给用户 i 发放优惠券后（干预）用户下单（结果）；Y*i*(0) 表示我们没有对用户 i 干预的结果，比如没有给用户 i 发放优惠券（干预）用户下单（结果）。
用户 i 的因果效应（causal effect）的计算如下：

我们通常估计的是CATE（ Conditional Average Treatment Effect）,也就是说，对人群中的一个子人群来评估因果关系（用一个自人群的因果效果来表示一个单个人的因果效果）。

二、建模方式

1. 差分响应模型（Two-Model）

Two-model 方法是分别在 treatment 组和 control 组数据上独立建模（目标是 order）。
预测时分别用 treatment 模型和 control 模型预测用户（特征 X 相同）的分数，两个模型预测分数相减得到 uplift score （多个模型预测一条样本）
这里因果效应分数是计算出来的而不是通过模型直接优化出来的，所以本质上，这还是传统的响应模型，而且两个独立的模型分开训练容易累积误差（两个独立模型的误差会累加传递到最终的uplift score）

2. 差分响应模型升级版（One-Model）

One-Model 在模型层面做了打通，同时底层的样本也是共享的（把是否发券 - 是否购买样本都扔进模型）（treatment 作为其中的一维特征）（建模目标仍然是 order）
One Model 优点是样本的共享可以使模型学习的更加充分，同时避免双模型打分误差累积的问题，且可以支持 multiple treatment 的建模（Treatment 特征可以是多种枚举值，比如不同金额）
在预测的时候，一个模型预测多条样本，同一个用户，特征 X （除 Treatment 外）都相同，将 treatment 修改构造多个样本，将 T = treatment 的预测结果 pre( t ) 与 T = control 的预测结果 pre( c ) 相减，得到 uplift score
但是它在本质上还是在对 response 建模，因此对 uplift 的建模还是比较间接；而且如果特征集 X 比较大的话，则 treatment 特征 只占上百个特征中的一个，重要度不高，导致pre( t ) 与 pre( c ) 差别非常小，从而用户区分度非常低。

3. 标签转换模型（Class Transformation Method）

类别转换的方式是针对二分类的情境下提出的。这种方法的目标函数如下：

其中 W 表示 Treatment，Y 表示是否购买，可以知道，标签转换是将 发券才买 的营销敏感用户 & 不发券就不买的无动于衷用户作为正样本，将 发券仍不买 & 不发券也买 的无需营销用户作为负样本，训练二分类模型

4. 直接建模（Modeling Uplift Directly）

是通过修改已有的学习学习结构直接对 uplift 进行建模，比较流行的就是修改树模型的特征分裂方法。

传统树模型的分裂过程中，主要参照指标是信息增益，其本质是希望通过特征分裂后下游正负样本的分布更加悬殊，即代表类别纯度变得更高。

同理这种思想也可以引入到 Uplift Model建模过程，其中 Pt 是 treatment 组的概率分布（可以简单理解为：购买 / 不购买的比例），Pc 是 control 组的概率分布，我们希望通过特征分裂后，Pt 与 Pc 的概率分布差异，比特征分裂前更大，也就是这里的 gain

D(*) 表示的是差异度量函数（如何表示这两组的分布差异），有这么三种方式：Kullback,、Euclidean、Chi-Squared，常用的是 KL 散度。公式如下：

关于 KL 具体的非常好的例子可以参考：https://www.zhihu.com/question/41252833

5. 多分类模型（multi-classification model）

根据第一节，我们知道，用户可以按照是否发券 - 是否购买，划分成四象限，因此另一种建模方式则是按照：（treatment / control） * （order / not） 分为四种类别

def get_new_label(label, p_abgroup):
    # 不发券不买 Control Non-Responders(CN)
    if label == 0 and p_abgroup == 'b':
        return 0

    # 不发券买 Control Responders(CR)
    if label == 1 and p_abgroup == 'b':
        return 1

    # 发券不买 Treatment Non-Responders(TN)
    if label == 0 and p_abgroup == 'a':
        return 2

    # 发券买 Treatment Responders(TR)
    if label == 1 and p_abgroup == 'a':
        return 3

同样的，也是将所有真实样本喂入模型，底层的样本也是共享的，而且建模目标不再是 order 而是用户属于哪种群体

特征则是构建了：画像、行为、下单、竞品、用券、收益、交叉转换、实时特征 Flink 等（其中券特征可以参考：https://tianchi.aliyun.com/notebook-ai/detail?postId=58107）

模型按照四分类的思路建模，得到用户属于四种群体的概率值后，按照权重相加（我这里用的是 [1, 1, -1, -1] ，可以自行试验最优权重组合）（索引与上面的代码一致）：uplift_scores = [i[3] + i[0] - i[2] - i[1] for i in class_probs]，即得到所有用户的 uplift score。

评估时有三种方式：

acc 分类准确率，这个指标结合 loss 损失的走向，用来验证模型是否过拟合，以及拟合是否充分
auuc（Area Under Uplift Curve），也就是下面这张图，其中深蓝色的是对用户随机排序，得到的实验组（Treatment）比对照组（Control）的增量，可以看到随机排序时是一个均匀的线性关系；同时，我们使用定价模型对测试集进行预测，会得到多组结果，按照 argmax 的原则，选择最大的作为最终结果，并将对应的价格作为定价。然后我们按照模型预测的 lift 值由高到低排序，画出来的增量走势曲线，即为浅蓝色的这条曲线。计算曲线下面积即为 auuc ，越大表示模型的结果越好
分段评估，还是看上面这张图，将全量测试集用户样本，按照 10% 为间隔，分为10个档位，我们去评估每 10% 的增量效果。公式的含义是，首先第一项是实验组里购买的比例，也即是实验组转化率，第二项是指对照组的转化率，二者之差也就是发券转化率增量，就是图里的斜率。后面括号第三项的含义是是当前这 10% 的总用户量（也就是△x），所以得到的结果就是每 10% 的实验组增量

附1（causal uplift model 代码）：

from causalml.inference.meta import LRSRegressor
from causalml.inference.meta import XGBTRegressor, MLPTRegressor
from causalml.inference.meta import BaseXRegressor
from causalml.inference.meta import BaseRRegressor
from xgboost import XGBRegressor
from causalml.dataset import synthetic_data

from causalml.dataset import make_uplift_classification
from causalml.inference.tree import UpliftRandomForestClassifier
from causalml.metrics import plot_gain
from causalml.metrics import auuc_score

from __future__ import division
import pandas as pd
import lightgbm as lgb
from sklearn.metrics import accuracy_score
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import time
import datetime
import warnings
import operator
import re

import pickle
import gzip
from sklearn.utils import shuffle
from sklearn import linear_model, datasets
from sklearn import metrics
from sklearn.model_selection import train_test_split

from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier, ExtraTreesClassifier, GradientBoostingClassifier
from sklearn.metrics import classification_report, accuracy_score,roc_auc_score
import pickle
warnings.filterwarnings(action='ignore', category=UserWarning, module='matplotlib')
pd.options.mode.chained_assignment = None  # default='warn'
plt.style.use('seaborn-whitegrid')# 设置图形的显示风格

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# 显示所有列(参数设置为None代表显示所有行，也可以自行设置数字)
pd.set_option('display.max_columns', 100)

# 显示所有行
pd.set_option('display.max_rows', 100)

# 设置数据的显示长度，默认为50
pd.set_option('max_colwidth', 100)

# 禁止自动换行(设置为Flase不自动换行，True反之)
pd.set_option('expand_frame_repr', False)

# 特征
portrait_cols = []
action_cols = []
purchase_cols = []
compete_colst = []
bonus_cols = []
cal_cols = []
all_cols = portrait_cols + action_cols + purchase_cols + compete_colst + bonus_cols + cal_cols

# 样本
data = pd.read_csv('../data/all_data.csv')
data['treatment_key'] = data[['price', 'p_abgroup']].apply(lambda row: row['p_abgroup'] + '_' + str(row['price']) if row['p_abgroup'] == 'a' else 'b', axis=1)


# function for calculating the uplift
def calc_uplift(df, label_name):
    avg_order_value = 25  # 单价收益

    # calculate conversions for each offer type
    base_conv = df[df.p_abgroup == 'b'][label_name].mean()  # 对照
    disc_conv = df[df.p_abgroup == 'a'][label_name].mean()  # 实验

    # calculate conversion uplift for discount and bogo
    disc_conv_uplift = disc_conv - base_conv

    # calculate order uplift
    disc_order_uplift = disc_conv_uplift * len(df[df.p_abgroup == 'a'][label_name])

    # calculate revenue uplift
    disc_rev_uplift = disc_order_uplift * avg_order_value

    print('Discount Conversion Uplift: {0}%'.format(np.round(disc_conv_uplift * 100, 5)))  # 发券
    return disc_conv_uplift

# 训练
val = data[(data['dt'] > 20210101)]
x_val = val[all_cols]
y_val = val['label']
df_data_lift = val.copy()

train = data[(data['dt'] <= 20210101)]

# Look at the conversion rate and sample size in each group
train.pivot_table(values='label',
               index='treatment_key',
               aggfunc=[np.mean, np.size],
               margins=True)

uplift_model = UpliftRandomForestClassifier(n_estimators=10, control_name='b')
# , max_depth=6, min_samples_leaf=50
uplift_model.fit(train[all_cols].values,
                 treatment=train['treatment_key'].values,
                 y=train['label'].values)

# 预测
y_pred = uplift_model.predict(val[all_cols].values)
result = pd.DataFrame(y_pred, columns=uplift_model.classes_)

# 计算 auuc
# If all deltas are negative, assing to control; otherwise assign to the treatment
# with the highest delta
best_treatment = np.where((result < 0).all(axis=1), 'b', result.idxmax(axis=1))


# Create indicator variables for whether a unit happened to have the
# recommended treatment or was in the control group
actual_is_best = np.where(val['treatment_key'] == best_treatment, 1, 0)
actual_is_control = np.where(val['treatment_key'] == 'b', 1, 0)

synthetic = (actual_is_best == 1) | (actual_is_control == 1)
synth = result[synthetic]


auuc_metrics = (synth.assign(is_treated = 1 - actual_is_control[synthetic],
                             conversion = val.loc[synthetic, 'label'].values,
                             uplift_tree = synth.max(axis=1))
                     .drop(columns=list(uplift_model.classes_)))

plot_gain(auuc_metrics, outcome_col='conversion', treatment_col='is_treated')
auuc_score(auuc_metrics, outcome_col='conversion', treatment_col='is_treated')

# 计算阈值
df_data_lift['uplift_score'] = y_pred[:, 3]

lift_list = []
uplift_q_list = []
for i in np.arange(0, 1.1, 0.1):
    uplift_q_i = df_data_lift.uplift_score.quantile(i)
    uplift_q_list.append(uplift_q_i)
    df_q_i_data_lift = df_data_lift[df_data_lift.uplift_score <= uplift_q_i].reset_index(drop=True)
    lift_list.append(calc_uplift(df_q_i_data_lift, 'label'))

plt.plot(uplift_q_list, [np.round(i, 1) for i in list(np.arange(0, 1.1, 0.1))], marker='o')
plt.xlabel('threshold')
plt.title('cumulative gain chart')
plt.ylabel('data ratio')
plt.show()

附2（四分类 lgb 代码，效果最优）：

from __future__ import division
import pandas as pd
import lightgbm as lgb
from sklearn.metrics import accuracy_score
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import time
import datetime
import warnings
import operator
import re

import pickle
import gzip
from sklearn.utils import shuffle
from sklearn import linear_model, datasets
from sklearn import metrics
from sklearn.model_selection import train_test_split

from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier, ExtraTreesClassifier, GradientBoostingClassifier
from sklearn.metrics import classification_report, accuracy_score,roc_auc_score
import pickle
warnings.filterwarnings(action='ignore', category=UserWarning, module='matplotlib')
pd.options.mode.chained_assignment = None  # default='warn'
plt.style.use('seaborn-whitegrid')# 设置图形的显示风格

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# 显示所有列(参数设置为None代表显示所有行，也可以自行设置数字)
pd.set_option('display.max_columns', 100)

# 显示所有行
pd.set_option('display.max_rows', 100)

# 设置数据的显示长度，默认为50
pd.set_option('max_colwidth', 100)

# 禁止自动换行(设置为Flase不自动换行，True反之)
pd.set_option('expand_frame_repr', False)

from causalml.metrics import plot_gain
from causalml.metrics import auuc_score


# function for calculating the uplift
def calc_uplift(df, label_name):
    avg_order_value = 25  # 单价收益

    # calculate conversions for each offer type
    base_conv = df[df.p_abgroup == 'b'][label_name].mean()  # 对照
    disc_conv = df[df.p_abgroup == 'a'][label_name].mean()  # 实验

    # calculate conversion uplift for discount and bogo
    disc_conv_uplift = disc_conv - base_conv

    # calculate order uplift
    disc_order_uplift = disc_conv_uplift * len(df[df.p_abgroup == 'a'][label_name])

    # calculate revenue uplift
    disc_rev_uplift = disc_order_uplift * avg_order_value

    print('Discount Conversion Uplift: {0}%'.format(np.round(disc_conv_uplift * 100, 5)))  # 发券
    return disc_conv_uplift


# 特征

portrait_features = []
action_features = []
purchase_features = []
compete_features = []
bonus_features = []
real_time_features = []
cal_features = []
ota_flight_features = []
emb_cols = []
user_cols = []

fill_na_dict = {i: -1 for i in portrait_features}

fill_na_dict.update({i: 0 for i in action_features if '2' not in i})
fill_na_dict.update({i: -1 for i in action_features if '2' in i})

fill_na_dict.update({i: 0 for i in purchase_features if '_ratio' not in i})
fill_na_dict.update({i: -1 for i in purchase_features if '_ratio' in i})

fill_na_dict.update({i: -1 for i in compete_features})

fill_na_dict.update({i: -1 for i in bonus_features if 'count' not in i})
fill_na_dict.update({i: 0 for i in bonus_features if 'count' in i})

fill_na_dict.update({i: -1 for i in real_time_features if 'cnt' not in i})
fill_na_dict.update({i: 0 for i in real_time_features if 'cnt' in i})

fill_na_dict.update({i: -1 for i in cal_features})
fill_na_dict.update({i: 0 for i in ota_flight_features})

remove_cols = []
fill_na_dict = {key: value for key, value in fill_na_dict.items() if key not in remove_cols}

feature_cols = list(fill_na_dict.keys()) + emb_cols

# 训练
data_new = pd.read_csv('./data/train_data_embedding_all.csv')
val = data_new[data_new['dt'] > 20210101]
x_val = val[feature_cols]

# new_label 为按照 ab 和 label 转换后的四分类
y_val = val['new_label']
df_data_lift = val.copy()
length = len(df_data_lift)

clf_dict = {}
feat_imp_split_dict = {}

treat_cols = [50, 100, 1000]
# 不同的 treatment（这里是金额）
for price in treat_cols:
    print(price)

    train = data_new[(data_new['dt'] <= 20210105)]
    train = train[train['price'] == price]
    label_sample = train['new_label'].value_counts().reset_index()['new_label'].min()
    df_0_sample = train[train['new_label'] == 0].sample(label_sample)
    df_1_sample = train[train['new_label'] == 1].sample(label_sample)
    df_2_sample = train[train['new_label'] == 2].sample(label_sample)
    df_3_sample = train[train['new_label'] == 3].sample(label_sample)
    train = pd.concat([df_0_sample, df_1_sample, df_2_sample, df_3_sample])

    # 提取训练数据
    x_train, x_test, y_train, y_test = train_test_split(train[feature_cols], train['new_label'], test_size=0.2, random_state=10)
    train_data = lgb.Dataset(x_train, label=y_train, free_raw_data=False)
    validation_data = lgb.Dataset(x_test, label=y_test, free_raw_data=False)

    params = {
        'learning_rate': 0.02,
        'boosting_type': 'gbdt',
        'lambda_l1': 0.2,
        'lambda_l2': 0.2,
        'max_depth': 7,
        'num_leaves': 64,
        'metric': {'multi_logloss'},
        'objective': 'multiclass',
        'nthread': -1,
        'num_class': 4,
    }

    clf = lgb.train(params, train_data, valid_sets=[validation_data], num_boost_round=1000, early_stopping_rounds=100)
    clf_dict[price] = clf

    # 特征重要性
    feat_imp_split = pd.DataFrame({
        'column': list(x_train.columns),
        'importance': clf.feature_importance(importance_type='split'),
    }).sort_values(by='importance', ascending=True)
    feat_imp_split_dict[price] = feat_imp_split

    feat_imp_split.plot(x='column', y='importance', kind='barh', figsize=(12.5, 50), title='Feature Importances')
    plt.xlabel('Feature Importance Score')

    class_probs = clf.predict(x_val.values)
    uplift_scores = [i[3] + i[0] - i[2] - i[1] for i in class_probs]
    accuracy_score(list(y_val), np.argmax(class_probs, axis=1))

    df_data_lift['uplift_score' + str(price)] = uplift_scores

    # 评估
    top_3 = sorted(df_data_lift['uplift_score' + str(price)], reverse=True)[:int(length * 0.3)][-1]
    calc_uplift(df_data_lift[df_data_lift['uplift_score5'] > top_3], 'label')


# 保存模型
def dump_obj_compressed(obj, path):
    with gzip.GzipFile(path, "wb") as file:
        pickle.dump(obj, file)

model_dict = {"models":clf_dict, "model_cols":list(x_train.columns), "fillna_dict": fill_na_dict}
dump_obj_compressed(model_dict, "../model/model.pickle".format(price))

# 计算 auuc
result = df_data_lift[['a_' + str(i) for i in treat_cols]]

# 计算 auuc
# If all deltas are negative, assing to control; otherwise assign to the treatment
# with the highest delta
best_treatment = np.where((result < 0).all(axis=1), 'b', result.idxmax(axis=1))


# Create indicator variables for whether a unit happened to have the
# recommended treatment or was in the control group
actual_is_best = np.where(val['treatment_key'] == best_treatment, 1, 0)
actual_is_control = np.where(val['treatment_key'] == 'b', 1, 0)

synthetic = (actual_is_best == 1) | (actual_is_control == 1)
synth = result[synthetic]


auuc_metrics = (synth.assign(is_treated = 1 - actual_is_control[synthetic],
                             conversion = val.loc[synthetic, 'label'].values,
                             uplift_tree = synth.max(axis=1))
                     .drop(columns=['a_' + str(i) for i in treat_cols]))

plot_gain(auuc_metrics, outcome_col='conversion', treatment_col='is_treated')
auuc_score(auuc_metrics, outcome_col='conversion', treatment_col='is_treated')

附3（参考文章）：
https://blog.csdn.net/jinping_shi/article/details/105583375
https://zhuanlan.zhihu.com/p/192960265
https://cloud.tencent.com/developer/news/705938
https://cloud.tencent.com/developer/article/1620903
https://blog.csdn.net/u011984148/article/details/105721582
https://www.zhihu.com/question/391900914
https://www.zhihu.com/question/41252833

C++11 算法详解：std::copy_if 与 std::copy_n 码事漫谈 c++11 c++算法开发语言
文章目录引言std::copy_if：条件筛选复制函数原型核心功能参数解析返回值实现逻辑示例：筛选容器中的偶数注意事项std::copy_n：固定数量复制函数原型核心功能参数解析返回值实现逻辑示例：复制前N个元素注意事项对比分析与应用场景功能差异性能对比典型应用场景`std::copy_if`适用场景`std::copy_n`适用场景最佳实践与常见陷阱1.避免目标容器空间不足2.谓词函数的设计3.
C++游戏开发需要具备哪些能力星宇工作室 c++开发语言
1.C++语言基础：熟悉C++语法，包括变量、数据类型、控制结构（if,for,while等）、函数、类和对象等。理解C++的内存管理，包括堆和栈的区别、动态内存分配（new/delete）和智能指针的使用。掌握C++的高级特性，如模板、异常处理、STL（标准模板库）等。2.面向对象编程（OOP）：理解面向对象的概念，如封装、继承和多态。能够设计和实现面向对象的系统。3.数据结构和算法：熟悉基本的
华为OD机试 2025B卷 - 小明减肥(C++&Python&JAVA&JS&C语言) YOLO大师华为od c++python 华为OD2025B卷华为OD机试华为机试2025B卷华为OD机试2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述小明有n个可选运动，每个运动有对应卡路里，想选出其中k个运动且卡路里和为t。k，t，n都是给定的。求出可行解数量输入描述第一行输入ntk第一行输入每个运动的卡路里按照空格进行分割备注00,00输出描述求出可行解
AIGC空间智能在服装设计领域的颠覆性变革 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶 AIGC ai
AIGC空间智能在服装设计领域的颠覆性变革关键词：AIGC、空间智能、服装设计、数字孪生、生成式AI、3D人体建模、智能设计系统摘要：本文深入探讨AIGC（人工智能生成内容）与空间智能技术在服装设计领域的融合创新，揭示其如何通过三维人体建模、场景模拟、智能生成算法重构传统设计流程。从技术原理层解析空间智能的核心模块，结合生成对抗网络（GAN）、Transformer模型等前沿算法，展示从创意生成到
OpenCV实战之二 | 基于哈希算法比较图像的相似性 w94ghz OpenCV实战笔记 opencv 哈希算法人工智能
前言☘️本章节主要介绍常用的图像相似性评价算法：图像哈希算法。图像哈希算法通过获取图像的哈希值并比较两幅图像的哈希值的汉明距离来衡量两幅图像是否相似。两幅图像越相似，其哈希值的汉明距离越小。图像哈希算法可以用于图片检索，重复图片剔除，以图搜图以及图片相似度比较。目录一、汉明距离二、img_hash模块三、哈希算法哈希算法实现步骤：代码实现一、汉明距离汉明距离（HammingDistance）是用于
煤炭传送带YOLOv8异物检测系统介绍 qq1309399183 计算机视觉实战项目集合 YOLO 目标检测人工智能深度学习计算机视觉传送带识别异物识别
传送带YOLOv8异物检测系统介绍随着工业自动化水平的不断提高，传送带系统在矿山、食品加工、制造业等领域的应用日益广泛。然而，传送带在运行过程中常常会混入各种异物，如金属零件、石块、木块等，这些异物不仅会影响产品质量，还可能损坏设备甚至危及人员安全。基于YOLOv8算法的传送带异物检测系统应运而生，为解决这一问题提供了智能化解决方案。系统概述YOLOv8(YouOnlyLookOnceversio
【学无止境，每天一题】三倍子串请叫我小蜜蜂同学算法 c++
题目：三倍子串题目描述第三届上海青少年算法竞赛T4时间限制:1000ms空间限制:256mb给定一个十进制正整数n，请问可以从n中截取多少种不同的子串，使得子串构成的数字是3的倍数。例如：当n=1234，有且仅有3，12，123，234这四个子串是3的倍数。输入格式单个整数：表示输入的数字n输出格式单个整数：表示3的倍数的子串数量。数据范围对于20%的数据，1≤n≤10^9对于50%的数据，1≤n
Python编程菜鸟教程：从入门到精通的完全指南_python菜鸟教程 2401_89285717 python 开发语言
我们将介绍Python在数据科学、机器学习、Web开发等方面的应用，并带你了解Python社区和生态系统。基础入门Python安装：在官方网站下载安装包，根据不同操作系统进行安装。Mac用户可直接使用Homebrew进行安装Windows用户需下载安装包后进行手动安装Linux用户可使用apt-get或yum进行安装基础语法：Python是一种解释型语言，支持面向对象、函数式和面向过程等多种编程范
Docker快速部署Hive服务长路 ㅤ 运维 Docker配置 Hive环境大数据远程调试
文章目录前言Docker快速配置hive环境资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿里云平台优质作者、专注于Java后端技术领域。涵盖技术内容：Java后端、大数据、算法、分布式微服务、中间件、前端、运维等。博主所有博客文件目录索引：博客目录索引(持续更新)CSDN搜索：长路视频平台：b站-Coder长路Docker快速配置hive环境Ap
算法化资本——智能投顾技术重构金融生态的深度解析田园Coder 人工智能科普人工智能科普
金融市场的数字化进程正经历着本质性跃迁。当传统交易大厅的开放式喊价被服务器集群的低频嗡鸣取代，当投资决策从人类直觉转向概率矩阵计算，一场由人工智能驱动的资本范式革命已悄然降临。智能投顾作为这场变革的核心载体，其技术架构不仅重塑财富管理的运作逻辑，更在认知层面挑战着金融市场的存在根基。理解这场变革的深度与广度，需要穿透技术表象，审视算法与资本结合引发的复杂生态嬗变。智能投顾系统的技术支柱建立于三重认
集训DAY7之线性dp与前缀优化/stl优化心之所向凉月空 c++开发语言数据结构算法
集训DAY7之线性DP与前缀优化/STL优化目录DP的概念与思想核心DP的题目类型线性DP详解DP的优化策略后记DP的概念与思想核心DP的定义DP也就是动态规划(DynamicProgramming)是求解决策过程最优化的过程动态规划主要用于求解以时间划分阶段的动态过程的优化问题DP的基本思想动态规划算法通常用于求解具有某种最优性质的问题。在这类问题中我们常常需要在多个可行解中寻找最优解，其基本思
03 数据可视化的世界非常广阔，除了已提到的类型，还有许多更细分或前沿的可视化形式。晨曦543210 信息可视化人工智能
十五、机器学习与数据科学专用图表特征重要性图（FeatureImportancePlot）用途：展示机器学习模型中各特征对预测结果的贡献度。示例：随机森林模型中影响房价预测的关键因素。混淆矩阵热力图（ConfusionMatrixHeatmap）用途：分类模型性能评估，显示预测结果与真实标签的对比。示例：疾病诊断模型的真阳性/假阳性分布。学习曲线（LearningCurve）用途：分析模型训练过程
AI“大航海”时代：企业人力资源的AI-HR实践与效能提升策略
在数字化浪潮的推动下，人工智能（AI）正以前所未有的速度渗透各行各业，人力资源管理（HR）领域也不例外。AI技术的引入与应用落地，不仅提升HR管理效率，更在深层次上带来人力资源运作模式的变革。什么是AI-HR所谓AI-HR，是指将人工智能技术应用于人力资源管理，并通过机器学习、自然语言处理、数据挖掘等技术，优化招聘、培训、绩效评估、员工关系等人力资源各个业务模块。近年来，随着AI技术的成熟和普及，
【华为OD机试真题 2025B卷】2025华为OD机试 B卷目录，考点说明，持续收录中，已更新700+ 哪吒搬砖工逆袭Java架构师华为od 华为OD机试 2025B卷 python javascript
专栏导读本专栏收录于《华为OD机试（JAVA）真题（B卷+A卷+C卷+D卷+E卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
华为OD机试 - 计算某字符出现次数（Python/JS/C/C++ 2025 B卷 100分）哪吒华为od python javascript 2025B卷华为OD机试
2025B卷华为OD机试统一考试题库清单（持续收录中）以及考点说明（Python/JS/C/C++）。专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述写出一个程序
华为OD机试 - 取零食 - 动态规划（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od 动态规划 python
2025华为OD机试题库（按算法分类）：2025华为OD统一考试题库清单（持续收录中）以及考点说明（Python/JS/C/C++）。专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随
2025上半年最新华为OD机试与面试指南，最新2025B卷独家总结上岸技巧，答读者问！必看！【万字长文，建议收藏】（Python/JS/C/C++）
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
LeetCode——寻找两个有序数组的中位数我爱吃豆芽呀 js算法 leetcode 算法数组合并寻找两个有序数组的中位数
题目：给定两个大小为m和n的有序数组nums1和nums2。请你找出这两个有序数组的中位数，并且要求算法的时间复杂度为O(log(m+n))。你可以假设nums1和nums2不会同时为空。示例1:nums1=[1,3]nums2=[2]则中位数是2.0示例2:nums1=[1,2]nums2=[3,4]则中位数是(2+3)/2=2.5思路：题目中限制了算法的时间复杂度为O(log(m+n)),就要
算法学习领域的宝藏 wylee 算法学习 leetcode
labuladong的算法笔记仓库是算法学习领域的宝藏项目，它围绕LeetCode题目，以培养算法思维为核心，提供丰富学习资源与多种实用工具，助力学习者提升算法能力。项目核心内容：仓库包含60多篇原创文章，基于LeetCode题目展开，全面覆盖各种算法题型与技巧，旨在培养学习者的算法思维，避免单纯的代码堆砌。文章注重思路解释和思维框架构建，通过总结算法套路，帮助学习者少走弯路。学习资源与工具算法可
LeetCode202.快乐数
LeetCode202.快乐数题目：编写一个算法来判断一个数n是不是快乐数。「快乐数」定义为：对于一个正整数，每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为1，也可能是无限循环但始终变不到1。如果这个过程结果为1，那么这个数就是快乐数。如果n是快乐数就返回true；不是，则返回false。示例：输入：n=19n=19n=19输出：truetruetrue解释：12+9
leetcode 202. 快乐数 ∮∞ leetcode 刷题 leetcode 算法职场和发展
编写一个算法来判断一个数n是不是快乐数。「快乐数」定义为：对于一个正整数，每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为1，也可能是无限循环但始终变不到1。如果这个过程结果为1，那么这个数就是快乐数。如果n是快乐数就返回true；不是，则返回false。示例1：输入：n=19输出：true解释：12+92=8282+22=6862+82=10012+02+02=1示例
力扣239 滑动窗口最大值--JS解法大号密码忘了力扣刷题算法 leetcode 数据结构
239.滑动窗口最大值-力扣（LeetCode）(leetcode-cn.com)题目：给你一个整数数组nums，有一个大小为k的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的k个数字。滑动窗口每次只向右移动一位。返回滑动窗口中的最大值。算法核心：1.维护一个大小为K的队列（数组）头部是该队列最大的单调队列；方法：推入元素之前，与该大小为K的队列的队尾元素进行比较，如果推入元
【LeetCode 热题 100】21. 合并两个有序链表——（解法一）迭代法 xumistore LeetCode leetcode 链表算法 java
Problem:21.合并两个有序链表题目：将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。文章目录整体思路完整代码时空复杂度时间复杂度：O(M+N)空间复杂度：O(1)整体思路这段代码旨在解决一个基础且经典的链表问题：合并两个有序链表(MergeTwoSortedLists)。问题要求将两个已按升序排列的链表合并为一个新的、仍然保持升序的链表。该算法采
【LeetCode 热题 100】73. 矩阵置零——（解法一）空间复杂度 O(M + N) xumistore LeetCode leetcode 矩阵算法
Problem:73.矩阵置零题目：给定一个mxn的矩阵，如果一个元素为0，则将其所在行和列的所有元素都设为0。请使用原地算法。文章目录整体思路完整代码时空复杂度时间复杂度：O(M*N)空间复杂度：O(M+N)整体思路这段代码旨在解决“矩阵置零”问题，它通过HashSet来存储需要置零的行和列的索引，并在一个统一的阶段完成置零操作。算法的整体思路是“先标记，后置零”：第一阶段：使用HashSet进
【算法入门】LeetCode 239. 滑动窗口最大值：Java与JavaScript双解法详解｜单调队列的精妙运用力扣239题详解：滑动窗口最大值（Java & JavaScript 双语言实现）南北极之间算法算法 leetcode java
题目：官方链接：https://leetcode.cn/problems/sliding-window-maximum/description/?envType=study-plan-v2&envId=top-100-liked参考答案：【新手入门】LeetCode239.滑动窗口最大值：Java&JavaScript双解法详解目录题目描述问题分析解题思路3.1暴力法（不推荐）3.2单调队列法（最
Leetcode 202. 快乐数 Richest_li python Leetcode leetcode 算法
202.快乐数Leetcode202.快乐数一、题目描述二、我的想法三、其他人的题解一、题目描述编写一个算法来判断一个数n是不是快乐数。「快乐数」定义为：对于一个正整数，每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为1，也可能是无限循环但始终变不到1。如果这个过程结果为1，那么这个数就是快乐数。如果n是快乐数就返回true；不是，则返回false。示例1：输入：n=1
Java 中 LeetCode 热门算法精讲孙恒阳算法 java leetcode
在Java中，如何实现快速排序算法？1、选择基准值：在数组中选择一个元素作为基准值，常见的方法是选择第一个元素或者中间的元素。2、分区操作：将数组分为两个部分，左边部分所有元素小于基准值，右边部分所有元素大于基准值。3、递归排序：对左右两个部分分别进行递归排序。4、合并结果：由于在分区过程中元素已经被重新排列，所以不需要额外的合并操作，递归结束后数组即为有序。5、选择合适的基准值：基准值的选择会影
Tesla的FSD 架构设计 WSSWWWSSW 智能驾驶汽车人工智能 FSD
特斯拉的FSD（完全自动驾驶）架构设计以端到端神经网络为核心，结合专用硬件加速、海量数据训练和持续OTA迭代，形成了一套高度集成的系统。以下从硬件、软件、算法、数据处理和安全机制五个维度展开分析：一、硬件架构：从HW3.0到AI5的算力跃迁HW3.0基础设计采用三星14nm工艺的定制SoC，包含12个Cortex-A72CPU核心、2个NPU（合计73.7TOPS算力）和Mali-G71GPU，支
21.合并两个有序链表太白IT记算法题链表数据结构
将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。思路：这里使用的主要数据结构是单链表。该算法采用经典的双指针技术来合并列表。Adummynodeiscreated;thisnodedoesnotholdanymeaningfulvaluebutservesasthestartingpointofthemergedlinkedlist.将创建一个虚拟节点;
win10 git ssh key 配置后仍然无法连接
问题描述：win10通过ssh-keygen命令生成id_rsakey，并将id_rsa.pub中的key配置到git服务器上，但是gitclone时仍然报错：permissiondenied修改：默认是rsa算法，配置成ed25519算法，生成id_ed25519文件ssh-keygen-ted25519-C"[email protected]"原因：暂未查明，推测是安装的git版本太新，与服务器端
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓