aobulaien001

Python学完可实现90%数据分析绘图：Seaborn神器

最近小伙伴问我有什么刷题网站推荐，在这里推荐一下牛客网，里面包含各种面经题库，全是免费的题库，可以全方面提升你的职业竞争力，提升编程实战技巧，赶快来和我一起刷题吧！牛客网链接|python篇

本章主要介绍python的seaborn数据可视化的应用

文章目录

Python数据可视化
python数据可视化大杀器之Seaborn详解
️1.关系图
- 1.1 lineplot
- 1.2 relplot
- 1.3 scatterplot(散点图)
- 1.4 气泡图
2. 分类型图表
- 2.1 boxplot(箱线图)
- 2.2 violinplot(小提琴图)
- 2.3 barplot(条形图)
- 2.4 pointplot(点图)
- 2.5 swarmplot
- 2.6 catplot（分类型图表的接口）
3.分布图
- 3.1 displot(单变量分布图)
- 3.2kdeplot(核密度估计图）
- ☘️3.3绘制山脊图
- 3.4 joinplot(双变量关系分布图)
- 3.5 pairplot(变量关系图)
4. 回归图
- 4.1 lmplot
- 4.2 residplot（残差图）
5.矩阵图
- 5.1 heatmap(热力图)
- 5.2 clustermap聚类图
✏️6.FacetGrid绘制多个图表
- ✒️6.1 绘制多个直方图
- ️6.2 绘制多个折线图
文章推荐

python数据可视化大杀器之Seaborn详解

一张好的图胜过一千个字，一个好的数据分析师必须学会用图说话。python作为数据分析最常用的工具之一，它的可视化功能也很强大，matplotlib和seaborn库使得绘图变得更加简单。本章主要介绍一下Searborn绘图。学过matplotlib的小伙伴们一定被各种参数弄得迷糊，而seaborn则避免了这些问题，废话少说，我们来看看seaborn具体是怎样使用的。

Seaborn中概况起来可以分为五大类图

1.关系类绘图
2.分类型绘图
3.分布图
4.回归图
5.矩阵图

接下来我们一一讲解这些图形的应用，首先我们要导入一下基本的库

%matplotlib inline
# 如果不添加这句，是无法直接在jupyter里看到图的
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

如果上面报错的话需要安装相应的包

pip install seaborn
pip install numpy
pip install pandas
pip install matplotlib

我们可以使用set()设置一下seaborn的主题，一共有:darkgrid,whitegrid,dark,white，ticks，大家可以根据自己的喜好设置相应的主题，默认是darkgrid。我这里就设置darkgrid风格

sns.set(style="darkgrid")

接下来导入我们需要的数据集，seaborn和R语言ggplot2（感兴趣欢迎阅读我的R语言ggplot2专栏）一样有许多自带的样例数据集

# 导入anscombe数据集
df = sns.load_dataset('anscombe')
# 观察一下数据集形式
df.head()

	dataset	x	y
0	I	10.0	8.04
1	I	8.0	6.95
2	I	13.0	7.58
3	I	9.0	8.81
4	I	11.0	8.33

️1.关系图

1.1 lineplot

绘制线段

seaborn里的lineplot函数所传数据必须为一个pandas数组，这一点跟matplotlib里有较大区别，并且一开始使用较为复杂，sns.lineplot里有几个参数值得注意。

x: plot图的x轴label
y: plot图的y轴label
ci: 置信区间
data: 所传入的pandas数组

绘制时间序列图

# 导入数据集
fmri = sns.load_dataset("fmri")

# 绘制不同地区不同时间 x和y的线性关系图
sns.lineplot(x="timepoint", y="signal",
             hue="region", style="event",
             data=fmri)

rs = np.random.RandomState(365)
values = rs.randn(365, 4).cumsum(axis=0)
dates = pd.date_range("1 1 2016", periods=365, freq="D")
data = pd.DataFrame(values, dates, columns=["A", "B", "C", "D"])
data = data.rolling(7).mean()
sns.lineplot(data=data, palette="tab10", linewidth=2.5)

1.2 relplot

这是一个图形级别的函数，它用散点图和线图两种常用的手段来表现统计关系。

# 导入数据集
dots = sns.load_dataset("dots")
sns.relplot(x="time", y="firing_rate",
            hue="coherence", size="choice", col="align",
            size_order=["T1", "T2"],
            height=5, aspect=.75, facet_kws=dict(sharex=False),
            kind="line", legend="full", data=dots)

1.3 scatterplot(散点图)

diamonds.head()

	carat	cut	color	clarity	depth	table	price	x	y	z
0	0.23	Ideal	E	SI2	61.5	55.0	326.0	3.95	3.98	2.43
1	0.21	Premium	E	SI1	59.8	61.0	326.0	3.89	3.84	2.31
2	0.23	Good	E	VS1	56.9	65.0	327.0	4.05	4.07	2.31
3	0.29	Premium	I	VS2	62.4	58.0	334.0	4.20	4.23	2.63
4	0.31	Good	J	SI2	63.3	58.0	335.0	4.34	4.35	2.75

sns.set(style="whitegrid")

# Load the example iris dataset
diamonds = sns.load_dataset("diamonds")

# Draw a scatter plot while assigning point colors and sizes to different
# variables in the dataset
f, ax = plt.subplots(figsize=(6.5, 6.5))
sns.despine(f, left=True, bottom=True)
sns.scatterplot(x="depth", y="table",
                data=diamonds, ax=ax)

1.4 气泡图

气泡图是在散点图的基础上，指定size参数，根据size参数的大小来绘制点的大小

1.4.1 普通气泡图

# 导入鸢尾花数据集
planets = sns.load_dataset("planets")

cmap = sns.cubehelix_palette(rot=-.2, as_cmap=True)
ax = sns.scatterplot(x="distance", y="orbital_period",
                     hue="year", size="mass",
                     palette=cmap, sizes=(10, 200),
                     data=planets)

1.4.2 彩色气泡图

sns.set(style="white")

#加载示例mpg数据集
mpg = sns.load_dataset("mpg")

# 绘制气泡图
sns.relplot(x="horsepower", y="mpg", hue="origin", size="weight",
            sizes=(40, 400), alpha=.5, palette="muted",
            height=6, data=mpg)

2. 分类型图表

2.1 boxplot(箱线图)

箱形图（Box-plot）又称为盒须图、盒式图或箱线图，是一种用作显示一组数据分散情况资料的统计图。它能显示出一组数据的最大值、最小值、中位数及上下四分位数。

绘制分组箱线图

# 导入数据集
tips = sns.load_dataset("tips")

# 绘制嵌套的箱线图，按日期和时间显示账单
sns.boxplot(x="day", y="total_bill",
            hue="smoker", palette=["m", "g"],
            data=tips)
sns.despine(offset=10, trim=True)

2.2 violinplot(小提琴图)

violinplot与boxplot扮演类似的角色，它显示了定量数据在一个（或多个）分类变量的多个层次上的分布，这些分布可以进行比较。不像箱形图中所有绘图组件都对应于实际数据点，小提琴绘图以基础分布的核密度估计为特征。

绘制简单的小提琴图

# 生成模拟数据集
rs = np.random.RandomState(0)
n, p = 40, 8
d = rs.normal(0, 2, (n, p))
d += np.log(np.arange(1, p + 1)) * -5 + 10

# 使用cubehelix获得自定义的顺序调色板
pal = sns.cubehelix_palette(p, rot=-.5, dark=.3)

# 如何使用小提琴和圆点进行每种分布
sns.violinplot(data=d, palette=pal, inner="point")

绘制分组小提琴图

tips = sns.load_dataset("tips")

# 绘制一个嵌套的小提琴图，并拆分小提琴以便于比较
sns.violinplot(x="day", y="total_bill", hue="smoker",
               split=True, inner="quart",
               palette={"Yes": "y", "No": "b"},
               data=tips)
sns.despine(left=True)

2.3 barplot(条形图)

条形图表示数值变量与每个矩形高度的中心趋势的估计值，并使用误差线提供关于该估计值附近的不确定性的一些指示。

绘制水平的条形图

crashes = sns.load_dataset("car_crashes").sort_values("total", ascending=False)

# 初始化画布大小
f, ax = plt.subplots(figsize=(6, 15))
# 绘出总的交通事故
sns.set_color_codes("pastel")
sns.barplot(x="total", y="abbrev", data=crashes,
            label="Total", color="b")

# 绘制涉及酒精的车祸
sns.set_color_codes("muted")
sns.barplot(x="alcohol", y="abbrev", data=crashes,
            label="Alcohol-involved", color="b")

# 添加图例和轴标签
ax.legend(ncol=2, loc="lower right", frameon=True)
ax.set(xlim=(0, 24), ylabel="",
       xlabel="Automobile collisions per billion miles")
sns.despine(left=True, bottom=True)

绘制分组条形图

titanic = sns.load_dataset("titanic")

# 绘制分组条形图
g = sns.barplot(x="class", y="survived", hue="sex", data=titanic,
                 palette="muted")

2.4 pointplot(点图)

点图代表散点图位置的数值变量的中心趋势估计，并使用误差线提供关于该估计的不确定性的一些指示。点图可能比条形图更有用于聚焦一个或多个分类变量的不同级别之间的比较。他们尤其善于表现交互作用：一个分类变量的层次之间的关系如何在第二个分类变量的层次之间变化。连接来自相同色调等级的每个点的线允许交互作用通过斜率的差异进行判断，这比对几组点或条的高度比较容易。

sns.set(style="whitegrid")
iris = sns.load_dataset("iris")

# 将数据格式调整
iris = pd.melt(iris, "species", var_name="measurement")

# 初始化图形
f, ax = plt.subplots()
sns.despine(bottom=True, left=True)

sns.stripplot(x="value", y="measurement", hue="species",
              data=iris, dodge=True, jitter=True,
              alpha=.25, zorder=1)

# 显示条件平均数
sns.pointplot(x="value", y="measurement", hue="species",
              data=iris, dodge=.532, join=False, palette="dark",
              markers="d", scale=.75, ci=None)

# 图例设置
handles, labels = ax.get_legend_handles_labels()
ax.legend(handles[3:], labels[3:], title="species",
          handletextpad=0, columnspacing=1,
          loc="lower right", ncol=3, frameon=True)

可以看出各种鸢尾花四个特征的分布情况，以setosa为例，发现其petal_width值集中分布在0.2左右

2.5 swarmplot

能够显示分布密度的分类散点图

sns.set(style="whitegrid", palette="muted")

# 加载数据集
iris = sns.load_dataset("iris")

# 处理数据集
iris = pd.melt(iris, "species", var_name="measurement")

# 绘制分类散点图
sns.swarmplot(x="measurement", y="value", hue="species",
              palette=["r", "c", "y"], data=iris)

2.6 catplot（分类型图表的接口）

可以通过指定kind参数分别绘制下列图形：

stripplot() 分类散点图
swarmplot() 能够显示分布密度的分类散点图
boxplot() 箱图
violinplot() 小提琴图
boxenplot() 增强箱图
pointplot() 点图
barplot() 条形图
countplot() 计数图

3.分布图

3.1 displot(单变量分布图)

在seaborn中想要对单变量分布进行快速了解最方便的就是使用distplot()函数，默认情况下它将绘制一个直方图，并且可以同时画出核密度估计(KDE)图。具体用法如下：

# 设置并排绘图，讲一个画布分为2*2，大小为7*7，X轴固定，通过ax参数指定绘图位置，可以看第六章具体怎么绘制多个图在一个画布中
f, axes = plt.subplots(2, 2, figsize=(7, 7), sharex=True)
sns.despine(left=True)
rs = np.random.RandomState(10)
# 生成随机数
d = rs.normal(size=100)
# 绘制简单的直方图，kde=False不绘制核密度估计图，下列其他图类似
sns.distplot(d, kde=False, color="b", ax=axes[0, 0])

# 绘制核密度估计图和地毯图
sns.distplot(d, hist=False, rug=True, color="r", ax=axes[0, 1])

# 绘制填充核密度估计图
sns.distplot(d, hist=False, color="g", kde_kws={"shade": True}, ax=axes[1, 0])

# 绘制直方图和核密度估计
sns.distplot(d, color="m", ax=axes[1, 1])
plt.setp(axes, yticks=[])
plt.tight_layout()

3.2kdeplot(核密度估计图）

核密度估计(kernel density estimation)是在统计学中用来估计未知分布的密度函数，属于非参数检验方法之一。通过核密度估计图可以比较直观的看出数据样本本身的分布特征。具体用法如下：

简单的二维核密度估计图

sns.set(style="dark")
rs = np.random.RandomState(50)

x, y = rs.randn(2, 50)
sns.kdeplot(x, y)
f.tight_layout()

多个核密度估计图

sns.set(style="darkgrid")
iris = sns.load_dataset("iris")

# 按物种对iris数据集进行子集划分
setosa = iris.query("species == 'setosa'")
virginica = iris.query("species == 'virginica'")

f, ax = plt.subplots(figsize=(8, 8))
ax.set_aspect("equal")

# 画两个密度图
ax = sns.kdeplot(setosa.sepal_width, setosa.sepal_length,
                 cmap="Reds", shade=True, shade_lowest=False)
ax = sns.kdeplot(virginica.sepal_width, virginica.sepal_length,
                 cmap="Blues", shade=True, shade_lowest=False)

# 将标签添加到绘图中
red = sns.color_palette("Reds")[-2]
blue = sns.color_palette("Blues")[-2]
ax.text(2.5, 8.2, "virginica", size=16, color=blue)
ax.text(3.8, 4.5, "setosa", size=16, color=red)

☘️3.3绘制山脊图

rs = np.random.RandomState(1979)
x = rs.randn(500)
g = np.tile(list("ABCDEFGHIJ"), 50)
df = pd.DataFrame(dict(x=x, g=g))
m = df.g.map(ord)
df["x"] += m

# 初始化FacetGrid对象
pal = sns.cubehelix_palette(10, rot=-.25, light=.7)
g = sns.FacetGrid(df, row="g", hue="g", aspect=15, height=.5, palette=pal)

# 画出密度
g.map(sns.kdeplot, "x", clip_on=Fals
"?e, shade=True, alpha=1, lw=1.5, bw=.2)
g.map(sns.kdeplot, "x", clip_on=False, color="w", lw=2, bw=.2)
g.map(plt.axhline, y=0, lw=2, clip_on=False)

# 定义并使用一个简单的函数在坐标轴中标记绘图
def label(x, color, label):
    ax = plt.gca()
    ax.text(0, .2, label, fontweight="bold", color=color,
            ha="left", va="center", transform=ax.transAxes)

g.map(label, "x")

# 将子地块设置为重叠
g.fig.subplots_adjust(hspace=-.25)

# 删除与重叠不协调的轴
g.set_titles("")
g.set(yticks=[])
g.despine(bottom=True, left=True)

3.4 joinplot(双变量关系分布图)

用于绘制两个变量间分布图

sns.set(style="white")
# 创建模拟数据集
rs = np.random.RandomState(5)
mean = [0, 0]
cov = [(1, .5), (.5, 1)]
x1, x2 = rs.multivariate_normal(mean, cov, 500).T
x1 = pd.Series(x1, name="$X_1$")
x2 = pd.Series(x2, name="$X_2$")

# 使用核密度估计显示联合分布
g = sns.jointplot(x1, x2, kind="kde", height=7, space=0)

rs = np.random.RandomState(11)
x = rs.gamma(2, size=1000)
y = -.5 * x + rs.normal(size=1000)

sns.jointplot(x, y, kind="hex", color="#4CB391")

tips = sns.load_dataset("tips")
g = sns.jointplot("total_bill", "tip", data=tips, kind="reg",
                  xlim=(0, 60), ylim=(0, 12), color="m", height=7)

3.5 pairplot(变量关系图)

变量关系组图，绘制各变量之间散点图

df = sns.load_dataset("iris")
sns.pairplot(df)

4. 回归图

4.1 lmplot

lmplot是用来绘制回归图的，通过lmplot我们可以直观地总览数据的内在关系，lmplot可以简单通过指定x,y,data绘制

# 绘制整体数据的回归图
sns.lmplot(x='x',y='y',data=df)

# 使用分面绘图，根据dataset分面
sns.lmplot(x="x", y="y", col="dataset", hue="dataset", data=df,
           col_wrap=2, ci=None)

上面显示了每一张图内画一个回归线，下面我们来看如何在一张图中画多个回归线

# 加载鸢尾花数据集
iris = sns.load_dataset("iris")
g = sns.lmplot(x="sepal_length", y="sepal_width", hue="species",
               truncate=True, height=5, data=iris)
# 使用truncate参数
# 设置坐标轴标签
g.set_axis_labels("Sepal length (mm)", "Sepal width (mm)")

可以看出setosa类型的鸢尾花主要集中在左侧，下面我们再来看一下怎么绘制logistic回归曲线

# 加载 titanic dataset
df = sns.load_dataset("titanic")

# 显示不同性别年龄和是否存活的关系
g = sns.lmplot(x="age", y="survived", col="sex", hue="sex", data=df,
                y_jitter=.02, logistic=True)
g.set(xlim=(0, 80), ylim=(-.05, 1.05))

虽然仅仅使用一个变量来拟合logistic回归效果不好，但是为了方便演示，我们暂且这样做，从logistic回归曲线来看，男性随着年龄增长，存活率下降，而女性随着年龄上升，存活率上升

4.2 residplot（残差图）

线性回归残差图
绘制现象回归得到的残差回归图

sns.set(style="whitegrid")

# 模拟y对x的回归数据集
rs = np.random.RandomState(7)
x = rs.normal(2, 1, 75)
y = 2 + 1.5 * x + rs.normal(0, 2, 75)

# 绘制残差数据集，并拟合曲线
sns.residplot(x, y, lowess=True, color="g")

从结果来看，回归结果较好，这是因为我们的数据就是通过回归的形式生成的

5.矩阵图

5.1 heatmap(热力图)

常见的我们使用热力图可以看数据表中多个变量间的相似度

# 加载数据
flights_long = sns.load_dataset("flights")
# 绘制不同年份不同月份的乘客数量
flights = flights_long.pivot("month", "year", "passengers")

# 绘制热力图，并且在每个单元中添加一个数字
f, ax = plt.subplots(figsize=(9, 6))
sns.heatmap(flights, annot=True, fmt="d", linewidths=.5, ax=ax)

绘制相关系数矩阵，绘制26个英文字母之间的相关系数矩阵

from string import ascii_letters

sns.set(style="white")

# 随机数据集
rs = np.random.RandomState(33)
d = pd.DataFrame(data=rs.normal(size=(100, 26)),
                 columns=list(ascii_letters[26:]))

# 计算相关系数
corr = d.corr()

mask = np.zeros_like(corr, dtype=np.bool)
mask[np.triu_indices_from(mask)] = True

# 设置图形大小
f, ax = plt.subplots(figsize=(11, 9))

# 生成自定义颜色
cmap = sns.diverging_palette(220, 10, as_cmap=True)

# 绘制热力图
sns.heatmap(corr, mask=mask, cmap=cmap, vmax=.3, center=0,
            square=True, linewidths=.5, cbar_kws={"shrink": .5})

5.2 clustermap聚类图

sns.set()

# 加载大脑网络示例数据集
df = sns.load_dataset("brain_networks", header=[0, 1, 2], index_col=0)

# 选择网络的子集
used_networks = [1, 5, 6, 7, 8, 12, 13, 17]
used_columns = (df.columns.get_level_values("network")
                          .astype(int)
                          .isin(used_networks))
df = df.loc[:, used_columns]

# 创建一个分类调色板来识别网络
network_pal = sns.husl_palette(8, s=.45)
network_lut = dict(zip(map(str, used_networks), network_pal))

# 将调色板转换为将在矩阵侧面绘制的向量
networks = df.columns.get_level_values("network")
network_colors = pd.Series(networks, index=df.columns).map(network_lut)

# 画出完整的聚类图
sns.clustermap(df.corr(), center=0, cmap="vlag",
               row_colors=network_colors, col_colors=network_colors,
               linewidths=.75, figsize=(13, 13))

✏️6.FacetGrid绘制多个图表

是一个绘制多个图表（以网格形式显示）的接口。
步骤：

1、实例化对象
2、map，映射到具体的 seaborn 图表类型
3、添加图例

✒️6.1 绘制多个直方图

sns.set(style="darkgrid")

tips = sns.load_dataset("tips")
g = sns.FacetGrid(tips, row="sex", col="time", margin_titles=True)
bins = np.linspace(0, 60, 13)
g.map(plt.hist, "total_bill", color="steelblue", bins=bins)

️6.2 绘制多个折线图

sns.set(style="ticks")

# 创建一个包含许多短随机游动的数据集
rs = np.random.RandomState(4)
pos = rs.randint(-1, 2, (20, 5)).cumsum(axis=1)
pos -= pos[:, 0, np.newaxis]
step = np.tile(range(5), 20)
walk = np.repeat(range(20), 5)
df = pd.DataFrame(np.c_[pos.flat, step, walk],
                  columns=["position", "step", "walk"])

# 为每一次行走初始化一个带有轴的网格
grid = sns.FacetGrid(df, col="walk", hue="walk", palette="tab20c",
                     col_wrap=4, height=1.5)

# 画一条水平线以显示起点
grid.map(plt.axhline, y=0, ls=":", c=".5")

# 画一个直线图来显示每个随机行走的轨迹
grid.map(plt.plot, "step", "position", marker="o")

# 调整刻度位置和标签
grid.set(xticks=np.arange(5), yticks=[-3, 3],
         xlim=(-.5, 4.5), ylim=(-3.5, 3.5))

# 调整图形的布局
grid.fig.tight_layout(w_pad=1)

---------------------------END---------------------------

题外话

感兴趣的小伙伴，赠送全套Python学习资料，包含面试题、简历资料等具体看下方。

CSDN大礼包：全网最全《Python学习资料》免费赠送！（安全链接，放心点击）

一、Python所有方向的学习路线

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

二、Python必备开发工具

工具都帮大家整理好了，安装就可直接上手！

三、最新Python学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。

四、Python视频合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

六、面试宝典

简历模板

CSDN大礼包：全网最全《Python学习资料》免费赠送！（安全链接，放心点击）

若有侵权，请联系删除

你可能感兴趣的:(python,数据分析,信息可视化)

hive表指定分区字段搜索_Hive学习-Hive基本操作（建库、建表、分区表、写数据）... weixin_39710660 hive表指定分区字段搜索
hive简单认识Hive是建立在HDFS之上的数据仓库，所以Hive的数据全部存储在HDFS上。Hive的数据分为两部分，一部分是存在HDFS上的具体数据，一部分是描述这些具体数据的元数据信息，一般Hive的元数据存在MySQL上。Hive是类SQL语法的数据查询、计算、分析工具，执行引擎默认的是MapReduce，可以设置为Spark、Tez。Hive分内部表和外部表，外部表在建表的同时指定一个
PyDeequ库在AWS EMR启动集群中数据质量检查功能的配置方法和实现代码 weixin_30777913 python spark 大数据云计算 aws
PyDeequ是一个基于ApacheSpark的PythonAPI，专门用于定义和执行“数据单元测试”，从而在大规模数据集中测量数据质量。PyDeequ框架在PySpark代码中提供了全面的数据质量检查功能，能够帮助用户&有效地监控和提升大规模数据集的数据质量。它在PySpark代码中的数据质量检查功能主要包括以下几个方面：核心组件指标计算（MetricsComputation）：利用分析器（An
Transformer模型结构分析：Encoder、Decoder以及注意力机制详解 AI天才研究院 Python实战大数据AI人工智能自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Transformer模型由论文[1]提出，其基本思想是使用注意力机制代替循环神经网络(RNN)或卷积神经网络(CNN)，是一种基于序列到序列(Seq2seq)的机器翻译、文本摘要、对话系统等任务的成功范例。Transformer模型使用全连接层代替RNN和CNN的门控结构，并用多头注意力机制进行了改进，能够在捕捉全局上下文信息的同时，还保持输入输出序列之间的独
StarRocks常用命令 sunny05296 数据库数据库
目录1、StarRocks集群管理&配置命令2、StarRocks常用操作命令3、StarRocks数据导入和导出1、StarRocks集群管理&配置命令查询FE节点信息SHOWfrontends;SHOWPROC'/frontends';mysql-h192.168.1.250-P9030-uroot-p-e"SHOWPROC'/dbs';"查询BE节点信息SHOWbackends;SHOWPR
python实现简单的二维有限元计算成田日上曾经笔记 python 悬臂梁有限元结构力学
有限元算法依据常见的有限元法教材，简单复现悬臂梁在重力作用下的形变（为了变形更明显，重力大小扩大了10倍），还没来得及写注释。【卧槽快跑，没注释！】节点是随机函数撒的点，完全没有优化；meshpy库中的Delauny优化算法计算得到三角单元；pygame实现图形绘制，图形如下（文字是自己后来写上去的）：importnumpyasnpimportcopyimportpygame,sysfrompyg
Python报错：PermissionError: [Errno 13] Permission denied解决方案详解：642 python 开发语言
写项目时候出现了PermissionError:[Errno13]Permissiondenied:'C:\\Users\\lenovo\\AppData\\Local\\Temp\\tmpjbuaiz4w.wav'错误，测试了一下发现是项目中音频的错误，下方是测试代码frompydubimportAudioSegmentfrompydub.playbackimportplayaudio=Audi
yolov8使用Python训练识别枫林古月 YOLO从零开始 YOLO python 开发语言
环境要求:根据《yolov8训练环境搭建》搭建好运行环境参考文献:1、yolo官方文档python版本：https://docs.ultralytics.com/usage/python/2、github文档https://github.com/ultralytics/ultralytics/blob/main/README.zh-CN.md3、标定源数据的生成使用labelImg来标定类别,输出
ElasticSearch第十六讲 ES 索引模板Index Template与Dynamic Template 程序员路同学 ElasticSearch elasticsearch java 大数据
IndexTemplateIndexTemplates可以帮助你设定Mappings和Settings，并按照一定的规则，自动匹配到新创建的索引之上。模版仅在一个索引被新创建时，才会产生作用。修改模版不会影响已创建的索引，你可以设定多个索引模版，这些设置会被“merge”在一起，你可以指定“order”的数值，控制“merging”的过程索引模板中的内容settings:指定index的配置信息,
jenkins的pipline(碎碎念) Junzizhiai Jenkins jenkins
流水线语法本节是建立在流水线入门内容的基础上，而且，应当被当作一个参考。对于在实际示例中如何使用流水线语法的更多信息,请参阅本章在流水线插件的2.5版本中的使用Jenkinsfile部分,流水线支持两种离散的语法，具体如下对于每种的优缺点,参见语法比较。正如本章开始讨论的,流水线最基础的部分是“步骤”。基本上,步骤告诉Jenkins要做什么，以及作为声明式和脚本化流水线语法的基本构建块。对于可用步
设计转换Apache Hive的HQL语句为Snowflake SQL语句的Python程序方法 weixin_30777913 python 数据仓库 hive sql
首先，根据以下各类HQL语句的基本实例和官方文档记录的这些命令语句各种参数设置，得到各种HQL语句的完整实例，然后在Snowflake的官方文档找到它们对应的SnowflakeSQL语句，建立起对应的关系表。在这个过程中要注意HQL语句和SnowflakeSQL语句的区别，比如Hive可以给单个用户加权限，但是Snowflake数据仓库是RBAC，也就是基于角色的权限控制，所以HQL语句中给用户加
【Python百日基础系列】Day25 - 真机安装Ubuntu20.04服务器版 + Mysql8 岳涛@泰山医院 Dash python ubuntu
文章目录一、Ubuntu服务器版下载二、制作启动U盘，RAW写入三、笔记本真机安装Ubuntu20.04服务器版3.1设置笔记本U盘启动，插入启动U盘3.2检查安装文件完整性，需要一两分钟3.3选择语言3.4确认语言和布局3.5确认网络连接3.6输入代理地址，默认空着就行3.7确认服务器地址，默认就行3.8设置磁盘，默认就行3.9再次确认磁盘分区，默认就行3.10输入用户名、电脑名和密码3.11安
Erpnext安装人间不值得T皿T 开源项目 python erp 开源项目 javascript
Erpnext安装环境要求Ubuntu23.04x86_64Python3.10.12pip23.0.1nodev18.16.0npm9.5.1yarn1.22.22MariaDB10.11.2Redis7.0.8wkhtmltox0.12.6.1bench5.22.6环境安装Reids安装//安装7.0.8也可不指定版本直接执行sudoaptinstallredis-serversudoapti
wifi模块服务器通讯协议,模块之间通信协议高杉峻 wifi模块服务器通讯协议
模块之间通信协议内容精选换一换IEC61499是分布式工业测量，控制和监控系统的功能块标准，既然它是面向工业测量和控制的系统，对系统的确定性(Deterministic)要求必然也比较高。确定性又是安全性的前提。保证系统的确定性的两个重要措施是保证系统的实时性和同步性。分布式系统结构又进一步增加了实现确定性的难来自：博客网络编程一、网络编程基础python的网络编程模块主要支持两种Internet
呼叫中心部门如何激发员工的创新和潜能野蛮的大西瓜 FreeIPCC转载开源人工智能音频实时音视频视频编解码
呼叫中心部门如何激发员工的创新和潜能作者：基于Java、Python与FreeSWITCH的开源大模型智能呼叫中心系统FreeAICC，Github地址：https://github.com/FreeIPCC/FreeAICC激发员工的创新和潜能是提升组织竞争力、推动持续发展的关键。以下是一些有效的策略，旨在营造一个鼓励创新、促进个人成长的工作环境：一、建立创新文化倡导开放思维：鼓励员工提出新想法
Python 爬虫实战案例 - 获取拉勾网招聘职位信息西攻城狮北 python 爬虫拉勾网招聘信息
引言拉勾网，作为互联网招聘领域的佼佼者，汇聚了海量且多样的职位招聘信息。这些信息涵盖了从新兴科技领域到传统行业转型所需的各类岗位，无论是初出茅庐的应届生，还是经验丰富的职场老手，都能在其中探寻到机遇。对于求职者而言，能够快速、全面地掌握招聘职位的详细情况，如薪资待遇的高低、工作地点的便利性、职位描述所要求的技能与职责等，无疑能在求职路上抢占先机。而企业方，通过分析同行业职位信息的发布趋势、薪资水平
Python Flask框架基础（五）数据库 525小白菜 Python Web编程数据库 python flask
数据库是大多数动态Web程序的基础设施，本章主要介绍如何给Flask程序添加数据库支持，具体来说就是在Python中使用DBMS来对数据库进行管理和操作。使用ORM不光可以解决SQL注入的问题，而且它为不同的DBMS提供统一的Python接口库，使得切换数据库非常简单。ORM把底层的SQL数据实体转化成高层的Python对象，这样甚至不用了解SQL，只需要通过Python代码即可完成数据库操作，O
python调用git在windows,ImportError在Windows 10 Git Bash上使用Anaconda Python导入_ssl Kuchiki Touko
ContextIamworkingbehindacorporateproxywithaself-signedcertificate.Ihavedocumentedthisextensively.TheissuenowisthatTLS/SSLmoduleisnotloadingcorrectlytoevenverifythecertificates.Windows10Anaconda2018.12
【转载】通过 GetMessageExtraInfo 方法判断当前收到的鼠标消息是否来自触控板和 Pen 涟幽516 windows microsoft
大家都知道，在不开启WM_Pointer的情况下，无论是走WM_Touch或者是RealTimeStylus等方式，默认下触摸都会提升为鼠标消息从而更好兼容应用程序的逻辑如果此时应用程序想要根据消息循环里面接收到的Win32消息判断一个鼠标消息的来源是否来自于触摸框触摸屏或者是Pen笔等，可以通过GetMessageExtraInfo方法获取更多的信息根据GetMessageExtraInfo方法
在 MicroPython ESP32-C3 单片机中调用 DeepSeek API 以及部分问题的解决电池漏液 python 单片机嵌入式硬件
在MicroPythonESP32-C3单片机中调用DeepSeekAPI的实践与问题解决背景本文记录在MicroPythonESP32-C3上调用DeepSeekAPI时遇到的问题及解决方案，包含中文编码异常处理和请求报文长度限制问题。依赖代码使用到urequests模块(requests模块的micropython版本)安装方法参考mpremote安装第三方库mpremotemipinstal
Python Flask框架 Taopad PYthon web flask python
PythonFlask框架Flask框架简介安装过程Falsk程序的运行过程基本语法/结构如有错误，请指正Flask框架简介Flask是一个轻量级的可定制框架，使用Python语言编写，较其他同类型框架更为灵活、轻便、安全且容易上手。它可以很好地结合MVC模式进行开发，开发人员分工合作，小型团队在短时间内就可以完成功能丰富的中小型网站或Web服务的实现。另外，Flask还有很强的定制性，用户可以根
【Flask】在Flask应用中使用Flask-Limiter进行简单CC攻击防御 SmallBambooCode flask python 后端
前提条件已经有一个Flask应用。已经安装了Flask和redis服务。步骤1：安装Redis和Flask-Limiter首先，需要安装redis和Flask-Limiter库。推荐在生产环境中使用Redis存储限流信息。pipinstallredisFlask-LimiterFlask-Limiter会通过redis存储限流信息，确保应用不会在高并发的情况下发生性能瓶颈。步骤2：配置Redis连
[问题]- pip install pyqt6-tool失败浅水鲤鱼 pip python 开发语言
问题(.venv)PSD:\PythonProject\demo1>pipinstallpyqt6-tools-i[https://pypi.tuna.tsinghua.edu.cn/simple](https://pypi.tuna.tsinghua.edu.cn/simple)Python安装pyqt6-tools工具失败原因pyqt6-tools目前（2024年12月）支持最高到Python
使用 Python 获取淘宝商品描述的 API 接口：示例代码解析 Jelena15779585792 API 示例代码 python 前端 java
在电商数据分析、商品信息展示或内容管理系统中，获取商品描述是一个常见的需求。淘宝开放平台提供了丰富的API接口，其中item_get接口可以用来获取商品的详细信息，包括商品描述。本文将通过一个完整的Python示例代码，详细解析如何调用淘宝item_get接口获取商品描述，并处理返回的数据。一、淘宝开放平台简介淘宝开放平台（TaobaoOpenPlatform）为开发者提供了丰富的API接口，用于
使用 Python 获取淘宝商品评论 API 接口的示例代码解析 Jelena15779585792 API 示例代码 python 前端
在电商数据分析、用户体验优化和竞品分析中，获取商品评论是一项重要的功能。淘宝开放平台提供了商品评论的API接口，允许开发者通过合法的方式获取商品的用户评论数据。本文将详细介绍如何使用Python调用淘宝商品评论API接口，并解析返回的数据。一、淘宝商品评论接口简介淘宝开放平台提供了taobao.traderate.items.get接口，用于获取商品的评论数据。该接口支持分页查询，可以获取用户的评
《亿级流量下的架构实战：HTTP全链路解析与智能监控系统搭建》我的青春不太冷架构 http 网络协议科技经验分享学习网络
文章目录全链路解析：HTTP请求响应与数据可视化监控一、HTTP请求响应全流程解析1.全链路交互流程图2.关键技术实现2.1前端请求构造（ES6+语法示例）2.2服务端处理架构（Node.js/Express）二、数据可视化监控方案1.数据存储架构设计2.数据库操作层实现3.管理界面实现方案3.1可视化看板路由//routes/admin.js3.2数据可视化模板（EJS示例）4.最佳实践建议4.
U504405 破译诸葛亮的密码箱 qystca c语言算法数据结构链表图论深度优先 c++
题目背景在《三国演义》中，诸葛亮以其卓越的智慧和深思熟虑的战略而著称。某日，诸葛亮在蜀汉准备重要军事行动时，为了确保信息安全，他将一份机密文件放到一个密码箱里面，并设置了一道谜题，只有解出谜题才能知道密码。题目描述诸葛亮有一棵有n个顶点的树。初始时，所有顶点都是白色的。树上有两颗棋子，分别叫做PA和PB。PA和PB最初分别位于顶点a和b。在一个步骤中，诸葛亮将依次执行以下操作：将PA移动到相邻顶点
django 唱歌的人不掉泪字写笔记 django python
1、WEB与服务器1.WEB表示用户可以浏览的网页内容（HTML，CSS，JS）2.服务器能够给用户提供服务的机器1.硬件与软件硬件范畴：一台机器软件范畴：一个能够接收用户请求并给出响应的程序APACHETOMCATIISNginx2.作用存储web所需要的信息（HTML，图片，文件，…）能够处理用户的请求（request），并给出响应（response）执行服务器端程序：数据库操作3.WEB与服
vscode设置python版本_VS Code配置多Python版本运行环境 AR新视野
正儿八经开始使用的第一个编辑器就是VSCode，所以基本没怎么用过Sublime，比较是无从谈起，不过VSCode用起来真是顺手啊。配置好的话，直接在VSCode里面进行Python开发、调试，完全不是问题。不过使用Python难免需要用到多个Python版本，讲一下如何在VSCode中进行配置。系统中Python多版本管理之前一直用Anaconda，直接用conda创建并管理多版本Python。
python return用法_为什么函数在python中以“return 0”而不是“return”结尾？ weixin_39779467 python return用法
你能解释一下“回归0”和“回归”之间的区别吗？例如：do_1():foriinxrange(5):do_sth()return0do_2():foriinxrange(5):do_sth()return上面两个函数有什么区别？解决方法:取决于用法：>>>defret_Nothing():...return...>>>defret_None():...returnNone...>>>defret_0
django 设置媒体url_(django)url路由配置及渲染方式洪文律所 django 设置媒体url
一，url路由path及转化器URL(uniformResoureLocator)统一资源定位符，是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示，是互联网上标准资源的地址，互联网上的每个文件都有唯一的URL，它包含的信息指出文件的位置以及浏览器应该怎么处理它。设置好url，用户才能访问1，URL的格式：解释：schema://host[:port#]/path/.../[?query
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少