TedSmile

Python中的数据可视化简介

https://mp.weixin.qq.com/s?__biz=MzUyMjg4NjU5OQ==&mid=2247486873&idx=1&sn=7ef23a69ec570f1eab7379c76c2aeb69&chksm=f9c44131ceb3c82703bc20443e463ee30de7cec44b53a63421c67277ba535b6b2f88ddd7c98a&mpshare=1&scene=1&srcid=&pass_ticket=qU5dSYUuA%2FIieNGbbjcECG9HG1kGw1TqO8ZipEjMuTAmRykoF8IAJW7tAsmfoFc9#rd

数据可视化是通过将数据放置在可视上下文中来尝试理解数据的原则，因此可以暴露可能无法检测到的模式，趋势和相关性。

Python提供了多个出色的图形库，这些库包含许多不同的功能。无论您是想创建交互式，实时或高度自定义的绘图，python都能为您提供出色的库。

要获得一些概述，这里有一些流行的绘图库：

Matplotlib：低级别，提供很多自由

https://matplotlib.org/

Pandas Visualization：易于使用的界面，基于Matplotlib构建

https://pandas.pydata.org/pandas-docs/stable/visualization.html

Seaborn：高级界面，很棒的默认样式

https://seaborn.pydata.org/

ggplot：基于R的ggplot2，使用 Grammar of Graphics

http://ggplot.yhathq.com/

https://www.amazon.com/Grammar-Graphics-Statistics-Computing/dp/0387245448

Plotly：可以创建交互式图

https://plot.ly/python/

在本文中，将学习如何使用Matplotlib，Pandas可视化和Seaborn创建基本图，以及如何使用每个库的某些特定功能。本文将重点介绍语法，而不是解释图表。

在后面的文章中，将介绍像Plotly这样的交互式绘图工具，它基于D3构建，也可以与JavaScript一起使用。

导入数据集

在本文中，将使用两个免费提供的数据集。该虹膜和葡萄酒评论数据集，都可以加载在使用pandas read_csv方法。

https://archive.ics.uci.edu/ml/datasets/iris

https://www.kaggle.com/zynicide/wine-reviews

import pandas as pd
iris = pd.read_csv('iris.csv', names=['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class'])
print(iris.head())

图2：Iris数据集头

wine_reviews = pd.read_csv('winemag-data-130k-v2.csv', index_col=0)
wine_reviews.head()

图3：Wine Review数据集头

Matplotlib

Matplotlib是最受欢迎的python绘图库。它是一个低级库，带有类似Matlab的接口，以不得不编写更多代码为代价提供了大量的自由。

要安装Matplotlib，可以使用pip和conda。

pip install matplotlib
or
conda install matplotlib

Matplotlib特别适用于创建基本图形，如折线图，条形图，直方图等等。可以通过输入以下内容导入：

import matplotlib.pyplot as plt

散点图

要在Matplotlib中创建散点图，可以使用该scatter方法。还将创建一个图形和一个轴使用，plt.subplots这样可以给图标题和标签。

# create a figure and axis

fig, ax = plt.subplots()

# scatter the sepal_length against the sepal_width

ax.scatter(iris['sepal_length'], iris['sepal_width'])

# set a title and labels

ax.set_title('Iris Dataset')

ax.set_xlabel('sepal_length')

ax.set_ylabel('sepal_width')

图4：Matplotlib散点图

可以通过在每个数据点中按类别着色来赋予图形更多意义。这可以通过创建一个字典来完成，该字典从一个类映射到另一个颜色，然后使用for循环散布每个点并传递相应的颜色。

# create color dictionary

colors = {'Iris-setosa':'r', 'Iris-versicolor':'g', 'Iris-virginica':'b'}

# create a figure and axis

fig, ax = plt.subplots()

# plot each data-point

for i in range(len(iris['sepal_length'])):

ax.scatter(iris['sepal_length'][i], iris['sepal_width'][i],color=colors[iris['class'][i]])

# set a title and labels

ax.set_title('Iris Dataset')

ax.set_xlabel('sepal_length')

ax.set_ylabel('sepal_width')

图5：按类着色的散点图

折线图

在Matplotlib中，可以通过调用plot方法创建折线图。还可以在一个图中绘制多个列，循环遍历想要的列，并在同一轴上绘制每个列。

# get columns to plot

columns = iris.columns.drop(['class'])

# create x data

x_data = range(0, iris.shape[0])

# create figure and axis

fig, ax = plt.subplots()

# plot each column

for column in columns:

ax.plot(x_data, iris[column])

# set title and legend

ax.set_title('Iris Dataset')

ax.legend()

图6：折线图

直方图

在Matplotlib中，可以使用该hist方法创建直方图。如果将葡萄酒评论数据集中的分类数据（如点列）传递给它，它将自动计算每个类的出现频率。

# create figure and axis

fig, ax = plt.subplots()

# plot histogram

ax.hist(wine_reviews['points'])

# set title and labels

ax.set_title('Wine Review Scores')

ax.set_xlabel('Points')

ax.set_ylabel('Frequency')

图7：直方图

条形图

可以使用该bar方法创建条形图。条形图不会自动计算类别的频率，因此将使用pandas value_counts函数来执行此操作。条形图对于没有很多不同类别（少于30个）的分类数据很有用，因为它可能会变得非常混乱。

# create a figure and axis

fig, ax = plt.subplots()

# count the occurrence of each class

data = wine_reviews['points'].value_counts()

# get x and y data

points = data.index

frequency = data.values

# create bar chart

ax.bar(points, frequency)

# set title and labels

ax.set_title('Wine Review Scores')

ax.set_xlabel('Points')

ax.set_ylabel('Frequency')

图8：条形图

Pandas可视化

Pandas是一个开源的高性能，易于使用的库，提供数据结构，如数据框架，以及数据分析工具，如将在本文中使用的可视化工具。

Pandas Visualization使得从熊猫数据框和系列中创建图表变得非常容易。它还具有比Matplotlib更高级别的API，因此需要更少的代码来获得相同的结果。

可以使用pip或conda安装Pandas。

pip install pandas

or

conda install pandas

散点图

要在Pandas中创建散点图，可以调用.plot.scatter()并传递两个参数，即x列的名称以及y列的名称。也可以选择传递一个标题。

iris.plot.scatter(x='sepal_length', y='sepal_width', title='Iris Dataset')

图9：散点图

正如您在图像中看到的那样，它会自动将x和y标签设置为列名称。

折线图

要在Pandas中创建折线图，可以.plot.line()。在Matplotlib中需要循环遍历想要绘制的每个列，在Pandas中不需要这样做，因为它会自动绘制所有可用的数字列（至少如果没有指定特定的列）。

iris.drop(['class'], axis=1).plot.line(title='Iris Dataset')

图10：折线图

如果有多个功能，Pandas会自动为创建一个图例，如上图所示。

直方图

在Pandas中，可以使用该plot.hist方法创建直方图。没有任何必需的参数，但可以选择传递一些像bin大小。

wine_reviews['points'].plot.hist()

图11：直方图

创建多个直方图也很容易。

iris.plot.hist(subplots=True, layout=(2,2), figsize=(10, 10), bins=20)

图12：多个直方图

该subplots参数指定要对每个功能和独立的情节layout指定每行和列曲线的数量。

条形图

要绘制条形图，可以使用该plot.bar()方法，但在调用它之前，需要获取数据。为此将首先使用value_count()方法计算出现次数，然后使用该方法将出现次数从最小值排序为最大值sort_index()。

wine_reviews['points'].value_counts().sort_index().plot.bar()

图13：垂直条形图

它也很简单使用，使水平条形图plot.barh()方法。

wine_reviews['points'].value_counts().sort_index().plot.barh()

图14：水平条形图

还可以绘制其他数据，然后绘制出现次数。

wine_reviews.groupby("country").price.mean().sort_values(ascending=False)[:5].plot.bar()

图15：葡萄酒最贵的国家（平均）

在上面的例子中，按国家对数据进行分组，然后取出葡萄酒价格的平均值，对其进行排序，并绘制出平均葡萄酒价格最高的5个国家。

Seaborn

Seaborn是一个基于Matplotlib的Python数据可视化库。它提供了一个用于创建有吸引力的图形的高级界面。

Seaborn有很多东西可供选择。您可以在一行中创建图形，在Matplotlib中可以使用数十行。它的标准设计很棒，它还有一个很好的界面来处理pandas数据帧。

可以通过输入以下内容导入：

import seaborn as sns

散点图

可以使用该 .scatterplot方法创建散点图，就像在Pandas中需要传递x和y数据的列名一样，但是现在还需要将数据作为附加参数传递，因为没有调用像在Pandas中那样直接对数据起作用。

sns.scatterplot(x='sepal_length', y='sepal_width', data=iris)

图16：散点图

还可以使用hue参数逐个突出显示点，这比在Matplotlib中要容易得多。

sns.scatterplot(x='sepal_length', y='sepal_width', hue='class', data=iris)

图17：按类着色的散点图

折线图

要创建折线图，sns.lineplot可以使用该方法。唯一需要的参数是数据，在例子中是Iris数据集中的四个数字列。还可以使用sns.kdeplot舍入曲线边缘的方法，因此如果数据集中有很多异常值，则更清晰。

sns.lineplot(data=iris.drop(['class'], axis=1))

图18：折线图

直方图

要在Seaborn中创建直方图，使用该sns.distplot方法。需要将它传递给想要绘制的列，它将自己计算出现次数。如果想在图中绘制高斯核密度估计，也可以传递它的数量。

sns.distplot(wine_reviews['points'], bins=10, kde=False)

图19：直方图

sns.distplot(wine_reviews['points'], bins=10, kde=True)

图20：具有高斯核密度估计的直方图

条形图

在Seaborn中，可以使用该sns.countplot方法创建条形图并将数据传递给它。

sns.countplot(wine_reviews['points'])

图21：条形图

其他图表

现在您已经对Matplotlib，Pandas Visualization和Seaborn语法有了基本的了解，我想向您展示一些对提取内部很有用的其他图形类型。

对于他们中的大多数人来说，Seaborn是去图书馆的，因为它的高级界面允许在几行代码中创建漂亮的图形。

方块图

Box Plot是显示五位数摘要的图形方法。我们可以使用seaborns sns.boxplot方法创建箱形图并将数据以及x和y列名称传递给它。

https://en.wikipedia.org/wiki/Five-number_summary

df = wine_reviews[(wine_reviews['points']>=95) & (wine_reviews['price']<1000)]

sns.boxplot('points', 'price', data=df)

图22：Boxplot

Box Plots就像条形图一样，对于只有少数类别的数据非常有用，但很快就会变得混乱。

热图

热图是数据的图形表示，其中矩阵中包含的各个值表示为颜色。热图非常适合探索数据集中要素的相关性。

为了获得可以调用的数据集内的特征的相关性.corr() ，这是一个Pandas数据帧方法。这将使用相关矩阵。

现在可以使用Matplotlib或Seaborn来创建热图。

Matplotlib：

图23：没有注释的热图

要向热图添加注释，需要添加两个for循环：

# get correlation matrix

corr = iris.corr()

fig, ax = plt.subplots()

# create heatmap

im = ax.imshow(corr.values)

# set labels

ax.set_xticks(np.arange(len(corr.columns)))

ax.set_yticks(np.arange(len(corr.columns)))

ax.set_xticklabels(corr.columns)

ax.set_yticklabels(corr.columns)

# Rotate the tick labels and set their alignment.

plt.setp(ax.get_xticklabels(), rotation=45, ha="right",

         rotation_mode="anchor")

# Loop over data dimensions and create text annotations.

for i in range(len(corr.columns)):

    for j in range(len(corr.columns)):

        text = ax.text(j, i, np.around(corr.iloc[i, j], decimals=2),

                       ha="center", va="center", color="black")

图24：带注释的热图

Seaborn可以更轻松地创建热图并添加注释：

sns.heatmap(iris.corr(), annot=True)

图25：带注释的热图

Faceting

Faceting是跨多个子图破坏数据变量的行为，并将这些子图组合成一个图。

如果您想快速浏览数据集，Faceting非常有用。

要在Seaborn中使用一种Faceting，可以使用FacetGrid 。首先，需要定义FacetGrid并传递数据以及行或列，它们将用于分割数据。然后需要map 在FacetGrid对象上调用函数并定义想要使用的绘图类型，以及想要绘制的列。

g = sns.FacetGrid(iris, col='class')

g = g.map(sns.kdeplot, 'sepal_length')

图26：小平面图

你可以制作比上面的例子更大更复杂的情节。你可以在这里找到一些例子。

https://seaborn.pydata.org/generated/seaborn.FacetGrid.html

Pairplot

最后将向您展示Seaborns pairplot和Pandas scatter_matrix，它们使您能够在数据集中绘制成对关系的网格。

sns.pairplot(iris)

图27：配对图

from pandas.plotting import scatter_matrix

fig, ax = plt.subplots(figsize=(12,12))

scatter_matrix(iris, alpha=1, ax=ax)

图28：散点矩阵

正如您在上面的图像中看到的，这些技术总是相互绘制两个特征。图的对角线用直方图填充，其他图是散点图。

结论

数据可视化是通过将数据放置在可视上下文中来尝试理解数据的原则，因此可以暴露可能无法检测到的模式，趋势和相关性。

Python提供了多个出色的图形库，这些库包含许多不同的功能。在本文中，研究了Matplotlib，Pandas可视化和Seaborn。

本文中介绍的代码以Github存储库的形式提供。

https://github.com/TannerGilbert/Articles/tree/master/Introduction%20to%20Data%20Visualization%20in%C2%A0Python

你可能感兴趣的:(python)

【python】判断值是否为NaN MoFe1 python 开发语言
importmathdefis_nan(value):returnisinstance(value,float)andmath.isnan(value)#测试print(is_nan(float('nan')))#输出：Trueprint(is_nan(None))#输出：Falseprint(is_nan('abc'))#输出：False
print(3 or 5)的结果是什么？为什么？ Lauren_Lu python
print(3or5)的结果是：3原因：在Python中，or是一个逻辑运算符，但当它作用于非布尔类型（比如整数）时，它的行为是：返回第一个为真的值；如果第一个值为假，则返回第二个值。具体分析：3是一个非零整数，在布尔上下文中被视为True所以3or5就是：如果3是True，就返回3；否则返回5由于3是True，所以返回的是3。类似例子：print(0or5)#输出5，因为0被视为Falsepri
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
[python系列] 创建虚拟环境 venv en-route python virtualenv
虚拟环境定义Python中的虚拟环境是一个隔离的运行环境，旨在为每个Python项目提供独立的执行空间，支持在不同的项目中分别管理依赖关系，而不会影响到其他项目或系统的原始Python安装。可以将虚拟环境视为每个Python项目的“独立容器”，每个容器具备以下特点：拥有独立的Python解释器拥有各自独立的包管理和安装的软件包与其他虚拟环境相互隔离允许同一包存在不同版本使用虚拟环境的重要性体现在以
Python代理池的构建与应用：实现高效爬虫与防封禁策略程序员威哥 python 爬虫开发语言
在进行大规模网络数据抓取时，IP封禁是最常见的反爬虫手段之一。为了应对这一挑战，代理池成为了一个重要工具。通过构建代理池，爬虫程序可以随机切换代理IP，避免同一IP被频繁访问而导致封禁，确保数据抓取任务的稳定性和持续性。本文将详细介绍如何使用Python构建一个高效的代理池，并结合实际应用场景，讲解如何使用代理池提升爬虫的抓取能力和防封禁策略。一、代理池的工作原理代理池的基本工作原理是，爬虫请求时
Python爬虫实战：用Tushare和Baostock爬取股票历史数据及K线图与技术指标计算
在金融数据分析和量化交易中，股票历史数据的获取是进行技术分析、回测和策略研究的第一步。传统上，投资者需要依赖付费数据服务，然而如今，借助Python强大的爬虫工具和开源数据接口，我们能够轻松地爬取免费的历史股票数据，并结合K线图与技术指标来进行深入分析。Tushare和Baostock是两个非常流行的开源金融数据接口。Tushare提供了丰富的国内外金融数据，特别是A股市场的历史数据和实时数据，而
Python_计算两个省市之间的直线距离_2506 夏天里的肥宅水 PYTHON python spring 开发语言
更新代码上一版链接importpandasaspdimporttimeimportpickleimportosimportsysfromgeopy.geocodersimportNominatimfromgeopy.distanceimportgeodesicfromtqdmimporttqdm#ConfigurationINPUT_FILE=r"距离.xlsx"#输入文件路径OUTPUT_FIL
python中的*args 和 **kwargs Hi_kenyon python python
简单来说，它们允许一个函数接收不定数量的参数。这在我们预先不知道会传递多少个参数给函数时非常有用。*args(任意数量的位置参数)*args用于在一个函数中接收任意数量的位置参数(positionalarguments)。当你在函数定义中使用*args时，Python会将所有传入的多余的位置参数收集到一个元组(tuple)中。这个名字args只是一个约定俗成的惯例(arguments的缩写)，你也
用 Python 开发文字冒险游戏：从零开始的教程晓天天天向上 python microsoft 开发语言
文字冒险游戏(Text-basedAdventureGame)是一种经典的游戏类型，玩家通过输入文字指令与游戏世界互动。这种游戏不依赖复杂的图形界面，非常适合初学者学习编程逻辑和用户交互。在本篇博客中，我们将用Python开发一个简单的文字冒险游戏，体验游戏开发的乐趣。1.游戏设计思路游戏背景玩家醒来发现自己身处一个神秘的地下城，需要探索房间、收集物品、战胜敌人并找到出口。核心机制房间导航：玩家可
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
Python的一点基础教程------文件读写卡提西亚 python 开发语言
最近在看大佬写的Python教程自学,但是感觉有点头痛,因为大佬讲了一些底层的结构和原理,但是又没那么详细,然后作为一个初学者自学的情况下,看的很费劲.看完就有感而发,想写一篇更基础的教程,教会大家怎么去用它,尽量少的去讲原理.但是当然,你也需要有一定的编程语言基础,了解基本的语法和函数等功能.正所谓师傅领进门,修行在个人,有时候我们学了一个东西,如果觉得很有趣,自然就会去了解关于它的更多信息,但
1.2 Python 的特点与优势 Utopia Reverie python python 开发语言
1.语法简洁易读Python以简洁的语法著称，代码可读性强，减少了不必要的符号和冗余代码。例如，使用缩进来表示代码块，而非传统的大括号。这使得代码更易于理解和维护，尤其适合初学者。示例：python运行【#计算斐波那契数列的前10项n=10a,b=0,1for_inrange(n);print(a,end='')a,b=b,a+b#输出:0112358132134】2.开源与社区支持Python是
动手学Python：从零开始构建一个“文字冒险游戏” network爬虫 python python 开发语言
动手学Python：从零开始构建一个“文字冒险游戏”大家好，我是你的技术向导。今天，我们不聊高深的框架，也不谈复杂的算法，我们来做一点“复古”又极具趣味性的事情——用Python亲手打造一个属于自己的文字冒险游戏（TextAdventureGame）。你是否还记得那些在早期计算机上，通过一行行文字描述和简单指令来探索未知世界的日子？这种游戏的魅力在于它能激发我们最原始的想象力。而对于我们程序员来说
python 脚本遍历目录，并把目录下的非utf-8文件改成utf8 还债大湿兄 python 开发语言数据库
从网上下载的qt项目我本地编译里面经常包含中文，提示编译不过，实际上以前经常手动转，发觉还是用脚本不，毕竟这次下的有点大，我只改.h.cpp#pythonD:\python\filetoUtf.pyE:\EasyCanvas-master\EasyCanvas-masterimportosimportcodecsimportargparseimportsysdefconvert_to_utf8_b
树莓派中 Python+opencv打开摄像头 68lizi 光电设计 python
树莓派中Python+opencv打开摄像头注意不要使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)，我在树莓派使用这个的时候会报错，在windows不会报错，具体原因不清楚cap=cv2.VideoCapture(0)#使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)会报错whileTrue:status,img=cap.read()i
python实现读取文件的指定某行内容 Fitz1318 Python3学习 python
python实现读取文件的指定某行内容最近有一个需求就是读取一个文件中的指定某行的内容，现将方法记录如下importlinecache#这里填写你自己的文件位置和行号text=linecache.getline("../TestFile/test_C1.json",2)print(text)
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
程序化交易系统中如何精准获取MACD、KDJ、BOLL等基础指标的值？股票程序化交易接口量化交易股票API接口 Python股票量化交易程序化交易系统 macd指标 kdj指标 boll指标股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>基础指标在程序化交易系统中的重要性基础指标对交易决策的指导意义MACD、KDJ、BOLL等基础指标在程序化交易系统中扮演着重要角色。MACD可以帮助判断市场的趋势和买卖信号，通过分析其快线和慢线的交叉情况，能为投资者提供入场和出场的参
股票程序化交易软件如何选择？这些要点你知道吗股票程序化交易接口量化交易股票API接口 Python股票量化交易区块链股票程序化交易软件功能特性稳定性成本股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>了解软件功能特性基础交易功能基础交易功能是股票程序化交易软件的核心。它应具备快速下单、撤单等基础操作能力。比如在行情快速变化时，能让投资者迅速抓住机会下单，或者及时撤单避免损失。软件的交易界面要简洁明了，方便投资者操作。还应支持多种交
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python实战：自动在知乎回答点赞并采集内容的高阶爬虫教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 okhttp 学习
✨写在前面：为什么做知乎自动化操作？知乎作为中国领先的知识问答平台，拥有大量结构化内容。对于研究舆情分析、情绪识别、用户画像，甚至产品舆情反馈采集的用户来说，如何自动获取知乎内容并进行交互行为（如点赞、回答），是一个非常实用的能力。本文将手把手带你用Python完成以下目标：✅自动登录知乎✅自动搜索某个关键词下的热门问题✅自动点赞高质量回答✅自动采集回答内容（文本、点赞数、评论数等）✅自动保存为本
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
python实战项目79：采集知乎话题下的所有回答 wp_tao Python副业接单实战项目 python 开发语言
python实战项目79：采集知乎话题下的所有回答一、项目介绍二、代码使用方法三、drissionpage的优缺点四、完整代码五、注意事项一、项目介绍需求是采集知乎某话题下的所有回答，这里以话题“大学宿舍相处之间遇到莫名其妙的冷落怎么办呢？”为例，网页链接为https://www.zhihu.com/question/1898156781215146265，其中189815678121514626
使用 pip 命令下载 whl离线安装包、安装三希 pip
使用pip命令直接从线上下载whl离线安装包并转存到离线环境的过程实际上是分两步进行的：第一步：在线环境下载whl包bash#在具有网络连接的环境中pipdownload--only-binary=:all:--wheel--platform--python-version这里的参数说明：：需要下载的Python包名称。--only-binary=:all:：只下载二进制包（即whl文件）。--w
【Python】如何使用.whl文件安装Python包？ civilpy python 开发语言
基本原理在Python的世界中，.whl文件是一种分发格式，它代表“Wheel”。Wheel是一种Python包格式，旨在提供一种快速、可靠且兼容的方式，用于安装Python库。与源代码包相比，Wheel文件是预编译的，这意味着它们已经包含了编译后的扩展模块，这使得安装过程更快，更简单。代码示例以下是使用.whl文件安装Python包的示例步骤：示例1：基本安装假设你已经下载了一个名为exampl
如何安装 `.whl` 文件（Python Wheel 包）喝醉酒的小白 Liunx Python模块 python 开发语言
目录标题如何安装`.whl`文件（PythonWheel包）安装前提安装方法（3种）方法1：直接使用pip安装（推荐）方法2：先进入文件目录再安装方法3：使用绝对路径（适合脚本中调用）⚠️常见问题解决问题1：版本不兼容错误问题2：缺少依赖问题3：权限不足验证安装进阶技巧如何安装.whl文件（PythonWheel包）.whl文件是Python的二进制分发格式（Wheel格式），用于快速安装Pyth
Python 数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙清水白石008 python Python题库 python 数据挖掘动画
Python数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙引言在数字化浪潮席卷全球的今天，数据已成为企业和组织最重要的战略资产。海量数据蕴藏着巨大的价值，等待我们去挖掘和发现。数据挖掘(DataMining)，作为从海量数据中提取有价值知识和模式的关键技术，正日益受到各行各业的重视。它如同探矿者的火眼金睛，能够穿透数据的迷雾，发现隐藏在背后的规律和趋势，为商业决策、科学研究和社会发展提供强有
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出