企研数据

Python 实战 | ChatGPT + Python 实现全自动数据处理/可视化

目录

Part1引言

Part2成果演示——口述式数据可视化

Part3原理概述

Part4实现过程

1、环境配置

2、申请 OpenAI 账号

3、调用 ChatGPT API

4、设计 AI 身份，全自动处理数据

Part5再谈此次探索

Part6总结

Part1引言

OpenAI 公司开发的 ChatGPT 已经火了一年多了，这期间各种 AI 产品以及创意层出不穷，问答的、画画的、写论文的……总之啥都有。很多程序员在日常工作中也会使用 ChatGPT 来编写代码解决问题，笔者也是其中之一，在使用过程中，笔者逐渐萌生出一些奇妙的想法。

AI 虽然强大，但种种原因限制了它与计算机文件的交互，所以在数据处理中，AI 只能是一个“军师”角色，有谋却无勇，不能直接帮我们处理数据。既然如此，我们能不能使用 Python 对 ChatGPT 做一个“浅加工”，调用 OpenAI 提供的 API，再辅以艺术性提问，让AI 根据我们的指令直接处理电脑中的数据，或者做一些数据可视化的工作呢？一番探索后，笔者得到了振奋人心的成果，接下来就把成果、原理和过程分享给大家。

本文中所有 Python 代码均在集成开发环境 Visual Studio Code (VScode) 中使用交互式开发环境 Jupyter Notebook 中编写。

Part2成果演示——口述式数据可视化

首先，我在 Jupyter Notebook 中开发出我的 AI 程序，随后我将一个 Excel 数据表存放到与程序同一级的文件夹中。放进来的 Excel 表名为“中国历年数字经济核心产业大类被授权实用新型专利申请数.xlsx”，使用 WPS 打开后如下图所示。

接下来我先后给出以下几条指令。

第一条指令：使用 Pandas 读取当前目录下名为“中国历年数字经济核心产业大类被授权实用新型专利申请数.xlsx”的文件，变量命名为 data。ChatGPT 收到指令后就照做了，这一步还没有得到什么成果。

第二条指令：使用变量 data 中的数据，以“申请年份”为横轴，分别以“01数字产品制造业被授权实用新型专利数”、 “02数字产品服务业被授权实用新型专利数”、 “03数字技术应用业被授权实用新型专利数”和“04数字要素驱动业被授权实用新型专利数”为纵轴，绘制四条折线图。于是 ChatGPT 按照指令，给出了下面这个折线图以及绘制者个折线图用到的 Python 代码。

第三条指令：将四个图例分别修改成“数字产品制造业”、“数字产品服务业”、“数字产品应用业”和“数字要素驱动业”。ChatGPT 照做，并直接给出了改进后的成果。

第四条指令：在折线图右边添加一个纵轴，内容是data中的“被授权实用新型专利数”字段，横轴不变，在折线图中添加一幅柱状图。最后 ChatGPT 依然不动声色地完成任务并给出结果。

从以上成果来看，我们的 “进化版” ChatGPT 已经能够根据我们的命令完成数据处理任务。最重要的是，AI 给出的不是建议或者代码，而是处理的结果。如果仅仅使用 ChatGPT，目前来说这一定是不可能做到的，但它和 Python 结合起来却让人感到惊喜。

Part3原理概述

这个看上去很了不起的程序，背后原理却算不上复杂，相当于是给霍金先生换上了一副像施瓦辛格那样健硕的躯体（打趣一下，绝对无意冒犯）。

如果 ChatGPT 是那个聪明绝顶的脑袋，那么 Python 就是那副强大的躯体。AI 虽然强大，但是没有直接操作我们计算机本地文件的权限；Python 语言也很强大，但没办法根据文字指令为我们解决个性化的问题。于是我们就使用 Python 去调用 OpenAI 提供的 ChatGPT API 接口，再由我们去提出实际的需求，ChatGPT 返回处理的 Python 代码之后，我们想办法让 Python 自动地在本地计算机中去运行 ChatGPT 给出的代码，由于代码是在我们自己的电脑中运行的，结果自然也可以得到保留。也就是说实际的处理工作都是 Python 去完成的，ChatGPT 自始至终都没有接触到我们的数据，因此并不存在数据安全问题，这一点超级重要！

一套操作之后就有了文章开头那样的成果。不过原理说起来简单，真正实现的过程中，也遇到了不少问题，下面是其中几个关键点：

ChatGPT 的答案中一般同时含有描述性文字和代码，如何精准运行代码而忽略描述性文字？
ChatGPT 返回的结果是字符串，怎么把字符串直接当做代码运行呢，运行后又如何保留代码中的变量？
如何实现连续对话？

以上问题的答案，都可以在下文中找到。

Part4实现过程

1、环境配置

先在我们的电脑中安装好 Python 环境以及开发环境，然后在终端中使用以下命令安装调用 ChatGPT 的第三方库。

pip install openai

2、申请 OpenAI 账号

与 OpenAI API 进行交互之前，我们需要有与其进行通信时的身份验证凭证，以确保我们的请求被正确处理。这就需要你在 OpenAI 的网站上创建一个帐号，并在账户设置中生成一个 API 密钥（网上教程很多，可以参考）。

3、调用 ChatGPT API

在免费可直接调用的 ChatGPT 模型中，gpt-3.5-turbo是最优选择，接下来我们就调用这个模型来解决问题。在 Python 中调用 API 并不难，相关教程可以移步此文：如何使用 Python 调用 API。在调用之前，我们先导入相关第三方库并配置好参数。

# 导入 OpenAI 库
import openai
# 配置申请好的 API 秘钥，新注册账户都会一定数量的免费额度
openai.api_key = '***********************'

指定 API 密钥并确定想要调用的模型后，就可以通过函数openai.ChatCompletion.create()来创建 Chat 并获取模型的响应了。在使用之前，我们先了解一下该函数的两个必需参数：model和messages。

参数用法

model 用于指定使用的模型，可以根据函数openai.Model.list()获取的所有可用模型列表自行选择

messages 指定历史聊天中涵盖的信息，以列表传递。列表中的元素为字典，每个字典中包含role 和content两个键。role代表历史消息中发送消息者扮演的身份，可以选择 "system"、"user" 或者 "assistant"，其中 "system" 用于向模型提供一般的指导或提示，"user" 表示用户的输入，"assistant" 表示模型的回复；content代表身份对应的具体信息内容。

参数	用法
model	用于指定使用的模型，可以根据函数`openai.Model.list()`获取的所有可用模型列表自行选择
messages	指定历史聊天中涵盖的信息，以列表传递。列表中的元素为字典，每个字典中包含`role` 和`content`两个键。`role`代表历史消息中发送消息者扮演的身份，可以选择 "system"、"user" 或者 "assistant"，其中 "system" 用于向模型提供一般的指导或提示，"user" 表示用户的输入，"assistant" 表示模型的回复；`content`代表身份对应的具体信息内容。

messages中的内容可以理解为定义上文语境，一般以 "system" 的身份开启对话，"user" 身份代表用户向模型传递信息，"assistant" 身份代表模型对用户提问的回答。

下面我们使用函数openai.ChatCompletion.create()举一个简单的调用此 API 的例子，代码如下：

response = openai.ChatCompletion.create(
  model = "gpt-3.5-turbo",
  messages = [
    {"role": "system", "content": "你是一个得力的助手。"},
    {"role": "user", "content": "你好！"},
    {"role": "assistant", "content": "你好，有什么可以帮到你？"},
    {"role": "user", "content": "帮我制定一份有关放假时间的通知。"} # 提出问题
  ]
)
response

上面的例子中，我们调用了 OpenAI 的gpt-3.5-turbo模型，参数messages中第一行提示了模型助手的身份；第二行是用户传递给模型的消息，内容为“你好！”；第三行是模型的回复信息，内容为“你好，有什么可以帮到你？”；第四行为用户继续传递给模型的消息，内容为“帮我制定一份有关放假时间的通知。”

随后模型将返回响应信息，并将响应结果储存在变量response中，响应结果的内容如下：

 JSON: {
  "id": "chatcmpl-7jMo2oVD9xw1uGZ7QPDm0JTPQSDdy",
  "object": "chat.completion",
  "created": 1691046782,
  "model": "gpt-3.5-turbo-0613",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        # 篇幅原因此处省略，下文介绍
        "content": "\u5f53\u7136\u53ef\u4ee5…………\u544a\u8bc9\u6211\u3002" 
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 62,
    "completion_tokens": 470,
    "total_tokens": 532
  }
}

我们来看一下返回结果中包含的重要内容：

id：请求 ID。
object：返回对象的类型。
created：请求时间。
model：产生响应使用的模型全称。
choices：completion 对象列表，默认只有一个回答，或者使用参数 n 来规定回答数量。其中：
- index：choices 列表中 completion 对象的索引
- message：模型给出的响应信息，同时包括 role 和 content
- finish_reason：模型停止生成文本的原因，包括 "stop" 和 "length"
usage：查看消耗的 token。其中：
- prompt_tokens：用户传递信息所消耗的 token
- completion_tokens：生成模型的响应文本消耗的 token
- total_tokens：一共消耗的 token

在上面的代码中可以看到，返回的响应信息中的模型给出的回答是 Unicode 的形式，当我们需要查看输出的结果时，可以使用如下方式：

在这个例子中我们只使用了函数openai.ChatCompletion.create()的两个必要参数，除此之外，该函数还有许多其他的可选参数，我们可以根据自己的要求来调节这些参数，从而规定 ChatGPT 给出的答案范围，下面列举四个可选参数：

参数	作用
temperature	取值介于 0 到 2，默认为 1；用于控制输出结果的随机性，temperature 取值越大，随机性越高。
top_p	默认为 1，用于控制生成的候选词的数量，以提高回复的多样性。是 temperature 的替代方法，top_p 取值越小，多样性越大。
n	choices 中 completion 对象的数量，默认为 1。
max_tokens	默认为 inf，用于控制模型生产 completion 的最大 token。

需要注意一点，参数 temperature 和 top_p 不要同时修改，更改其中一个即可。

4、设计 AI 身份，全自动处理数据

前面说到，我们要运行 ChatGPT 返回的代码，但是又要从它的回答中找出可运行的代码，剔除其他提示/解释性文字。这样做难度太高了，主要是不确定性太高，毕竟 ChatGPT 的回答不可预测。所以在调用 ChatGPT 的时候，我们就应该明确给出指示，让 ChatGPT 只返回可运行的 Python 代码，以及其他注意事项，这个指示可以根据上一步中提到的 “system” 角色来提出。这样一来，前面提出的第一个问题就解决了。

根据上一步的描述，可以获取 ChatGPT 的回答，但是这个回答是一个字符串，而我们的目的是使用我们自己电脑上的 Python 去运行给出的代码，Python 中的内置函数 exec() 恰好具备这个能力！也就是说代码运行的问题得以解决。

# exec() 使用示范
exec('print(1+1)')   # 2

虽然代码可以运行了，但是代码运行后又迎来了新的问题，由于代码是使用 exec() 函数运行的，运行后代码中的变量全部无法直接访问。实际上，当函数 exec() 在指定命名空间中运行字符串类型的代码时，运行过程中的中间变量就可以保留在空间中，运行后我们再从命名空间中取出需要的变量即可。这样第二个问题也得到了解决。

最后，连续对话的问题就比较容易了，我们将上一步 ChatGPT 返回的回答添加到与 ChatGPT 的对话记录中即可。具体实现方法可以查看上一步（通过参数 message 实现）。在添加一些其他小功能后，得到了最终的程序。

import openai
# 指定 OpenAI API 的密钥
openai.api_key = '***********************'

# 规定 ChatGPT 的身份以及给出答案的范围
Describe = "你的身份是一个精通Python，能使用pandas等工具进行数据处理的专家，可以帮我解决问题，\
    你将会根据我描述的情景和问题给出相应的数据处理代码，并且给出的答案中仅包含代码，\
    不需要额外的解释说明。你的代码不需要使用markdown格式输出，只要把代码以字符串的\
    形式给出即可。注意你给出答案的连续性，如果你之前给出的代码中包含import语句，\
    那么不需要重复给出相同的import语句。"

# 定义和储存历史消息
BaseMessage = [{"role":"system", "content":Describe}]

# 定义变量 result，用于储存 ChatGPT 返回的代码
result = ''

# 定义命名空间，用于储存结果
Space = {}

# 定义调用 ChatGPT 的函数
def Chat_Code(Order, Model="gpt-3.5-turbo"):
    '''
    Order：告诉 ChatGPT 如何处理数据的命令
    Model：使用的语言模型，默认使用 gpt-3.5-turbo
    '''
    global Space
    global BaseMessage
    global result

    # 以 "user" 的身份向 ChatGPT 提问，内容为输入的 Order
    ##  不满意回答时可以撤回上一步的历史消息
    if Order == "撤回上一步历史消息":    
        BaseMessage = BaseMessage[:-2]     
 
    ## 退出时清空命名空间并重置历史消息
    elif Order == "exit":
        Space = {}
        BaseMessage = [{"role":"system", "content":Describe}]
        result = ""
    ## 正常提问
    else:
        Message = {"role":"user", "content":Order}
        ## 将提问内容加入历史消息，实现连续对话功能
        BaseMessage.append(Message)

        # 使用函数 openai.ChatCompletion.create() 得到 ChatGPT 返回的响应信息
        response = openai.ChatCompletion.create(
            model = Model,
            messages = BaseMessage
        )
        
        # 提取响应中的的代码，存入变量 result 
        result = response['choices'][0]['message']['content']

        # 将 ChatGPT 给出的代码存入历史消息中，更新历史对话
        add = {"role":"assistant", "content":result}
        BaseMessage.append(add)

        print(result)  # 查看 ChatGPT 给出的解决代码

        ## 指定在创建的命名空间中执行代码，并将结果存储在该空间中
        exec(result, globals(), Space)

上文中数据可视化的对话过程和实际的返回结果如下。

第一条指令：

Chat_Code(Order = "将当前目录下名为“中国历年数字经济核心产业大类被授权实用新型专利申请数.xlsx”的文件以dataframe数据类型导入，并命名为data。")

结果如下：

第二条指令：

Chat_Code(Order = "使用data中的数据，以“申请年份”为横轴，分别以\
          “01数字产品制造业被授权实用新型专利数”、\
          “02数字产品服务业被授权实用新型专利数”、\
          “03数字技术应用业被授权实用新型专利数”和\
          “04数字要素驱动业被授权实用新型专利数”为纵轴，绘制四条折线图。")

第三条指令：

Chat_Code(Order = "将四个图例分别修改成“数字产品制造业”、\
            “数字产品服务业”、\
            “数字产品应用业”和\
            “数字要素驱动业”。")

第四条指令：

Chat_Code(Order = "在折线图右边添加一个纵轴，\
            内容是data中的“被授权实用新型专利数”字段，\
            横轴不变，在折线图中添加一幅柱状图。")

Part5再谈此次探索

从上文内容中，Python 与 ChatGPT 的结合确实能够让我们的数据处理工作变得简单方便很多。如果延伸一下，我们是不是也可以用它去做一些更复杂，更有意义的事情呢？我们认为，这一定是可行的，不过随着问题难度的增加，影响因素也会更多，最后的成功率也会降低。从这次探索，我们也积累了一些运用 ChatGPT 自动化处理数据的经验，下面分享给大家。

AI 的角色十分重要，正如上文中写到的那样，我们用了几百个字来给 AI 一个初始角色，并限制它的答复格式，所以设计 AI 角色时，需要尽可能详细地描述。
提问或者设计 AI 身份时，语言不要出现歧义。例如在最初设计 AI 角色时，我们只要求 AI 仅返回可运行的代码，但 AI 的回复结果中依然包含一些解释性文字。仔细想一下，这句话（提出的要求）其实是存在歧义的，AI 可能误以为只要不给出不可运行的代码就可以了，与解释性文字无关。
AI 只听从绝对命令，我们不能指望 AI 去实现我们没有说出来的事情。例如上文第四条命令中，我们要求 AI 在折线图的右侧也加一个纵轴，这里笔者内心就默认了新添加的纵轴和原来的左侧纵轴上的刻度是一致的，只有这样才会更加严谨。但是实际上 AI 并没有这样做，给出的结果中两个纵轴的刻度完全没有关系，这也导致图中的柱状图虽然美观，却不严谨。这个问题的根本原因就是我们没有主动提出这个要求，那么 AI 会不会这样做就要看它的心情了。所以为了使 AI 的回答更加严谨，我们在提问时需要尽可能给出准确、细致的要求，越具体越好，比如新添加的柱形图的刻度与左侧的坐标轴刻度保持一致等等。
如果需要让 AI 帮你处理数据，那么一定要描述你的数据，例如有哪些字段，其中存储什么数据，否则 AI 给出的代码可能无法运行。
AI 给出的代码不可能完全正确。影响因素有很多，例如不同版本的 Python 语法不同、不同版本的第三方库语法不同、某个功能已经删除但是 AI 不知道……所以我们不能一味地相信它给出的代码，最好对其回答的正确性有个初步的判断，如果发现了问题，可以进一步向 AI 提出更改的要求。
……

最后，如果您有更加丰富的 AI 使用经验，欢迎留言交流。

更多内容请点击查看Python 实战 | ChatGPT + Python 实现全自动数据处理/可视化

Part6总结

AI 是一个聪明的脑袋，Python 是一副矫健的身体，两者只需要简单地结合一下，就能够发挥出强大的威力，为我们的数据处理带来了许多便利。

往期推荐

Python实战 | 如何使用 Python 调用 API

Python 教学 | 列表推导式 & 字典推导式

Python 教学 | Pandas 时间数据处理方法

Python 教学 | Pandas 函数应用（apply/map）【下】

Python爬虫TLS dme. Python爬虫零基础入门爬虫 python
TLS指纹校验原理和绕过浏览器可以正常访问，但是用requests发送请求失败。后端是如何监测得呢？为什么浏览器可以返回结果，而requests模块不行呢？https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例：ascii2dhttps://ascii2d.net/importrequestsres
python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解嘻嘻哈哈学编程程序员 python 爬虫 selenium
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！2.2访问页面2.3查找元素2.3.1单个元素下面
排序算法：冒泡排序（Python）娱乐不打烊丶排序算法算法数据结构
思路：大家一定都喝过汽水吧，汽水中常常有许多小小的气泡，往上飘，这是因为组成小气泡的二氧化碳比水要轻，所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序，正是因为这种排序算法的每一个元素都可以向小气泡一样，根据自身大小，一点一点向着数组的一侧移动。一图解百惑，上图！那么，话不多说，上代码！defbubble_sort(input_list):#冒泡排序：每次循环，锁定一个最值，并朝着最大或
supervisord 命令介绍和使用案例 lisanmengmeng linux 命令工具系统运维 shell编程服务器 linux 运维
supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具，用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程（daemon），并监控进程状态，在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理：能够启动、停止、重启和关闭进程.自动重启：监控进程状态，并在进程崩溃时
ptython setup.py install 设置python包编译时的并行数 leo0308 基础知识 Python python pytorch3d
通过源码编译安装pytorch3d的时候，直接执行pythonsetup.pyinstall时，默认开的并行数很多，有10几个，直接导致机器卡死。通过设置下面的环境变量，可以设置较小的并行数，避免占用过多的资源。exportMAX_JOBS=4设置后，同时只有4个编译的进程。
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
GUI编程（window系统→Linux系统）诚信爱国敬业友善心得 linux python gui
最近有个项目需要将windows系统的程序往Linux系统上面移植，由于之前程序没有考虑过多平台兼容的问题，导致部分功能不可用以下是对近期遇到的问题的总结，以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中，安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块：使用pip安装模块时，建议使用--user选项，避免需要管理员权限：bash复制pipinsta
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
Linux升级Anacodna并配置jupyterLab 伪_装环境部署 linux 服务器 Anaconda python jupyter
在使用Anaconda的过程中，随着项目和需求的发展，可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前，建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本：condainfo你会看到类似以下的输出，其中包含了当前Python
【Linux】删除Conda虚拟环境不是伍壹 Linux linux conda 运维
1、查看当前系统的conda虚拟环境condainfo--envscondaenvlist2、创建虚拟的环境condacreate-n（你的环境名字）python=（你需要的版本号，如（3.7,3.8,3.10））3、查看安装了哪些包condalist4、删除虚拟环境condaremove-nname--all5、删除虚拟环境中的包condaremove--name$（需要删除的环境名字）$（需要
动态规划之背包问题--python版本我是小码搬运工 #python基础动态规划背包问题 python版本
动态规划之背包问题–python版本问题已知一个最大量的背包，给定一组给定固定价值和固定体积的物品，求在不超过最大值的前提下，能放入背包中的最大总价值。解题思路该问题是典型的动态规划问题，分为三种不同的类型（0-1背包问题、完全背包和多重背包问题）解题关键–状态转移表达式：B(k,C)=max(B(k−1,C),B(k−1,C−ci)+vi)B(k,C)=max(B(k-1,C),B(k-1,C-
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
动态规划之背包问题的Python实现名侦探debug Python 数据结构 python 数据结构动态规划求解
目录1.问题描述2.动态规划之网格法3.python实现1.问题描述题目来源于《算法图解》第9章练习题9.2，如下图所示。对于背包问题，通常的做法有列举法、贪婪算法和动态规划（1）列举法：列举出所有的可能情况，再选择最优解，但当情况很多时，这种算法复杂度很高（2）贪婪算法：在容量允许范围内，每次都拿剩余物品中价值最高的，贪婪算法能够快速解决复杂度很高的问题，但通常得到的是次优解，但就对这个题目而言
总结10个Python赚钱的接单平台兼职月入5000+ begefefsef 面试学习路线阿里巴巴 android 前端后端
前言“如果说当下什么编程语言最靠谱或者比较适合搞副业？”答案肯定100%是：Pythonpython是所有语法中最简单易上手的语言，不需要特别的的英语词汇量，逻辑思维也不需要很差就能上手。而且学会了之后就能编写代码爬取各种数据，制作各种图表，提升工作效率。而且还能利用业余时间接点私活，一个月轻松收入过万不是问题，这样的生活他不香吗？今天就给大家盘点几个基本入门接私活的资源，让你轻松学python，
大学生学完python靠几个接单网站兼职，实现经济独立「已注销」 python 开发语言
大学生学完python靠几个接单网站兼职，实现经济独立程序员就是当今时代的手艺人，程序员可以通过个人的技术来谋生。而在工作之余接私单可以作为一种创富的途径，受到程序员的广泛认可。说句实在话，现在这个时代，很多人仅靠主业顶多维持基本生活，想让自己、家人生活好一点很难。我接的私活并不算多，加起来也就几万左右，只能算一半，我想把一些经验分享出来，毕竟现在生活都不容易，能赚一点是一点。一、程序员接活、新手
Python wifi 安装手机app yichengace python
目的当测试机数量越来越多时，测试包的安装会成为一个问题，用wifi安装来解决这个问题，并且用脚本语言来批量控制思路思路就是py调用pc端的adb命令，向手机发送请求，无线是因为，如果未来测试机越来越多，一台电脑的usb接口数量肯定不够准备工具python，adb，pycharm，测试用app，这里选择qq（https://qd.myapp.com/myapp/qqteam/AndroidQQ/mo
深度学习之目标检测的常用标注工具铭瑾熙人工智能机器学习深度学习深度学习目标检测目标跟踪
1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析西攻城狮北 python 爬虫开发语言实战案例
引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
PyCharm 集成 DeepSeek：本地运行 or API 直连？打造你的 AI 编程神器！ AI云极【AI智能系列】pycharm 人工智能 ide deepseek
在AI赋能编程的时代，如何让AI辅助写代码，提升开发效率？DeepSeek作为一款开源、强大、免费的AI编程助手，结合PyCharm，能够大幅提升Python编程体验。今天，我们就来详细讲解如何在PyCharm中接入DeepSeek，无论你想使用本地部署的DeepSeek，还是官方API版本，都能轻松实现！为什么选择DeepSeek+PyCharm？DeepSeekR1采用6710亿参数的MoE（
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
【CUDA】Pytorch_Extensions joker D888 深度学习 pytorch python cuda c++深度学习
【CUDA】Pytorch_Extensions为什么要开发CUDA扩展？当我们在PyTorch中实现自定义算子时，通常有两种选择：使用纯Python实现（简单但效率低）使用C++/CUDA扩展（高效但需要编译）对于计算密集型的操作（如神经网络中的自定义激活函数），使用CUDA扩展可以获得接近硬件极限的性能。本文将以实现一个多项式激活函数x²+x+1为例，展示完整的开发流程。完整CUDA扩展代码解
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
本地搭建小型 DeepSeek 并进行微调非著名架构师大模型知识文档智能硬件人工智能大数据大模型 deepseek
本文将指导您在本地搭建一个小型的DeepSeek模型，并进行微调，以处理您的特定数据。1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选，用于GPU加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/deepseek-ai/deepseek.gitcddeepseek3.安装依赖bash复制pipinstall
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
python做一个注册界面_python如何做一个登录注册界面 weixin_39824033 python做一个注册界面
python做一个登录注册界面的方法：首先初始化一个window界面，并使用画布实现欢迎的logo；然后用代码实现登录和注册按钮；接着并进行登录判断代码；最后完成注册界面即可。【相关学习推荐：python视频教程】python做一个登录注册界面的方法：一、登录界面1、首先初始化一个window界面window=tk.Tk()window.title('WelcometoMofanPython')w
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http