封皮
1. 以 AI 角色的描述开始提示。 例如,“你是{x}”或“我希望你扮演{x}”。如果您不确定,请尝试“你是一个有帮助的助手”。
例如,您是 OpenAI 的数据科学家,您正在研究大型语言模型。向我解释 GPT-3 的工作原理
2. 将其用于常见任务。 任务越常见,使用 ChatGPT 成功的机会就越大
3. 提供上下文。 在向 ChatGPT 提出问题时提供上下文使其能够提供具体的答案。提供上下文允许模型理解问题的细微差别并生成更明智的响应。
例如,您是 OpenAI 的数据科学家,您正在研究大型语言模型。向没有技术背景的业务主管解释 GPT-3 如何工作。
4. 要精确。 精确是另一个最佳实践,可以最大限度地减少调整输出的需要。 提出问题时,请清楚输入(如果有)和期望的结果
5. 继续尝试。 不要害怕尝试多个提示。 使用不同的提示可以提供对问题的不同观点,并使模型能够生成各种响应
然而,ChatGPT 并不完美——它可能会生成错误的信息,或产生“幻觉”。 ChatGPT 可以以权威的语气提供错误的答案。因此,对所有答案进行事实核查非常重要
调试 Python 代码
我希望你成为一名 Python 程序员,这是一段包含{问题}的 Python 代码 — {插入代码片段} — 我收到以下错误 {插入错误}。错误的原因是什么?
我希望你成为一名 R 程序员,这是一段包含{问题}的 R 代码——{插入代码片段}——我收到以下错误{插入错误}。错误的原因是什么?
我希望你成为一名 SQL 程序员,这是一段包含{问题}的 SQL 代码 — {插入代码片段} — 我收到以下错误 {插入错误}。错误的原因是什么?
Python代码解释
我希望你充当 Python 中的代码解释器。我不明白这个功能。你能解释一下它的作用,并提供一个例子吗?{插入函数}
我想让你在R中充当代码解释器。我不明白这个功能。你能解释一下它的作用,并提供一个例子吗?{插入函数}
我希望你充当 SQL 中的代码解释器。我不明白这个片段。你能解释一下它的作用,并提供一个例子吗?{插入 SQL 查询}
Python代码优化
我希望你充当 Python 中的代码优化器。{如果可能,请描述当前代码的问题}。你能让代码{更Pythonic/更干净/更高效/运行更快/更具可读性}吗?{插入代码}
我希望你充当 R 中的代码优化器。{如果可能,请描述当前代码的问题}。你能让代码{更干净/更高效/运行更快/更具可读性}吗?{插入代码}
我希望你充当 SQL 中的查询优化器。{如果可能,请描述当前代码的问题}。您能否建议使查询{运行得更快/更具可读性/更简单}的方法?{插入代码}
Python代码简化
我想让你扮演 Python 的程序员。请简化此代码,同时确保它{高效/易于阅读/Pythonic}?
{插入代码}
我想让你充当 R 中的程序员。请简化此代码,同时确保它{高效/易于阅读}?{插入代码}
我想让你扮演一个 SQL 程序员。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。您能否简化此查询{同时确保它高效/易于阅读/插入任何其他要求}?
我想让你充当 R 中的程序员。请将此代码转换为 Python。{插入代码}
我想让你扮演 Python 的程序员。请将此代码翻译成 R。{插入代码}
我想让你扮演一个 Python 程序员。你能编写代码来比较两个函数 {functionname} 和 {functionname} 的速度吗?{插入函数}
在 R 中编写单元测试 、用 Python 编写单元测试
我想让你充当 R 程序员。你能为函数 {functionname} 编写单元测试吗?{插入单元测试的要求,如果有的话} {插入代码}
我想让你充当 Python 程序员。你能为函数 {functionname} 编写单元测试吗?{插入单元测试的要求,如果有的话} {插入代码}
数据生成和创建表
I want you to act as a data generator. Can you write SQL queries in {database version} that create a table {table name} with the columns {column name}. Include relevant constraints and index
我希望你充当数据生成器。 您能否在 {database version} 中编写 SQL 查询,创建一个包含列 {column name} 的表 {table name}。 包括相关约束和索引
常用表表达式
I want you to act as a SQL code programmer. I am running {database version}. Can you rewrite this query using CTE? {Insert query}
我想让你充当 SQL 代码程序员。 我正在运行{数据库版本}。 你能用 CTE 重写这个查询吗? {插入查询}
I want you to act as a data scientist. {Insert description of tables}. Can you {count/sum/take average} of {value} which are {insert filters}
我想让你扮演一名数据科学家。{插入表格说明}。你可以{count/sum/average} {value} 这是 {insert filters}
我想让你扮演一名数据科学家。我有一家电子商务公司的三个 PostgreSQL 14 表“客户”。客户表由列“customer_id”、“customer_name”、“customer_email”、“customer_phone”和“customer_address”组成。使用“customer_email”,你能计算出使用 gmail、outlook、yahoo 或其他提供商的客户数量吗?
I want you to act as a data scientist. {Insert description of tables}. Can you {count/sum/take average} of {value} which are {insert filters}
我想让你扮演一名数据科学家。{插入表格说明}。你可以{count/sum/average} {value} 这是 {insert filters}
我想让你扮演一名数据科学家。我有一家电子商务公司的三个 PostgreSQL 14 表“客户”。客户表由列“customer_id”、“customer_name”、“customer_email”、“customer_phone”和“customer_address”组成。使用“customer_email”,你能计算出使用 gmail、outlook、yahoo 或其他提供商的客户数量吗?
I want you to act as a data scientist. I am running {PostgreSQL 14/MySQL 8/SQLite 3.4/other versions.}. I have the tables {table_name} which are {table description}. The sales table consists of the columns {column names}. Can you please write a query that finds the 7-day running average of {quantity}?
我想让你扮演一名数据科学家。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。我有 {table_name} 表,它们是 {table description}。销售表由列 {column names} 组成。您能否编写一个查询来查找 {quantity} 的 7 天运行平均值?
我想让你扮演一名数据科学家。我有一家电子商务公司的 PostgreSQL 14 表“销售”。销售表由列“customer_id”、“product_id”、“sale_date”、“sale_quantity”组成。您能否编写一个查询来查找 sale_quantity 的 7 天运行平均值?
I want you to act as a data scientist. I am running {PostgreSQL 14/MySQL 8/SQLite 3.4/other versions.}. I have the tables {table_name} which are {table description}. The sales table consists of the columns {column names}. Can you please write a query that finds {required window function}?
我想让你扮演一名数据科学家。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。我有 {table_name} 表,它们是 {table description}。销售表由列 {column names} 组成。你能写一个查询来找到{required window function}吗?
我想让你扮演一名数据科学家。我有一家电子商务公司的三个 PostgreSQL 14 表“销售”。销售表由列“customer_id”、“product_id”、“sale_date”、“sale_quantity”组成。你能写一个查询来找出当天的 sale_quantity 和平均 sale_quantity 之间的差异吗?
数据生成工作流程
I want you to act as a data generator in Python. Can you generate a Markdown file that contains {data requirement}. Save the file to {filename}
我想让你充当 Python 中的数据生成器。你能生成一个包含{data requirement}的Markdown文件吗?将文件保存到 {filename}
我想让你充当 python 中的数据生成器。您能否生成一个包含模拟员工数据的 Markdown 文件,其中包含列 employee_id、name、department_id、email、join_date、current_salary。将文件保存到“employee.md”
I want you to act as a data generator in Python. Can you generate a CSV file that contains {data requirement}. Save the file to {filename}
我想让你充当 Python 中的数据生成器。你能生成一个包含{data requirement}的CSV文件吗?将文件保存到 {filename}
我想让你充当 python 中的数据生成器。 您能否生成一个包含模拟员工数据的 CSV 文件,其中包含列 employee_id、name、department_id、email、join_date、current_salary。 将文件保存到 ' employee.csv'
I want you to act as a data generator in Python. Can you generate a JSON file that contains {data requirement}. Save the file to {filename}
我想让你充当 Python 中的数据生成器。你能生成一个包含{data requirement}的JSON文件吗?将文件保存到 {filename}
I want you to act as a data scientist programming in Python Pandas. Given a CSV file that contains data of {dataframe name} with the columns {colum names}for {dataset context}, write code to clean the data? {Insert requirements for data}
我希望你扮演一名使用 Python Pandas 编程的数据科学家。给定一个 CSV 文件,其中包含 {dataframe name} 的数据以及 {dataset context} 的列 {colum names},编写代码来清理数据?{插入数据要求}
我希望你扮演一名使用 Python Pandas 编程的数据科学家。 给定一个 CSV 文件,其中包含电子商务公司的“customers”信息数据,列为“customer_id”、“customer_name”、“customer_email”、“customer_phone”、“customer_address”,编写代码来清理数据? 请删除带有 customer_id 的行,并将空的 customer_name 替换为“UNKNOWN”。
I want you to act as a data scientist programming in Python Pandas. Given a table {table name} that consists of the columns {column names} can you please write a query that finds {requirement}?
我希望你扮演一名使用 Python Pandas 编程的数据科学家。给定一个由列 {column names} 组成的表 {table name},你能写一个查询来找到 {requirement} 吗?
我希望你扮演一名使用 Python Pandas 编程的数据科学家。给定一个电子商务公司的表“sales”,其中包含列“customer_id”、“product_id”、“sale_date”、“sale_quantity”,你能写一个查询来找到一月份最受欢迎的 product_id 吗
I want you to act as a data scientist programming in Python Pandas. Given a table {table 1 name} that consists of the columns {column names} and another table {table 2 name} with the columns {column names} , please merge the two tables. {Insert additional requirement, if any}
我希望你扮演一名使用 Python Pandas 编程的数据科学家。给定一个由列 {column names} 组成的表 {table 1 name} 和另一个包含列 {column names} 的表 {table 2 name} ,请合并这两个表。{插入附加要求,如果有的话}
我希望你扮演一名使用 Python Pandas 编程的数据科学家。给定一个由列 {column names} 组成的表 {table name},您可以按 {column} 聚合 {value} 并将其从长格式转换为宽格式吗?
I want you to act as a data generator in R. Can you generate a Markdown file that contains {data requirement}.
Save the file to {filename}
我想让你在 R 中充当数据生成器。你能生成一个包含 {data requirement} 的 Markdown 文件吗?
将文件保存到 {filename}
数据生成工作流程
I want you to act as a data generator in R. Can you generate a CSV file that contains {data requirement}. Save the file to {filename}
我想让你在 R 中充当数据生成器。你能生成一个包含 {data requirement} 的 CSV 文件吗?将文件保存到 {filename}
我想让你在 R 中充当数据生成器。你能生成一个 CSV 文件,其中包含模拟员工数据,其中包含列 employee_id、name、department_id、email、join_date、current_salary。将文件保存到 ' employee.csv'
我想让你在 R 中充当数据生成器。你能生成一个包含 {data requirement} 的 JSON 文件吗?将文件保存到 {filename}
我想让你在 R 中充当数据生成器。你能生成一个 JSON 文件,其中包含模拟员工数据,其中包含列 employee_id、name、department_id、email、join_date、current_salary。将文件保存到 ' employee. JSON'
数据清洗工作流程
我希望你在 R tidyr 中担任数据科学家编程。您将获得包含列 {column name} 的 {dataframe name} 数据框。{插入要求}
我希望你在 R tidyr 中担任数据科学家编程。您将获得包含列 employee_id、name、department_id、email、join_date、current_salary 的“employee”数据框。编写代码以删除具有任何空值的行并执行其他数据清理步骤。
tidyr 中的数据分析工作流程
我希望你在 R tidyr 中担任数据科学家编程。您将获得包含列 {column name} 的 {dataframe name} 数据框。{插入要求}
我希望你在 R tidyr 中担任数据科学家编程。您将获得包含列 employee_id、name、department_id、email、join_date、current_salary 的“employee”数据框。找出新加入人数最多的年份。
我希望你在 R tidyr 中担任数据科学家编程。您将获得包含列 {column name} 的 {dataframe 1 name} 数据框。您还有一个包含列 {column name} 的 {dataframe 2 name} 数据框。找到{需要的输出}
我希望你在 R tidyr 中担任数据科学家编程。您将获得包含列 employee_id、name、department_id、email、join_date、current_salary 的“employee”数据框。您还有一个包含 department_id 和 department_name 列的“department”数据框。找到工资中位数最高的 department_name。
我希望你在 R tidyr 中担任数据科学家编程。您将获得包含列 {column name} 的 {dataframe name} 数据框。请将数据转换为宽格式。
我希望你在 R tidyr 中担任数据科学家编程。您将获得包含列 {column name} 的 {dataframe name} 数据框。请将数据转换为长格式
在 ggplot2 中创建绘图
我希望你扮演一名使用 R 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name} 使用 ggplot2 绘制 {chart type and requirement}。
我希望你扮演使用 R 编写代码的数据科学家。给定一个数据框“gapminder”,其中包含“国家”、“gdp”、“年”列。使用 ggplot2 绘制每个国家/地区 GDP 与年份的折线图。
我希望你扮演使用 R 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name}。使用 ggplot2 绘制一对图,显示一个变量与另一个变量的关系
我想让你扮演一名用 R 编写代码的数据科学家。给定一个包含列“sepal_length”、“sepal_width”、“petal_width”、“petal_length”的数据框“iris”使用 ggplot2 绘制一对图来显示一个变量的关系 针对另一个。
注释和格式化图
我想让你扮演一个用 R 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 ggplot2 绘制一个{chart type} {variables} 之间的关系。{插入注释和格式要求}
我希望你扮演一名使用 R 编写代码的数据科学家。给定一个包含列“sepal_length”、“sepal_width”、“flower_type”的数据框“iris”,使用 ggplot2 绘制 sepal_length 和 sepal_width 之间关系的散点图。使用颜色来表示不同的 flower_types。将图表命名为“长度与宽度”
我想让你扮演一名使用 R 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 ggplot2 绘制一个{chart type} {variables} 之间的关系。更改颜色主题以匹配 {theme}
我希望你扮演一名使用 R 编写代码的数据科学家。给定一个包含列“sepal_length”、“sepal_width”、“flower_type”的数据框“iris”,使用 ggplot2 绘制 sepal_length 和 sepal_width 之间关系的散点图。更改颜色主题以匹配 fivethirtyeight 的颜色主题。
使用 matplotlib 创建绘图
我希望你扮演一名使用 Python 编码的数据科学家。给定包含列 {column names} 的数据框 {dataframe name} 使用 matplotlib 绘制 {chart type and requirement}
我希望你扮演一名使用 Python 编码的数据科学家。给定一个数据框“gapminder”,其中包含列“country”、“gdp”、“year”。使用 matplotlib 绘制每个国家/地区 GDP 与年份的折线图。
我希望你扮演一名使用 Python 编码的数据科学家。给定包含列 {column names} 的数据框 {dataframe name}。使用 matplotlib 绘制一对图,显示一个变量与另一个变量之间的关系。
我希望你扮演一名使用 Python 编码的数据科学家。给定包含列“sepal_length”、“sepal_width”、“petal_width”、“petal_length”的数据框“iris”使用 matplotlib 绘制一对图,显示一个变量与另一个变量的关系。
在 matplotlib 中注释和格式化绘图
我希望你扮演一名使用 Python 编码的数据科学家。给定包含列 {column names} 的数据框 {dataframe name},使用 matplotlib 绘制{chart type} {variables} 之间的关系。{插入注释和格式要求}
我希望你扮演一名使用 Python 编码的数据科学家。给定包含列“sepal_length”、“sepal_width”、“flower_type”的数据框“iris”,使用 matplotlib 绘制 sepal_length 和 sepal_width 之间关系的散点图。使用颜色来表示不同的 flower_types。将图表命名为“长度与宽度”
我希望你扮演一名使用 Python 编码的数据科学家。给定包含列 {column names} 的数据框 {dataframe name},使用 matplotlib 绘制{chart type} {variables} 之间的关系。
更改颜色主题以匹配 {theme}
我希望你扮演一名使用 Python 编写代码的数据科学家。给定包含“sepal_length”、“sepal_width”、“flower_type”列的数据框“iris”,使用 matplotlib 绘制 sepal_length 和 sepal_width 之间关系的散点图。更改颜色主题以匹配 fivethirtyeight 的颜色主题。
4. 机器学习工作流程提示
特征工程构思
我想让你扮演一名数据科学家。
给定包含 {columns} 的 {dataset name} 数据集,您要预测 {predicted variable}。建议对这个问题有帮助的数据,并针对这个问题进行特征工程
我想让你扮演一名数据科学家。给定一个包含演员表、发行年份、预算和其他电影数据的电影数据集,你要预测这部电影的全球票房是多少。建议对这个问题有帮助的数据,并针对这个问题进行特征工程。
模型训练工作流程
我希望你扮演一名使用 Python 编程的数据科学家。给定包含 {column name} 的 {dataframe name} 数据集,编写代码来预测 {output variable}
我希望你扮演一名使用 Python 编程的数据科学家。给定包含演员表、发行年份、预算和其他电影数据的电影数据集,编写代码来预测电影的全球票房是多少。
超参数调整工作流程
我希望你扮演一名使用 Python 编程的数据科学家。给定一个 {type of model} 模型,编写代码来调整超参数
我希望你扮演一名使用 Python 编程的数据科学家。给定一个决策树分类模型,编写代码来调整超参数。
模型可解释性工作流
我希望你扮演一名使用 Python 编程的数据科学家。给定一个预测{预测变量}的{模型类型},编写代码使用 Shap 值解释输出
我希望你扮演一名使用 Python 编程的数据科学家。给定一个 sklearn 决策树模型,该模型根据演员表、发行年份、预算和其他电影数据预测模型的票房,编写代码使用 Shap 值解释输出。
我想让你扮演一名使用 R 编程的数据科学家。给定一个包含 {column names} 的 {dataframe name} 数据框,编写代码来预测 {output}。
我想让你扮演使用 R 编程的数据科学家。给定一个包含产品名称、价格和产品类别的产品数据框,编写代码来预测新产品的产品类别。
超参数调整工作流程
我希望你扮演一名使用 R 编程的数据科学家。给定一个 {type of model} 模型,编写代码来调整超参数
我希望你扮演一名使用 R 编程的数据科学家。给定一个决策树分类模型,编写代码来调整超参数。
模型可解释性工作流
我希望你担任 R 中的数据科学家编程。给定一个预测{预测变量}的{模型类型},编写代码使用 Shap 值解释输出
我希望你扮演使用 R 编程的数据科学家。给定一个决策树模型,该模型根据产品名称和价格预测产品的产品类别,编写代码来使用 Shap 值解释输出。
5. 时间序列分析工作流程提示
我希望你扮演一名使用 Python 编码的数据科学家。给定 Pandas 数据帧 {dataframe name} 中的时间序列数据,时间戳索引为 {original frequency} 频率,一列 {column name},将时间戳频率转换为 {desired frequency}
我希望你扮演一名使用 Python 编码的数据科学家。给定 Pandas 数据帧“ts”中的时间序列数据,时间戳索引以每日频率和一列“值”,将时间戳频率转换为每周和每月。
构建测试系列模型
我希望你扮演一名使用 Python 编码的数据科学家。给定数据帧 {dataframe name} 中的时间序列数据,时间戳索引为 {original frequency} 频率,一列 {column name},建立一个预测模型,假设数据是固定的
我希望你扮演一名使用 Python 编码的数据科学家。给定 Pandas 数据帧“ts”中的时间序列数据,其中时间戳索引以每日频率显示,其中有一列“value”,假设时间序列是平稳的,构建一个预测模型。
执行平稳性测试
我希望你扮演一名使用 Python 编码的数据科学家。给定数据帧 {dataframe name} 中的时间序列数据,时间戳索引以 {original frequency} 频率和一列 {column name},执行 Dicky Fuller 测试
我希望你扮演一名使用 Python 编码的数据科学家。给定 Pandas 数据帧“ts”中的时间序列数据,时间戳索引以每日频率和一列“value”进行,执行 Dicky Fuller 测试。
改变时间范围
我想让你充当用 R 编码的数据科学家。给定数据帧 {dataframe name} 中的时间序列数据,时间戳索引为 {original frequency} frequency with one column {column name},将时间戳频率转换为 {desired frequency }
我想让你扮演一名使用 R 编写代码的数据科学家。给定数据帧 ts 中的时间序列数据,时间戳索引以每日频率和一列值',将时间戳频率转换为每周和每月。
构建测试系列模型
我想让你扮演一名用 R 编写代码的数据科学家。给定数据帧 {dataframe name} 中的时间序列数据,时间戳索引为 {original frequency} frequency with one column {column name},建立一个预测模型,假设数据是 静止的
我想让你扮演一名使用 R 编写代码的数据科学家。给定数据帧“ts”中的时间序列数据,其中时间戳索引以每日频率和一列“值”为基础,构建一个预测模型,假设数据是固定的。
执行平稳性测试
我想让你扮演一名用 R 编写代码的数据科学家。给定数据帧 {dataframe name} 中的时间序列数据,时间戳索引以 {original frequency} 频率和一列 {column name} 执行 Dicky Fuller 测试。
我想让你扮演一名使用 R 编写代码的数据科学家。给定数据帧“ts”中的时间序列数据,时间戳索引以每日频率和一列“值”为单位,执行平稳性测试。
6. 提示自然语言处理工作流程
分类文本情感
我想让你充当情绪分类器。将来自 {describe text origin} 的以下文本分类为“正面”、“负面”、“中性”或“不确定”:{Insert text to be classifier}
我想让你充当情绪分类器。将自助书籍上的以下评论分类为“正面”、“负面”、“中立”或“不确定”:读起来很棒 我打瞌睡了。厨师之吻。
创建正则表达式
我想让你扮演一个用 Python 编写代码的程序员,使用正则表达式来测试一个字符串是否有 finsert 要求)
我想让你扮演一个用 Python 编写代码的程序员,使用正则表达式来测试一个字符串是否以数字开头,以“!”结尾。
文本数据集生成
我希望你充当数据集生成器。请在{required text and the context} 上生成{number of text} 文本。{插入附加要求}
我希望你充当数据集生成器。请为二手车经销商的汽车评论生成 5 个文本。请包括正面、中性和负面情绪的数据。
机器翻译
我要你当翻译。请将{phrase}从{origin language}翻译成{translated language}
我要你当翻译。你能用法语解释一下机器学习是什么吗?
7. 概念和职业导向的提示
为业务主管解释数据概念
我想让你担任一家公司的数据科学家。{Describe content detailed, if required} 请向业务主管解释{concept}的含义。
我希望你在一家研究初创公司担任数据科学家。请将论文 {paper} 解释为 {level of difficulty,例如 软件开发人员,五岁,企业主管,教授}
我希望你在一家研究初创公司担任数据科学家。请向软件开发人员解释论文“Attention is all you need”。
我想让你担任数据科学职业教练。我是{describe your background},我想{describe career objective}。建议投资组合项目和想法{描述投资组合的目标}
我想让你担任数据科学职业教练。我是化学工程专业的最后一年学生,我想转向数据科学。建议投资组合项目和想法,以显示我在化学工程领域的时间序列预测能力。
写教程
我想让你扮演一名数据科学家作家。请写 {number-of-words} 字的介绍来介绍关于 {title} 的教程。{插入相关要点}
我想让你扮演一名数据科学家作家。请写一篇关于“学习分析 Pandas 中的脏数据”的教程的 100 字介绍
本书阿里云盘下载地址:
https://www.aliyundrive.com/s/GTFSWmZN9eo
数据科学提示Github网址:
travistangvh/ChatGPT-Data-Science-Prompts: A repository of 60 useful data science prompts for ChatGPT (github.com)
Write python
Explain code
Optimize code
Format code
Translate code from one language to another
Explain concepts
Suggest ideas
Troubleshoot problem
Write SQL
Write other Code
Misc
The End