无水先生

【数据挖掘】如何为可视化准备数据

一、说明

想要开始您的下一个数据可视化项目吗？首先与数据清理友好。数据清理是任何数据管道中的重要步骤，可将原始的“脏”数据输入转换为更可靠、相关和简洁的数据输入。诸如Tableau Prep或Alteryx之类的数据准备工具就是为此目的而创建的，但是当您可以使用Python等开源编程语言完成任务时，为什么要在这些服务上花钱呢？本文将指导您完成使用 Python 脚本为可视化准备数据的过程，为数据准备工具提供更具成本效益的替代方案。

摄影：Robert Katzki on Unsplash

二、数据清洗概说

注意：在本文中，我们将重点介绍如何让 Tableau 为数据可视化做好准备，但主要概念同样适用于其他商业智能工具。

我明白了。数据清理似乎是将可视化或仪表板变为现实的漫长过程中的又一步。但这是至关重要的，而且可以令人愉快。这是您通过深入了解您拥有和没有的数据以及为实现最终分析目标而必须采取的相应决策来适应数据集的方式。

虽然 Tableau 是一种多功能的数据可视化工具，但有时获得答案的途径并不明确。在这里，在将数据集加载到 Tableau 之前对其进行处理可能是您最大的秘密帮手。让我们探讨一下为什么在将数据清理与 Tableau 集成之前，数据清理是有益的一些关键原因：

消除不相关的信息： 原始数据通常包含不必要或重复的信息，这些信息可能会使您的分析混乱。通过清理数据，您可以消除浪费，并将可视化集中在最相关的数据功能上。
简化数据转换：如果您对要生成的可视化有清晰的认识，那么在将数据加载到 Tableau 之前执行这些预转换可以简化流程。
团队内部更易于转移：定期更新数据源时，新增数据源可能会带来不一致，并可能破坏 Tableau。借助 Python 脚本和代码描述（更正式地称为 markdown 文档），您可以有效地共享和授权其他人理解您的代码并解决可能出现的任何编程问题。
节省数据刷新时间： 需要定期刷新的数据可以从利用 Hyper API 中受益，Hyper API 是一个生成特定于 Tableau 的 Hyper 文件格式的应用程序，允许自动上传数据提取，同时提高数据刷新过程的效率。

现在我们已经介绍了准备数据的一些优点，让我们通过创建一个简单的数据管道来将其付诸实践。我们将探讨如何将数据清理和处理集成到工作流中，并帮助简化可视化效果的管理。

三、使用 Python 脚本创建数据管道

图片来源：作者

我们的数据过程非常简单：数据清理、视觉对象数据处理，并将其转换为 Tableau 就绪的超级文件以实现无缝集成。

在深入研究我们的工作示例之前，最后一点是，对于 Hyper 文件转换，您需要下载库。此库简化了将 Pandas 数据帧转换为 Tableau .hyper 数据提取的过程。您可以通过在所选环境的终端中使用以下代码轻松完成此操作（对于那些不太熟悉环境的人来说，这是一篇关于它们是什么以及如何安装某些库的很棒的入门文章）：pantab

#run the following line of code to install the pantab library in your environment
pip install pantab

四、教程：使用 Python 进行数据准备（探索加拿大的电动汽车牌照）

我们将根据加拿大统计局的政府可用数据，专注于不同电动汽车制造商和车型的受欢迎程度。

重要的是要注意，这建立在我之前的文章中使用的数据集之上：使用R进行电动汽车分析。如果您有兴趣了解数据集的初步探索以及所做决策背后的基本原理，请参阅它以获取更多详细信息。本教程重点介绍如何构建 Python 脚本，在初始输入之后的每一步中，我们将每个 Python 脚本的输出保存到各自的文件夹中，如下所述：

图片来源：作者

文件夹过程可确保管道井井有条，并且我们能够记录项目中每个输出。让我们开始构建我们的第一个 Python 脚本！

4.1 数据清理

管道中的初始脚本遵循数据清理的基本步骤，对于此数据集，这些步骤包括：保留/重命名相关列、删除 null 和/或重复项，以及使数据值保持一致。

我们可以从指定输入文件位置和输出文件的目的地开始。此步骤很重要，因为它允许我们在同一位置组织文件的不同版本，在这种情况下，我们每月修改文件输出，因此每个文件输出按月分隔，如文件名末尾所示：2023_04

#import necessary packages
import pandas as pd 
import os.path as path

inputfile = "Data/prep_tableau/input/izev-april-2023.csv" 
outputfile = 'clean_data/clean_data_2023-04.csv'

以下代码读取原始.csv输入，并定义我们要保留的列。在这种情况下，我们有兴趣保留与所购买车型类型相关的信息，而忽略与汽车经销商或任何其他不相关的列。

# read in the data
df = pd.read_csv(inputfile)

# removing certain columns
clean_df = df[df.columns[~df.columns.isin(['Incentive Request Date', 
                                           'Government of Canada Fiscal Year (FY)',
                                           'Dealership Province / Territory '
                                           'Dealership Postal Code','BEV/PHEV/FCEV - Battery equal to or greater than 15 kWh or \nElectric range equal to or greater than 50 km',
                                           'BEV, PHEV  ? 15 kWh or PHEV < 15 kWh (until April 24, 2022) \nand\nPHEV ?  50 km or PHEV < 50 km and  FCEVs ? 50 km or FCEVs < 50 km\n(April 25, 2022 onward)',
                                           'Individual or Organization \n(Recipient)',
                                           'Country'])]]

现在我们可以缩短列名，删除前导或尾随空格，并添加下划线以便于理解。

# shortening longer column names
clean_df = clean_df.rename({"Battery-Electric Vehicle (BEV), Plug-in Hybrid Electric Vehicle (PHEV) or Fuel Cell Electric Vehicle (FCEV)" : "EV_Type",
                     "Recipient Province / Territory":"Province.Recipient"},axis="columns")

# adding and removing white spaces underscores between column names
clean_df.columns = clean_df.columns.str.strip()
clean_df.columns = clean_df.columns.str.replace(' ', '_')

接下来，在检查数据集中只有几个空条目后，我们将使用该函数删除空数据。此时，您还希望删除重复项，但对于此特定数据集，我们不会删除。这是因为存在大量重复信息，并且在没有行标识符的情况下，删除重复项将导致数据丢失。.dropna

# removing nulls
clean_df = clean_df.dropna(how="all")

最后一步是将数据作为.csv文件保存到适当的文件夹位置，该位置将放置在我们共享目录的文件夹中。clean_data

# save to csv
clean_path = path.abspath(path.join(__file__ ,'../', outputfile ))
clean_df.to_csv(clean_path,index=False)

请注意我们如何使用引用文件，并使用 bash 命令指定文件目录，其中指示以前的文件夹。我们的数据清理脚本到此结束。现在让我们进入数据处理阶段！__file__../

访问完整的工作代码和组装脚本可以在我的Github存储库中找到。

4.2 可视化的数据处理

让我们重新审视一下我们试图实现的可视化目标，这些目标旨在突出注册电动汽车普及率的变化。为了有效地展示这一点，我们希望最终的 Tableau 就绪数据集包含以下功能，我们将对这些功能进行编码：

按年份划分的车辆绝对数量
按年份划分的车辆比例
登记车辆增减幅度最大
登记车辆排名
以前注册比较的车辆排名

根据您打算生成的视觉效果，创建理想列可能是一个迭代过程。就我而言，我在构建可视化后包括了最后一列，因为我知道我想为查看者提供排名差异的视觉比较，因此相应地调整了 Python 脚本。

对于以下代码，我们将重点关注模型聚合数据集，因为品牌的其他数据集非常相似。让我们首先定义我们的和：inputfileoutputfile

inputfile = "/Data/prep_tableau/clean_data/clean_data_2023-04.csv"
outputfile = "clean_model/ev_vehicle_models_2023-04.csv" #edit date as needed

请注意我们如何引用 from 文件夹，这是我们的数据清理脚本的输出。inputfileclean_data

下面的代码读取数据，并创建聚合计数的数据框：Vehicle_Make_and_ModelCalendar_Year

# Read in the data
auto_df = pd.read_csv(inputfile)

# Defining the Dataframe and renaming columns
processed_auto = pd.DataFrame(auto_df.groupby(["Vehicle_Make_and_Model", "Calendar_Year"])["Calendar_Year"].count())
processed_auto = processed_auto.rename(columns={"Calendar_Year": "count"}).reset_index()

该函数的执行类似于 Excel 中的数据透视表函数，其中它将每个值作为列输入。pivotCalendar_Year

# Pivoting the data based on Vehicle Make and Year with their respective counts
processed_auto_pivot = processed_auto.pivot(index='Vehicle_Make_and_Model', columns='Calendar_Year', values='count').reset_index()

然后，脚本使用 For 循环来创建输入。这将计算每个模型的比例，以便能够在同一比例上比较每个模型，并为每年创建一个列：per_1K

# Defining column list required for the For Loop
col_list = range(2019, 2024)

# Looking at magnitude every 1000 cars - For loop
for year in col_list:
    column_name = f"per_1K_{year}"
    total_column = year
    processed_auto_pivot[column_name] = round(processed_auto_pivot[total_column] / processed_auto_pivot[total_column].sum(), 4) * 1000

通过按年计算比例，我们可以计算出从 2019 年数据集开始到 2022 年最后一个全年数据的最大增减。

#Calculating prop_num_change
processed_auto_pivot["prop_num_change"] = processed_auto_pivot["per_1K_2022"] - processed_auto_pivot["per_1K_2019"]

在这里，该函数用于将按年份分隔的列重新透视回行，因此我们只有一列及其关联值。meltper_1Kper_1K

# Pivoting for totals
cars_per1K = pd.melt(
    processed_auto_pivot,
    id_vars=["Vehicle_Make_and_Model", "prop_num_change"],
    value_vars=["per_1K_2019", "per_1K_2020", "per_1K_2021", "per_1K_2022", "per_1K_2023"],
    var_name="year",
    value_name="per_1K"
).loc[:, ["Vehicle_Make_and_Model", "year", "per_1K", "prop_num_change"]

下面的代码允许我们联接绝对计数和我们刚刚创建的其他计算。

# Making year names consistent with processed_auto
cars_per1K["year"]= cars_per1K["year"].str.replace("per_1K_", "")

#joining the total counts with 1K totals
ev_totals = processed_auto.merge(cars_per1K, left_on=["Vehicle_Make_and_Model", "Calendar_Year"], right_on=["Vehicle_Make_and_Model", "year"], how="left")
#dropping irrevelant column
ev_totals = ev_totals.drop("year", axis=1)

现在，我们可以使用许可证计数创建列，并按和对这些值进行排序。rankVehicle_Make_and_ModelCalendar_Year

#ranking model by counts
ev_totals['rank'] = ev_totals.groupby('Calendar_Year')['count'].rank(ascending=False, method="min")
ev_totals = ev_totals.sort_values(['Vehicle_Make_and_Model', 'Calendar_Year'])

要创建的最后一列是使用该函数创建的列。previous_rankshift

#creating previous rank, lag by rank
ev_totals['previous_rank'] = ev_totals.groupby('Vehicle_Make_and_Model')['rank'].shift()

最后，我们能够将输出保存到管道中的文件夹路径，为我们提供一个可视化就绪数据集。clean_model

# save to csv
model_path = path.abspath(path.join(__file__ ,'../', outputfile ))
ev_totals.to_csv(model_path,index=False)

作为友情提醒，完整的 python 脚本代码，包括已处理数据集的代码，可以在我的 GitHub 存储库中找到。clean_brand

4.3 将最终数据文件转换为 .hyper 文件格式

管道的最后一步相对简单，因为我们剩下要做的就是将我们创建.csv处理的文件转换为 .hyper 文件格式。只要您下载了前面提到的库，这应该相对容易。pantab

值得一提的是，在 Tableau 中，连接的数据既可以实时连接，也可以提取。实时连接可确保数据流持续，来自源的更新几乎立即反映在 Tableau 中。提取的数据涉及 Tableau 创建一个文件扩展名为 .hyper 的本地文件，其中包含数据的副本（可在此处找到数据源的详细说明）。它的主要优点是其快速加载功能，Tableau 可以更有效地访问和呈现信息，这对于大型数据集特别有用。

超级文件转换脚本的代码从加载和包开始，然后读取 Tableau 所需的数据集。pandaspantabcleaned_model

import pandas as pd
import pantab

#read in files
model_df = pd.read_csv('Data/prep_tableau/clean_model/ev_vehicle_models_2023-04.csv')

最后一行代码使用生成 .hyper 文件并将其保存到文件夹中的函数。frame_to_hyper hyper

#save to hyper file
pantab.frame_to_hyper(model_df, "hyper/ev_vehicle_models.hyper", table="rank_vehicle_models")

最后一步，我们可以通过打开新工作簿轻松地将 .hyper 文件格式加载到 Tableau 中，在该部分中，您可以通过选择 .当我们加载文件时，它应该显示为 Tableau 数据提取，如下面的屏幕截图所示，您的数据已准备好在其上构建视觉对象！select a filemoreev_vehicle_models.hyper

五、结语

通过将深思熟虑的规划纳入可视化效果，您可以通过创建简单的数据管道来简化仪表板的维护。如果您缺乏资源，请不要担心;像Python这样的开源编码程序提供了强大的功能。最后，作为友好的提醒，要访问Python脚本，请在此处查看我的GitHub存储库。

微信小程序|系统配送员如何登陆抢单？同城配送、预约服务惠惠软件数据恢复专辑微信小程序微信小程序
系统中有多个功能有有配送端，最主要的是同城配送，和预约服务两个功能，首先介绍一下同城配送的配送员登录（扩展的同城配送需要开启）第一步，设置模板消息，配送员通过微信模板消息接收配送信息，需要在平台——微信公众号——模板消息设置（注：已认证服务号才能开通模板消息功能，在公众平台(mp.weixin.qq.com)[功能]-[添加功能插件]-[模板消息]中申请开通所在行业选择：IT科技/互联网|电子商务
linux环境下快速输出电脑的系统/硬件/显卡/网络/已安装软件等信息 Tipriest_ Ubuntu linux 电脑网络信息输出
在Linux环境下，可以通过以下命令快速获取系统和硬件信息。最后将这些命令整合成一个脚本（如`sysinfo.sh``），一键输出所有信息。1.系统信息#内核信息uname-a#发行版信息lsb_release-a2>/dev/null||cat/etc/*release*#系统启动时间uptime#环境变量echo"PATH:$PATH"2.硬件信息#CPU信息lscpucat/proc/cpu
C++中map和set的详解黑猫Teng c++算法开发语言
C++中map和set的介绍与使用在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一的，且按照升序排序。map的内部结构是红黑树，这使得
基于MATLAB的齿轮箱振动信号分析代码编织匠人 matlab 开发语言数学建模
基于MATLAB的齿轮箱振动信号分析齿轮传动是工业生产中常见的机械传动方式，但是在长期运转过程中会产生振动现象，这种振动会影响齿轮传动的精度、寿命以及稳定性。因此，对齿轮箱振动信号的分析就显得非常重要。MATLAB是一款功能强大的数学软件，可以用于对齿轮箱振动信号进行分析和处理。本文就将介绍如何利用MATLAB对齿轮箱振动信号进行分析。一、齿轮箱振动信号获取首先，我们需要获取齿轮箱振动信号。通常可
CSS3：深度解析与实战应用扣得A艾 css3 css 前端
CSS3：深度解析与实战应用详解1.选择器增强2.盒模型扩展3.渐变和背景4.转换和动画总结CSS3是CSS（层叠样式表）的最新版本，它引入了许多新的特性和功能，使得网页的样式设计更加灵活、丰富和具有动态效果。在本文中，我们将深入解析CSS3的一些关键特性和实战应用，并通过代码样例展示其强大之处。1.选择器增强CSS3增加了许多新的选择器，如属性选择器、伪类选择器等，使得我们能够更精确地选择页面元
【MySQL】B树和B+树的区别？MySQL为什么选用B+树作为索引数据结构？熏鱼的小迷弟Liu 数据结构 mysql b树
B树和B+树的区别：结构方面：1.节点存储内容：B树：节点同时存储索引和数据。B+树：只有叶子节点存储数据记录或指向数据记录的指针，非叶子节点只存键值，用于索引。B+树的非叶子节点可以存储更多的键值，从而拥有更宽的分支。2.叶子结点关系：B树：叶子节点之间没有特定的顺序或指针连接，它们是独立的，查找不同叶子节点中的数据时可能需要多次随机访问磁盘。B+树：所有叶子节点通过双向链表，这种结构使得范围查
遨游科普：三防平板是哪三防？有哪些应用场景？ AORO_BEIDOU 电脑智能手机安全 5G 信息与通信
在工业智能化与数字化转型的浪潮中，电子设备的耐用性和环境适应性成为关键需求。普通消费级平板电脑虽然功能强大，但在极端环境下往往“水土不服”。而三防平板凭借其独特的防护性能，正逐步成为“危、急、特”场景的核心工具。AOROP300Ultra三防平板那么，“三防”究竟是哪“三防”？“三防”是电子设备领域对防尘、防水、防摔三大防护能力的统称，但这并非简单的功能叠加，而是通过材料、结构、工艺三重创新实现的
【python】Python中常见的KeyError报错分析景天科技苑 python 开发语言 python报错 KeyError
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，linux，shell脚本等实操
fastapi+angular实现菜鸟驿站系统勘察加熊人 typescript fastapi angular.js 前端
说明：我计划用fastapi+angular实现菜鸟驿站系统userid和stationid暂时先写死全部写成1也就是用户1驿站1这样就可以简化流程1.新增包裹入库增加一个添加入库的按钮然后填写信息然后入库2.新增包裹取件按钮post请求，弹窗填写取件码，取件成功需要刷新包裹状态3.获取超时列表比如有些包裹严重超时我需要查看超时包裹的信息和位置4.还需要取件记录表用弹窗每次用户取件都必须有一条取件
手机零部件三维光学测量解决方案 yy229382036 人工智能 3d 光学成像算法
在移动互联网时代，智能终端深受市场追捧，而智能手机占据了第一大移动智能终端的地位。市场的火热造就了手机厂商白热化的竞争，继CPU、屏幕、摄像头等硬件配置大战之后，以外观、设计、质量为切入点的设计及功能竞争，也日趋激烈。在手机设计、质量检测中，无论是手机中框还是屏幕，利用三维光学测量技术，有助于优化从原型和模具构建、首件检验报告到装配分析等环节的质量控制，并有效节省检测时间，快速推进新产品上市。另外
C++内存管理秘籍：深入解析与实战代码示例萱萱199504 c++java 开发语言
C++内存管理秘籍：深入解析与实战代码示例一、内存管理的基本概念二、内存泄漏与野指针三、智能指针：现代C++的内存管理利器四、实战代码示例示例1：传统动态内存管理示例2：使用`std::unique_ptr`示例3：使用`std::shared_ptr`五、总结在C++编程的世界里，内存管理是一项既基础又核心的技能。它直接关系到程序的性能、稳定性和可维护性。不同于一些高级语言自动管理内存的特性，C
CSS3：深度解析与实战应用 my1121716951 css3 css 前端
CSS3：深度解析与实战应用详解1.选择器增强2.盒模型扩展3.渐变和背景4.转换和动画总结CSS3是CSS（层叠样式表）的最新版本，它引入了许多新的特性和功能，使得网页的样式设计更加灵活、丰富和具有动态效果。在本文中，我们将深入解析CSS3的一些关键特性和实战应用，并通过代码样例展示其强大之处。1.选择器增强CSS3增加了许多新的选择器，如属性选择器、伪类选择器等，使得我们能够更精确地选择页面元
NVIDIA-B200 OFED安装失败解决步骤，实际生产环境故障一例清风 001 AI大模型底层建设 linux 运维服务器
环境信息系统ubuntu22.04硬件nvidiaB200nvidia-driverubuntu2204-570.124.06cudacuda-toolkit-12-8报错信息./MLNX_OFED_LINUX-24.10-2.1.8.0-ubuntu22.04-x86_64/DEBS/libibumad-dev_2410mlnx54-1.2410068_amd64.deb./MLNX_OFED_
Spring Boot中@Valid 与 @Validated 注解的详解 jiajia651304 spring boot 后端 java
SpringBoot中@Valid与@Validated注解的详解引言@Valid注解功能介绍使用场景代码样例@Validated注解功能介绍使用场景代码样例@Valid与@Validated的区别结论引言在SpringBoot应用中，参数校验是确保数据完整性和一致性的重要手段。@Valid和@Validated注解是SpringBoot中用于参数校验的两个核心注解。本文将详细介绍这两个注解的用法
手机租赁平台开发技术方案解析红点聊租赁其他
内容概要想造个手机租赁平台？这事儿可比租共享充电宝复杂多了——毕竟用户可能抱着价值万元的折叠屏手机连夜跑路（别笑，真有案例）。不过别慌，咱们的"技术武器库"里藏着三件法宝：区块链账本、AI风控雷达和支付宝生态对接器。先说区块链架构，它就像个永远撕不坏的记账本。每次租赁订单生成时，系统会自动在链上刻下"电子纹身"，把设备序列号、租赁协议、用户身份信息打包成加密积木块。就算有人想偷偷给手机刷机，区块链
全面解析手机租赁平台开发的关键要素与实施策略红点聊租赁其他
内容概要在手机租赁平台开发的过程中，市场调研是至关重要的一步。只有深入了解用户需求和行业趋势，才能确保平台的成功。首先要考虑潜在用户，他们究竟对手机租赁有什么期望？是希望租金更便宜，还是更看重手机的款式和新旧程度？通过问卷、访谈等方式收集相关数据，可以帮助确定目标市场的特征。接下来，我们需要关注行业趋势。近年来，随着环保意识的增强和消费习惯的改变，越来越多的人开始倾向于租赁而非购买。这一趋势不仅改
金融租赁系统的创新发展与市场竞争力提升探讨红点租赁系统开发其他
内容概要随着经济的快速发展，金融租赁系统逐渐成为金融市场中不可或缺的一环。它不仅提供了灵活的资金解决方案，还促进了企业的资本结构优化与资源配置效率。因此，了解该系统的市场背景与发展现状至关重要。在现今环境下，新兴技术如人工智能、大数据和区块链等正加速推动金融租赁的创新。通过这些技术，不仅可以优化业务流程，提升运营效率，还可以增强风险管理能力。例如，利用数据分析可以实时监测租赁资产的风险，从而采取相
手机租赁系统开发核心技术解析红点租赁系统开发其他
内容概要如果把手机租赁系统比作一台精密运转的智能管家，那它的骨架可不是用代码随便搭的乐高积木。这玩意儿得同时搞定三件事：让用户像刷短视频一样流畅下单，让风控系统比小区门禁还难糊弄，还得让物流信息比外卖小哥的定位更透明。想象一下，当你在APP里滑动挑选最新款折叠屏手机时，后台其实正在上演三重加密的信用评分大战——你的芝麻信用分、电商平台消费记录甚至社交账号活跃度，都被塞进算法熔炉里炼成租赁权限的通行
SassScript：Sass中的编程特性详解算法探险家 sass 前端 css
Sass（SyntacticallyAwesomeStylesheets）是一种强大的CSS预处理器，它允许开发者使用类似于编程语言的语法来编写CSS，然后通过编译生成标准的CSS代码。SassScript是Sass中的编程特性集合，它包含了变量、嵌套规则、混合、函数以及控制指令等，极大地提高了CSS的开发效率和可维护性。1.变量SassScript中的变量允许开发者在样式表中存储和重复使用值。变
Spring Boot实战：MySQL与Redis数据一致性深度解析与代码实战算法探险家 spring boot mysql redis
SpringBoot实战：MySQL与Redis数据一致性深度解析与代码实战一、数据一致性问题概述二、常见解决方案三、选择合适的解决方案四、总结在SpringBoot开发中，MySQL作为关系型数据库，提供了强大的数据存储和查询能力；而Redis作为内存数据库，以其高速读写性能成为缓存层的首选。然而，当这两者共同服务于一个系统时，如何确保它们之间的数据一致性，成为了一个不可忽视的问题。本文将深入探
【AI大模型-提示词中的###和“““】 NeVeRMoRE_2024 AI大语言模型-ChatGPT 人工智能
提示词中活用###和"""（或其他特殊字符或格式）的原因主要基于以下几点：1.结构化与清晰性在编写提示词时，使用特殊字符如###和"""可以帮助将复杂的指令或上下文信息结构化，使其更加清晰易懂。这对于大型语言模型（LLMs）尤为重要，因为它们需要处理大量的输入信息，并据此生成输出。结构化的提示词有助于模型更好地理解用户的意图，减少误解的可能性。例如，使用###作为分隔符，可以将提示词中的不同部分（
MySQL常用函数详解及SQL代码示例星河浪人 mysql sql android
MySQL常用函数详解及SQL代码示例引言当前日期和时间函数字符串函数数学函数聚合函数结论引言MySQL作为一种广泛使用的关系型数据库管理系统，提供了丰富的内置函数来简化数据查询、处理和转换。掌握这些函数可以大大提高数据库操作的效率和准确性。本文将详细介绍MySQL中一些常用的函数，并配以SQL代码示例，帮助读者更好地理解和应用这些函数。当前日期和时间函数在当前时间（中国北京时间2025年03月1
深入理解Java集合框架：构建高效、灵活的数据管理方案漏洞猎人001 java 开发语言
深入理解Java集合框架：构建高效、灵活的数据管理方案引言Java集合框架（JavaCollectionsFramework,JCF）是Java语言提供的一套用于表示和操作集合的统一架构。它包含了一系列的接口和类，用于存储和操作对象集合，如列表（List）、集合（Set）、映射（Map）和队列（Queue）等。集合框架的设计初衷是为了提供一套灵活、可重用且类型安全的集合数据结构，帮助开发者以统一和
Linux基础指令详解：掌握Linux系统的必备技能智能编织者 linux 服务器运维
Linux基础指令详解：掌握Linux系统的必备技能一、Linux基础指令概述二、基础指令详解1.**ls**2.**cd**3.**pwd**4.**mkdir**5.**rmdir**6.**rm**7.**cp**8.**mv**9.**cat**10.**more**和**less**11.**chmod**12.**chown**13.**df**14.**du**15.**ps**16
AGI大模型（5）：提示词工程不死鸟.亚历山大.狼崽子 AGI大模型 agi
1什么是提示词工程（Prompt）所谓的提示词其实指的就是提供给模型的⼀个⽂本⽚段，⽤于指导模型⽣成特定的输出或回答。提示词的⽬的是为模型提供⼀个任务的上下⽂，以便模型能够更准确地理解⽤户的意图，并⽣成相关的回应。2什么是提示⼯程(PromptEngineering)所谓的提示⼯程也可以被称为「指令⼯程」，提示⼯程的核⼼思想是，通过精⼼设计的提示，可以显著提⾼模型的性能和输出质量。貌似简单，但其实
微软开源神器OmniParser V2.0 介绍魔王阿卡纳兹开源项目观察大模型知识札记 microsoft OmniParser 开源项目
微软开源的OmniParserV2.0是一款基于纯视觉技术的GUI智能体解析工具，旨在将用户界面（UI）截图转换为结构化数据，从而实现对计算机屏幕上的可交互元素的高效识别和操控。这一工具通过结合先进的视觉解析技术和大型语言模型（LLM），显著提升了AI智能体在复杂环境下的识别能力和操作效率。核心功能与特点高精度识别：OmniParserV2.0在检测小尺寸可交互UI元素时的准确率显著提升，达到了3
设计模式六大原则（3）：依赖倒置原则岸似达春绿设计模式设计模式设计模式 string class 编程 setter interface
定义：高层模块不应该依赖低层模块，二者都应该依赖其抽象；抽象不应该依赖细节；细节应该依赖抽象。问题由来：类A直接依赖类B，假如要将类A改为依赖类C，则必须通过修改类A的代码来达成。这种场景下，类A一般是高层模块，负责复杂的业务逻辑；类B和类C是低层模块，负责基本的原子操作；假如修改类A，会给程序带来不必要的风险。解决方案：将类A修改为依赖接口I，类B和类C各自实现接口I，类A通过接口I间接与类B或
如何申请Manus邀请码？手把手教你获取开发者权限/产品试用资格小小鸭程序员云计算云原生 AI编程 spring cloud 人工智能
引言Manus作为全球领先的VR/AR手势追踪与力反馈技术提供商，其产品如ManusPrime系列VR手套和CoreSDK深受开发者与科研团队青睐。但许多用户反馈，部分高级功能或产品试用需通过**邀请码（InvitationCode）**申请。本文将从零开始，详解Manus邀请码的申请流程、填写技巧与避坑指南。一、什么是Manus邀请码？作用：用于解锁开发者权限、申请硬件试用（如VR手套）、访问私
使用GCC编译Notepad++的插件硫酸锌01 Windows C/C++notepad++windows c++
Notepad++的本体1是支持使用MSVC和GCC编译的2，但是Notepad++插件的官方文档3里却只给出了MSVC的编译指南4。网上也没有找到相关的讨论，所以我尝试在Windows上使用MinGW，基于GCC-8.1.0的posix-sjlj线程版本5，研究一下怎么编译：官方例程：https://github.com/npp-plugins/plugindemo语法修改：在StaticDia
解决Python中递归报错的问题硫酸锌01 Python python
1、问题背景Duringhandlingoftheaboveexception,anotherexceptionoccurred:有没有见到过这个报错？当出现这个报错的时候，意味着报错信息特别特别地长，难以关注到有效信息。那么这种报错是如何产生的？以及如何设计才能避免产生这种冗长的报错？2、我的需求如果我有一个Python的多维数组列表：lst=[[[1,2],[3,4]],[[5,6],[7,8
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http