SuasyYi

【机器学习】快速入门！关于 Pandas 库的简介和常用方法整理

Pandas

Pandas 简介
1. 数据加载和存储
- - 加载数据：
  - 存储数据：
2. 数据清洗
3. 数据统计和汇总
4. 数据选择和过滤
5. 数据合并和连接
6. 时间序列处理
- - 创建时间序列数据：
  - 索引和选择：
  - 时间序列分析：
  - 时间序列可视化：
7. 其他常用函数
- - train.head()
  - train.info()
写在最后

Pandas 简介

Pandas 是一个开源数据分析和数据操作的Python库。它提供了数据结构，如 Series 和 DataFrame，用于处理和分析结构化数据。Pandas 的设计是为了使数据清洗和分析变得更加快速、简单和直观。

主要的 Pandas 数据结构包括：

Series： 一维标记数组，类似于带有标签的 NumPy 数组。可以包含任何数据类型。
DataFrame： 二维表格数据结构，类似于关系型数据库中的表格或 Excel 表格。是 Pandas 中最常用的数据结构，可以将多个 Series 按列组合而成。

Pandas 提供了许多功能，包括：

数据的加载和存储：Pandas 支持多种数据格式，包括 CSV、Excel、SQL、JSON 等。
数据清洗：处理缺失值、重复值、异常值等。
数据选择和过滤：通过标签或位置选择和过滤数据。
数据统计和汇总：计算各种统计量、汇总数据。
数据合并和连接：合并不同数据源的数据。
时间序列处理：支持时间序列数据的处理和分析。

Pandas 是进行数据分析和预处理的强大工具，尤其在数据科学和机器学习领域得到了广泛的应用。它构建在 NumPy 的基础上，为数据分析提供了更高级的、更易用的接口。

1. 数据加载和存储

在 Pandas 中，你可以使用不同的函数来加载和存储各种数据格式，包括 CSV、Excel、SQL、JSON 等。以下是一些建议的方法：

加载数据：

从 CSV 文件加载数据：
使用 pd.read_csv() 函数加载 CSV 文件。

import pandas as pd

# 从 CSV 文件加载数据
df = pd.read_csv('file.csv')

从 Excel 文件加载数据：
使用 pd.read_excel() 函数加载 Excel 文件。

import pandas as pd

# 从 Excel 文件加载数据
df = pd.read_excel('file.xlsx', sheet_name='Sheet1')

从 SQL 数据库加载数据：
使用 pd.read_sql() 函数加载 SQL 数据库中的数据。

import pandas as pd
from sqlalchemy import create_engine

# 创建数据库连接
engine = create_engine('sqlite:///:memory:')

# 从 SQL 数据库加载数据
df = pd.read_sql('SELECT * FROM table_name', con=engine)

从 JSON 文件加载数据：
使用 pd.read_json() 函数加载 JSON 文件。

import pandas as pd

# 从 JSON 文件加载数据
df = pd.read_json('file.json')

存储数据：

存储为 CSV 文件：
使用 to_csv() 方法将数据保存为 CSV 文件。
```
# 存储为 CSV 文件
df.to_csv('output.csv', index=False)
```

存储为 Excel 文件：
使用 to_excel() 方法将数据保存为 Excel 文件。

# 存储为 Excel 文件
df.to_excel('output.xlsx', sheet_name='Sheet1', index=False)

存储到 SQL 数据库：
使用 to_sql() 方法将数据保存到 SQL 数据库中。

from sqlalchemy import create_engine

# 创建数据库连接
engine = create_engine('sqlite:///:memory:')

# 存储到 SQL 数据库
df.to_sql('table_name', con=engine, index=False, if_exists='replace')

存储为 JSON 文件：
使用 to_json() 方法将数据保存为 JSON 文件。
```
# 存储为 JSON 文件
df.to_json('output.json', orient='records')
```

这些是一些建议的方法，但 Pandas 支持的数据格式和存储方法远不止这些。具体的选择取决于你的数据格式和存储需求。在使用这些方法时，请注意适当配置参数以满足你的具体情况。

2. 数据清洗

数据清洗是数据分析和建模过程中至关重要的一步，旨在处理数据集中的缺失值、异常值和重复值，以确保数据的质量和可靠性。以下是一些建议的数据清洗步骤：

处理缺失值：
- 使用 isnull() 和 sum() 方法查找缺失值的数量。
- 使用 dropna() 方法删除包含缺失值的行或列。
- 使用填充方法，如 fillna()，以替换缺失值。
```
# 查找缺失值的数量
print(df.isnull().sum())

# 删除包含缺失值的行
df = df.dropna()

# 填充缺失值
df['column_name'].fillna(value, inplace=True)
```
处理重复值：
- 使用 duplicated() 方法查找和处理重复值。
- 使用 drop_duplicates() 方法删除重复行。
```
# 查找重复值
print(df.duplicated().sum())

# 删除重复行
df = df.drop_duplicates()
```

处理异常值：

使用可视化工具（如箱线图）来检测异常值。
使用统计方法，如 Z 分数或 IQR 方法来标识和处理异常值。

# 使用 Z 分数检测异常值
z_scores = (df['column_name'] - df['column_name'].mean()) / df['column_name'].std()
df_no_outliers = df[(z_scores < 3) & (z_scores > -3)]

格式化数据类型：

使用 astype() 方法将列的数据类型更改为正确的类型。
使用 to_datetime() 方法将日期字符串转换为日期类型。

# 将列的数据类型更改为整数
df['column_name'] = df['column_name'].astype(int)

# 将日期字符串转换为日期类型
df['date_column'] = pd.to_datetime(df['date_column'])

处理不一致的数据：

标准化文本数据，确保统一的格式。
使用 str.replace() 方法替换不一致的文本。

# 标准化文本数据
df['text_column'] = df['text_column'].str.lower()

# 替换不一致的文本
df['text_column'] = df['text_column'].str.replace('old_value', 'new_value')

这些是一些基本的数据清洗步骤，具体的清洗过程取决于数据集的特性和问题的性质。在清洗数据时，保持文档记录清洗步骤，并在必要时创建备份以避免不可逆的更改。

3. 数据统计和汇总

在数据分析中，数据统计和汇总是了解数据集特征和提取有用信息的关键步骤。Pandas 提供了丰富的功能来进行数据统计和汇总。以下是一些建议的方法：

描述性统计信息：
使用 describe() 方法可以获取数据集的描述性统计信息，包括均值、标准差、最小值、最大值等。
```
# 描述性统计信息
print(df.describe())
```
计数和唯一值：
使用 value_counts() 方法可以计算每个唯一值的频数。
```
# 计数唯一值
print(df['column_name'].value_counts())
```
汇总统计信息：
使用 groupby() 和聚合函数（如 sum()、mean()、median() 等）可以对数据进行分组汇总。
```
# 按列进行分组，并计算每组的总和
grouped_data = df.groupby('group_column')['numeric_column'].sum()
```
相关性分析：
使用 corr() 方法可以计算数据集中各列的相关性系数矩阵。
```
# 相关性矩阵
correlation_matrix = df.corr()
```
缺失值统计：
使用 isnull() 和 sum() 方法可以统计每列的缺失值数量。
```
# 缺失值统计
print(df.isnull().sum())
```
自定义汇总：
使用自定义的聚合函数，例如 agg() 方法，可以根据需要计算不同的统计信息。
```
# 自定义汇总
summary = df['numeric_column'].agg(['mean', 'std', 'min', 'max'])
```

透视表：
使用 pivot_table() 方法可以创建透视表，对数据进行多维度的汇总。

# 创建透视表
pivot_table = pd.pivot_table(df, values='value_column', index='index_column', columns='column_to_pivot', aggfunc='mean')

这些方法可以根据具体的数据集和分析任务进行调整和组合。在进行统计和汇总之前，确保对数据有清晰的理解，并根据问题的需求选择适当的统计方法。

4. 数据选择和过滤

在 Pandas 中，数据选择和过滤是通过索引、切片、条件过滤等方式来进行的。以下是一些建议的方法：

通过列名选择列：
使用列名，你可以选择一个或多个列。

# 选择单列
single_column = df['column_name']

# 选择多列
multiple_columns = df[['column1', 'column2']]

通过行号选择行：
使用 iloc 方法可以按行号选择行。

# 选择单行
single_row = df.iloc[0]

# 选择多行
multiple_rows = df.iloc[1:4]

通过标签选择行：
使用 loc 方法可以按标签选择行。

# 选择单行
single_row = df.loc['label']

# 选择多行
multiple_rows = df.loc[['label1', 'label2']]

通过条件过滤：
使用条件语句过滤数据。

# 根据条件过滤
filtered_data = df[df['column_name'] > 10]

使用逻辑运算符：
使用逻辑运算符（如 &、|、~）组合多个条件。

# 组合条件
filtered_data = df[(df['column1'] > 10) & (df['column2'] < 5)]

使用 isin() 方法：
使用 isin() 方法过滤数据，检查某列是否包含特定值。

# 使用 isin() 方法
filtered_data = df[df['column_name'].isin(['value1', 'value2'])]

根据字符串条件过滤：
使用字符串方法过滤数据，例如使用 str.contains()。

# 根据字符串条件过滤
filtered_data = df[df['column_name'].str.contains('substring')]

这些是一些基本的数据选择和过滤方法。在进行数据选择和过滤时，请确保理解数据的结构和内容，并根据具体的分析任务选择适当的方法。

5. 数据合并和连接

在 Pandas 中，数据合并和连接是将多个数据集组合成一个数据集的关键操作。以下是一些建议的方法：

使用 merge() 进行合并：
merge() 函数用于基于一个或多个键将两个数据框合并。默认情况下，它执行的是内连接（inner join）。
```
# 使用 merge 进行合并
merged_data = pd.merge(df1, df2, on='common_column')
```
这将在两个数据框中的共同列上执行内连接。
指定合并方式：
使用 how 参数可以指定合并方式，包括 'left'、'right'、'outer' 等。
```
# 指定合并方式
merged_data = pd.merge(df1, df2, on='common_column', how='left')
```
这将执行左连接，保留左边数据框的所有行。
使用 concat() 进行连接：
concat() 函数用于按行或列将多个数据框连接在一起。
```
# 使用 concat 进行连接
concatenated_data = pd.concat([df1, df2], axis=0)
```
这将按行连接两个数据框。
使用 join() 方法：
join() 方法用于将两个数据框基于索引进行连接。
```
# 使用 join 进行连接
joined_data = df1.join(df2, how='inner')
```
这将执行内连接，基于索引进行合并。
合并多个数据框：
可以多次使用 merge() 或 concat() 函数来合并多个数据框。
```
# 合并多个数据框
merged_data = pd.merge(df1, pd.merge(df2, df3, on='common_column'), on='common_column')
```
这将依次合并三个数据框。

这些方法提供了多样化的选项，以满足不同的合并和连接需求。在进行数据合并和连接时，请确保了解数据的关系和结构，并根据任务选择适当的方法。

6. 时间序列处理

Pandas 提供了强大的时间序列处理功能，使得对时间序列数据进行分析和操作变得相对容易。以下是一些建议的时间序列处理方法：

创建时间序列数据：

生成日期范围：
使用 pd.date_range() 函数生成一个日期范围。

import pandas as pd

# 生成日期范围
date_range = pd.date_range(start='2022-01-01', end='2022-12-31', freq='D')

将列转换为日期类型：
使用 pd.to_datetime() 函数将列转换为日期时间类型。

# 将列转换为日期时间类型
df['date_column'] = pd.to_datetime(df['date_column'])

索引和选择：

按日期选择数据：
使用日期作为索引，可以轻松选择特定日期范围的数据。

# 按日期选择数据
df = df.set_index('date_column')
selected_data = df['2022-01-01':'2022-01-10']

按时间间隔切片：
使用 resample() 方法可以对时间序列数据进行重采样，例如按天、周、月等进行汇总。
```
# 按周重采样
weekly_data = df.resample('W').sum()
```

时间序列分析：

计算滚动统计量：
使用 rolling() 方法计算滚动平均、滚动总和等。
```
# 计算滚动平均
rolling_mean = df['column'].rolling(window=7).mean()
```
时序差分：
使用 diff() 方法计算时序差分，以处理非平稳时间序列。
```
# 计算时序差分
differenced_data = df['column'].diff()
```

时间序列可视化：

绘制时间序列图：
使用 plot() 方法绘制时间序列图。

# 绘制时间序列图
df['column'].plot(figsize=(10, 6), title='Time Series Plot')

绘制滚动统计图：
绘制滚动统计图以可视化趋势。

# 绘制滚动平均图
df['column'].rolling(window=7).mean().plot(figsize=(10, 6), title='Rolling Mean Plot')

这些方法可以帮助你对时间序列数据进行处理、分析和可视化。根据具体的需求，你可能需要进一步了解时间序列分析的方法和技术。

7. 其他常用函数

train.head()

train.head() 是一个 pandas 数据框（DataFrame）的方法，用于显示数据框的前几行数据。这个方法返回数据框的前几行，通常默认显示前5行。这对于快速查看数据集的结构、了解数据的特征以及检查数据导入的正确性非常有用。

例如，如果你有一个名为 train 的 pandas 数据框，通过执行 train.head()，你将看到数据框的前5行。示例代码如下：

import pandas as pd

# 假设 train 是一个 pandas 数据框
train = pd.read_csv('your_dataset.csv')

# 显示数据框的前5行
print(train.head())

输出结果将是数据框的前5行，每行代表数据集中的一个样本，每列代表不同的特征。这样的预览有助于了解数据的结构，确保数据的导入和处理是正确的。

如果你想查看更多行，你可以在 head() 方法中传递一个整数参数，例如 train.head(10) 将显示前10行数据。

train.info()

train.info() 是 pandas 数据框（DataFrame）的一个方法，用于提供关于数据框的详细信息。这个方法返回一个关于数据框的摘要，包括每列的非空值数量、数据类型以及内存使用情况等信息。

示例代码如下：

import pandas as pd

# 假设 train 是一个 pandas 数据框
train = pd.read_csv('your_dataset.csv')

# 显示数据框的信息
print(train.info())

输出结果将包括以下信息：

数据框的总行数和总列数： 例如，“RangeIndex: 1000 entries, 0 to 999” 表示数据框有1000行。
每列的名称和非空值数量： 例如，“age 1000 non-null int64” 表示 “age” 列有1000个非空值，数据类型为整数。
每列的数据类型： 例如，“age int64” 表示 “age” 列的数据类型是整数。
内存使用情况： 例如，“memory usage: 78.2 KB” 表示该数据框占用了78.2千字节的内存。

train.info() 是一个非常有用的方法，可以帮助你快速了解数据框的结构、特征和缺失值情况。这对于数据清理和预处理阶段是至关重要的。

写在最后

本文采用了 ChatGPT 辅助进行内容的书写和完善

你可能感兴趣的:(笔记整理,机器学习,pandas,人工智能)

知识图谱构建概念、工具、实例调研熟悉的黑曼巴知识图谱人工智能
一、知识图谱的概念知识图谱（Knowledgegraph）知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成。节点可以是实体，如一个人、一本书等，或是抽象的概念，如人工智能、知识图谱等。边可以是实体的属性，如姓名、书名或是实体之间的关系，如朋友、配偶。知识图谱的早期理念来自SemanticWeb（语义网络），其最初理想是把基于文本链接的万维网落转化为基于
Python:数据从Excel表格链接到Word文档更新Excel即可自动更新Word 一个花生米生花 python excel word
要使用Python来创建或更新一个Word文档，并将数据从Excel表格链接到Word文档中，你可以使用python-docx库来操作Word文档和openpyxl或pandas库来读取Excel文件。不过，需要注意的是，python-docx库并不支持将外部文件链接到Word文档的功能。你可以在Word文档中插入Excel数据的快照，但它们不会自动更新。如果你想要在Word文档中插入Excel数
【deepseek与chatGPT辩论】辩论题： “人工智能是否应当具备自主决策能力？” 海宁不掉头发软件工程人工智能人工智能 chatgpt deepseek
探讨辩论题这个提案涉及创建一个精确的辩论题目，旨在测试deepseek的应答能力。创建辩论题目提议设计一个辩论题目以测试deepseek的应答能力。希望这个题目具有挑战性并能够测量其回应质量。好的，来一道适合深度学习的辩论题：辩论题：“人工智能是否应当具备自主决策能力？”这个话题涉及到人工智能的发展、伦理以及未来应用，可以从以下几个方面展开辩论：支持方：认为人工智能的自主决策能力能够加速科技进步，
FOKS-TROT: 一个高效、易用的全功能开源知识图谱生成工具柳旖岭
FOKS-TROT:一个高效、易用的全功能开源知识图谱生成工具项目简介FOKS-TROT是一个基于Python的全功能开源知识图谱生成工具，旨在帮助研究人员和开发者快速构建具有丰富信息的知识图谱。该项目由hkx3upper在GitCode上开发并维护。通过FOKS-TROT，您可以轻松地将各种数据源（如文本文件、数据库、API）转换为结构化的知识图谱，并对其进行可视化分析和机器学习任务。此外，该工
GenAI 平台，3 分钟即可构建基于 Claude、DeepSeek 的 AI Agent DO_Community 人工智能
DigitalOcean云服务在前不久发布了GenAI平台——一个让任何团队都能在几分钟内构建和部署AI代理的平台。DigitalOcean的GenAI平台持续扩展，让人工智能驱动的开发变得更加易用、灵活且强大。近日，Digitalocean宣布将Anthropic的Claude模型和DeepSeekR1引入Digitalocean的生态系统，为你提供更多构建和部署AI应用的选择。通过Anthro
智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！ V__17671155793 人工智能
智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！在科技飞速发展的当下，人工智能正以前所未有的态势重塑着各个行业的格局。直播领域，作为信息传播与商业交互的前沿阵地，也在AI技术的赋能下迎来了颠覆性的变革。其中，马斯克旗下的智享AI直播三代系统宛如一颗璀璨的新星，横空出世，以其卓越的性能和创新的理念，迅速在竞争激烈的直播市场中崭露头角，甚至被业界誉为可媲美DeepSeek的
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
DeepSeek与ChatGPT：会取代搜索引擎和人工客服的人工智能革命云边有个稻草人热门文章 chatgpt 搜索引擎人工智能 DeepSeek
云边有个稻草人-CSDN博客在众多创新技术中，DeepSeek和ChatGPT无疑是最为引人注目的。它们通过强大的搜索和对话生成能力，能够改变我们与计算机交互的方式，帮助我们高效地获取信息，增强智能服务。本文将深入探讨这两项技术如何结合使用，为用户提供更精准、更流畅的对话和搜索体验。目录一、介绍1.1什么是DeepSeek？1.2什么是ChatGPT？1.3DeepSeek与ChatGPT的结合：
LLM与知识图谱融合:智能运维知识库构建 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着信息技术的飞速发展，IT运维管理面临着越来越大的挑战。海量的设备、复杂的网络环境、日益增长的数据量，使得传统的运维方式难以满足需求。为了提高运维效率和质量，智能运维应运而生。智能运维的核心是将人工智能技术应用于运维领域，通过机器学习、深度学习等算法，实现自动化、智能化的运维管理。其中，大语言模型（LLM）和知识图谱是两个重要的技术方向。LLM能够理解和生成自然语言，可以用于构建智能
机器学习·文本数据读写处理 AAA顶置摸鱼 python 深度学习机器学习人工智能数据处理
前言在自然语言处理的第一步，需要面对的是各种各样以不同形式表现的文本数据，比如，txt、Excel中的表格数据，还有无法直接打开的pkl文件等。针对这些不同类型的数据，可以基于Python中的基本功能函数或者调用某些库进行读写以及作一些基本的处理。一、文本数据读写方法1.读写TXT文件读取方法：read()：读取整个文件，返回字符串。readline()：逐行读取，返回字符串。readlines(
Python中LLM的知识图谱构建：动态更新与推理二进制独立开发 GenAI与Python 非纯粹GenAI python 知识图谱开发语言自然语言处理人工智能分布式机器学习
文章目录引言1.知识图谱的基本概念1.1知识图谱的定义1.2知识图谱的构建流程2.利用LLM进行知识抽取2.1实体识别2.2关系抽取2.3属性抽取3.知识融合3.1实体对齐3.2冲突消解4.知识存储5.知识推理5.1规则推理5.2基于LLM的推理6.动态更新6.1增量更新6.2实时更新7.结论引言随着人工智能技术的飞速发展，知识图谱（KnowledgeGraph,KG）作为一种结构化的知识表示方法
无需配置！深脑云一键启用DeepSeek全系AI模型小深ai硬件分享人工智能深度学习服务器
解锁无限算力潜能，开启DeepSeek镜像云算力新征程！在人工智能风起云涌的时代，算力就是驱动创新的引擎，而优质的模型镜像则是引领变革的密钥。我们向您介绍一下我们的深脑云算力平台，这里汇聚了DeepSeek的各大版本镜像，为您的科研、开发与创新之路注入强大动力！强大的DeepSeek模型家族DeepSeek，作为AI领域的璀璨明星，以其卓越的性能和先进的技术架构闻名遐迩。我们的平台精心整合了Dee
AI服务器散热黑科技：让芯片“冷静”提速小深ai硬件分享人工智能深度学习服务器
AI服务器为何需要散热黑科技在人工智能飞速发展的当下，AI服务器作为核心支撑，作用重大。从互联网智能推荐，到医疗疾病诊断辅助，从金融风险预测，到教育个性化学习，AI服务器广泛应用，为各类复杂人工智能应用提供强大算力。然而，AI服务器在运行时面临着严峻的散热挑战。随着人工智能技术的不断发展，对AI服务器的计算能力要求越来越高，这使得服务器的功率密度急剧增加。以GPT-4的训练为例，它需要大量的GPU
深度应用场景：DeepSeek —— 探索AI赋能的智慧未来人工智能专属驿站人工智能
深度应用场景：DeepSeek——探索AI赋能的智慧未来随着人工智能的迅猛发展，数据的价值已不再局限于简单的存储与处理，它们正变得更加智能与高效。DeepSeek，这一创新的AI技术平台，正以其独特的深度学习能力，开启了各行各业的智能化变革。让我们走进一个由DeepSeek打造的深度应用场景，探索它如何推动未来的发展。1.智能医疗：精准诊断，拯救生命想象一下，医生们不再是唯一的诊断专家，而是与AI
在 DeepSeek 驱动的编程变革中抓住机遇并脱颖而出智想天开 AI技术人工智能 deep learning
公众号地址:在DeepSeek驱动的编程变革中抓住机遇并脱颖而出更多内容请关注公众号：智想天开前言在DeepSeek引领的新一轮AI技术革新中，程序员们正面临着前所未有的挑战。随着DeepSeek等人工智能工具的迅猛发展，编程领域正在发生深刻变革。这些先进的工具不仅能够自动化完成繁重的代码生成和调试任务，还能够根据大量数据提供优化建议，改变了传统编程的工作流程。虽然这些技术为提高工作效率和解放开发
项目管理新趋势！2024年，Jira与Codes你更倾向谁？ Codes_AndyLiu jira teambition redmine 项目管理软件项目管理工具项目管理 jira 国产平替
一、项目管理软件新趋势概述2024年，项目管理软件呈现出诸多新趋势，这些趋势对于项目管理的重要性日益凸显。在数字化转型方面，项目管理软件成为企业实现数字化转型的关键工具。让老板感知数据，让中层管理者感受先进，让基层员工感到舒心.人工智能与自动化在项目管理软件中的应用也越来越广泛。项目管理软件正朝着智能化、自动化的方向迈进，利用AI技术提供个性化和场景化解决方案。例如，工作周报AI化，自动化测试，代
【人工智能】提升编程效率的6种GPT实用应用技巧！保姆级讲解！ ChatGPT-千鑫人工智能 AI领域人工智能 gpt AI编程
文章目录实用教程：六大AI编程技巧解锁效率提升技巧1：快速实现需求demo操作步骤技巧2：代码审查——AI帮你提升代码质量操作步骤技巧3：错误排查——AI助你快速定位问题操作步骤技巧4：代码注释——AI帮你理解复杂逻辑操作步骤技巧5：数据整理——AI帮你高效准备测试数据操作步骤技巧6：学习未知代码库——AI助你快速掌握新工具操作步骤使用教程：全面掌握CodeMoss的高效编程工具（1）VSCode
利用人工智能增强可读性：自动为文本添加标点符号姚家湾 AI 标点符号
在数字通信时代，文本的清晰度和可读性至关重要。无论是转录口语、处理原始文本数据还是改进用户生成的内容，标点符号在传达预期信息方面都起着至关重要的作用。但是，手动编辑文本以添加标点符号可能非常耗时且容易出错。这就是人工智能(AI)发挥作用的地方，它提供了一种强大的解决方案，可以自动将标点符号插入句子中。目前，利用大模型的能力，完全可以胜任添加标点符号的工作，不需要其它特别的处理程序。参考代码from
用 TensorFlow 搭建简单的手写数字识别模型 lozhyf 工作面试学习 tensorflow 人工智能 python
一、引言手写数字识别是机器学习领域中一个经典且基础的问题，它在很多实际场景中都有广泛的应用，比如邮政系统中的邮件分拣、银行支票金额识别等。TensorFlow是一个强大的开源机器学习框架，由Google开发并维护，它提供了丰富的工具和接口，能帮助我们快速搭建和训练深度学习模型。在这篇博客中，我们将使用TensorFlow构建一个简单的神经网络模型，用于识别手写数字。二、环境准备在开始之前，你需要安
【机器学习】基于3D CNN通过CT图像分类预测肺炎 MUKAMO AI Python应用机器学习深度学习人工智能神经网络 3D CNN
1.引言1.1.研究背景在医学诊断中，医生通过分析CT影像来预测疾病时，面临一些挑战和局限性：图像信息的广度与复杂性：CT扫描生成的大量图像对医生来说既是信息的宝库也是处理上的负担。每组CT数据可能包含数百张切片，医生必须迅速审阅这些图像，以便捕捉到病变的微小细节。这种庞大的信息量要求医生在有限的时间内做出精准诊断，但同时也增加了漏诊或误诊的风险。部分容积效应也可能模糊小病变的边界，使得准确诊断变
TensorFlow LiteRT 概览姚家湾 tensorflow 人工智能 python
LiteRT（简称LiteRuntime，以前称为TensorFlowLite）是Google面向设备端AI的高性能运行时。您可以找到适用于各种机器学习/AI任务的LiteRT就绪模型，也可以使用AIEdge转换和优化工具将TensorFlow、PyTorch和JAX模型转换为TFLite格式并运行。主要特性针对设备端机器学习进行了优化：LiteRT解决了五项关键的ODML约束条件：延迟时间（无需
机器学习（1）安装Pytorch CoderIsArt 机器学习与深度学习机器学习 pytorch 人工智能
1.安装命令pip3installtorchtorchvisiontorchaudio--index-urlhttps://download.pytorch.org/whl/cu1182.安装过程Log：Lookinginindexes:https://download.pytorch.org/whl/cu118CollectingtorchDownloadinghttps://download.
《从编程小白到人工智能大神：大学新生Python入门攻略》千帆过尽. python 人工智能
前言在如今这个技术飞速发展的时代，编程已经成为许多大学生不可或缺的技能，尤其是对于人工智能方向的学生来说，编程更是必不可少的一部分。作为一名大三学生，并且专注于Python和人工智能方向，我深知刚开始学习编程时的挑战与迷茫。希望本文能帮助作为大学新生的你们在编程入门的过程中少走弯路，提供一条清晰有效的学习路径。一、编程语言选择作为编程新手，选择一门适合自己的编程语言至关重要。对于希望进入人工智能领
27岁大龄转码秋招惨败，朋友劝我转Java来得及吗？还是继续走前端或机器学习？程序员yt java 机器学习开发语言
今天给大家分享的是一位粉丝的提问，27岁大龄转码秋招惨败，朋友劝我转Java来得及吗？还是继续走前端或机器学习？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：211建筑本科，22年毕业后gap一年转码去了英国读的QS100的it的水硕（24年12月份毕业），转码后对就业形势认知不足，时间全花在课业上，八股文和算法准备的不充足，秋招算是惨败。读研
华为的云端训练算力与迭代效率 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
华为云、云端训练、算力、迭代效率、人工智能、深度学习、模型训练、分布式训练、优化算法1.背景介绍人工智能（AI）技术近年来发展迅速，深度学习作为其核心驱动力，在图像识别、自然语言处理、语音识别等领域取得了突破性进展。然而，深度学习模型的训练需要海量数据和强大的计算资源，这成为AI技术发展面临的瓶颈之一。云计算作为一种新型的计算模式，为深度学习提供了强大的算力支持。华为云作为国内领先的云计算平台，在
python panda下载_pandas python下载|Pandas for python v0.25.0官方版 v0.25.0官方版 - 哩咯下载站... weixin_39647458 python panda下载
Pandas是python的数据分析包，最初被作为金融数据分析工具而开发出来，提供pandas.whl包下载，有需要的赶快下载吧！软件介绍Pandas是python的一个数据分析包，最初由AQRCapitalManagement于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发team继续开发和维护，属于PyData项目的一部分。Pandas最初被
【核心算法篇七】《DeepSeek异常检测：孤立森林与AutoEncoder对比》再见孙悟空_ 「2025 DeepSeek技术全景实战」算法分布式 docker 计算机视觉人工智能自然语言处理 DeepSeek
大家好，今天我们来深入探讨一下《DeepSeek异常检测：孤立森林与AutoEncoder对比》这篇技术博客。我们将从核心内容、原理、应用场景等多个方面进行详细解析，力求让大家对这两种异常检测方法有一个全面而深入的理解。一、引言在数据科学和机器学习领域，异常检测（AnomalyDetection）是一个非常重要的任务。它的目标是从数据集中识别出那些与大多数数据显著不同的异常点。这些异常点可能是由于
吐血整理！模型热加载能力大比拼，谁才是真正王者？盼达思文体科创经验分享
吐血整理！模型热加载能力大比拼，谁才是真正王者？引言你是否在开发过程中，为了模型更新而频繁重启服务，浪费大量时间？又是否疑惑为什么有些模型加载速度快如闪电，而有些却慢得像蜗牛？今天就带你深入了解模型热加载能力的支持对比，让你不再为模型加载问题而烦恼！核心内容模型热加载概念科普场景化描述：想象一下，你正在运营一个基于机器学习模型的在线推荐系统。当你训练出了一个新的、性能更好的模型时，如果不能进行热加
【第四届网络安全、人工智能与数字经济国际学术会议（CSAIDE 2025】网络安全，人工智能，数字经济的研究禁默学术会议话题探讨 web安全人工智能安全数字经济学术论文
重要信息会议官网：www.csaide.net会议时间：2025年3月7-9日会议地点：马来西亚-马来西亚理工大学新山校区（线上+线下混合）简介过去几年，数字经济蓬勃发展，已成为全球经济增长的驱动力。然而，网络安全成为其最大的挑战。为了确保数字经济的可持续发展，人工智能被认为是至关重要的技术手段。第四届网络安全、人工智能与数字经济（CSAIDE2025）将于2025年3月7日至9日在马来西亚举行。
Python从0到100（四）：Python中的运算符介绍(补充) 是Dream呀 python java 数据库
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe