E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pandas数据清洗
Python Excel数据汇总
importosimport
pandas
aspdimportnumpyasnpdir="/home/human/下载/批量合并txt文件等3个文件/excel/excel/"#设置工作路径#新建列表,存放文件名
m0_52120975
·
2023-10-28 03:38
Python新手
excel
python
开发语言
如何用python汇总数据,python常用命令参考
python常用命令集合一、
pandas
常用命令1、重置indexlocation_data=location_data.reset_index(drop=True)2、根据指定列删除重复值data=result_data.drop_duplica
小狗AI
·
2023-10-28 03:38
人工智能
Python数据分析模块
学习笔记目录一、Numpy模块1.Numpy生成数组2.Numpy数组统计方法1.
Pandas
数据结构之Series2.
Pandas
数据结构之DataFrame三、其他模块1.Matplotlib/Seaborn
疯狂的张脑丸
·
2023-10-28 03:07
python
数据分析
开发语言
int.a的python学习笔记_人工智能-图表操作304
FacetGrid2、PairGrid3、heatmap热图1、FacetGridFacetGrid展示数据集的子集FacetGrid可以绘制出多达三个维度(row,col,和hue)的图形import
pandas
aspdimportmatplotlib.pyplotaspltimportnumpyasnpimportse
BeanInJ
·
2023-10-28 02:18
人工智能/机器学习
图表
python
机器学习-分类算法-模型选择与调优09
fromsklearn.neighborsimportKNeighborsClassifierfromsklearn.model_selectionimporttrain_test_split,GridSearchCVfromsklearn.preprocessingimportStandardScalerimport
pandas
asp
gemoumou
·
2023-10-28 02:58
数据分析+机器学习
算法
python
机器学习
深度学习
人工智能
机器学习之路:FaceBook预测案例分析----->KNN算法的应用与调优
小白的机器学习之路(二)引子学习机器学习基础:从理论到实践了解机器学习机器学习的定义机器学习的分类机器学习的基本原理掌握数据预处理
数据清洗
特征选择特征工程分类算法sklearn转换器和预估器KNN算法获取数据数据集划分特征工程
是一个Bug
·
2023-10-28 02:25
机器学习
算法
人工智能
清洗文本高频词、情感分析、情感分类、主题建模挖掘主题
import
pandas
aspdimportreimportnltkfromnltkimportFreqDistfromnltk.sentiment.vaderimportSentimentIntensityAnalyzerfromnltk.tokenizeimportword_tokenizeimportspacyfromspacy.lang.en.stop_wordsimportSTOP_WO
Wenliam
·
2023-10-28 02:52
分类
数据挖掘
人工智能
知识图谱开发笔记
应用:知识图谱的使用较为灵活,一方面,可以单独进行使用,作为数据的加工方,直接对接原始数据,从源头进行
数据清洗
和知识数据图谱关联呈现;另一方面,还可与其他系统进行对接,在有数据沉淀一方,进行实体抽离,在知识图谱端进行知识加工
马良神笔
·
2023-10-28 00:53
人工智能
AI
知识图谱
人工智能
【无标题】
具体步骤:一、读取数据集二、数据分析三、
数据清洗
四、特征工程五、模型训练与验证六、输出结果七、小结参考链接:https://datawhaler.feishu.cn/docx/C6jvdEwsSo3JMwxFj1
LucyFang2020
·
2023-10-28 00:49
python
开发语言
Python 实现中国地图可视化
3、下面是实现的代码import
pandas
aspdfrompyecharts.chartsimportMapfrompyechartsimporto
70亿分之一
·
2023-10-28 00:11
python
大数据
python
开发语言
Python绘制中国地图
1.导入库importcartopyimportnumpyasnpimport
pandas
aspdimportproplotasppltimportgeo
pandas
asgpdimportmatplotlib.pyplotaspltfromproplotimportrcimportcartopy.crsasccrsimportcartopy.featureascfeatureimportmatpl
Dr.hao2021
·
2023-10-28 00:40
python
开发语言
Pandas
- DataFrame 基本操作
上一节我们学习了Series结构的增删改查基本操作,本节掌握DataFrame的增删改查将变得非常轻松~首先,我们来构造一个DataFrame:data=[[1,2,3],[4,5,6],[7,8,9]]index=['a','b','c']columns=['A','B','C']df=pd.DataFrame(data=data,index=index,columns=columns)df查查
山药鱼儿
·
2023-10-27 22:24
单文档内容bert分词
import
pandas
aspdfromtransformersimportBertTokenizerimportre#加载BERT分词器tokenizer=BertTokenizer.from_pretrained
Wenliam
·
2023-10-27 21:34
bert
python
人工智能
散点图绘制
import
pandas
aspdfromsklearn.feature_extraction.textimportTfidfVectorizerfromsklearn.clusterimportKMeansfromsklearn.decompositionimportTruncatedSVDimportmatplotlib.pyplotasplt
Wenliam
·
2023-10-27 21:34
1024程序员节
【深度学习&NLP】数据预处理的详细说明(含
数据清洗
、分词、过滤停用词、实体识别、词性标注、向量化、划分数据集等详细的处理步骤以及一些常用的方法)
进行数据预处理的原因1、文本中含有不必要的信息和噪声2、数据可能不一致或者不太规范3、文本需要标记和分词4、可能需要词形还原和词干提取(词性标注)5、需要将文本向量化处理三、数据预处理方法介绍及使用样例1、
数据清洗
云日松
·
2023-10-27 21:03
深度学习
人工智能
NLP常用工具包实战 (3)NLTK工具包:英文数据分词、Text对象、停用词、词性标注、命名实体识别、
数据清洗
实例
NLTK非常实用的文本处理工具,主要用于英文数据,历史悠久~importnltk#nltk.download()#nltk.download('punkt')#nltk.download('stopwords')fromnltk.tokenizeimportword_tokenizefromnltk.textimportTextfromnltk.corpusimportstopwordsfromn
太阳不热
·
2023-10-27 21:32
nlp
自然语言处理
python
nltk
python去停用词用nltk_NLTK简单入门和
数据清洗
NLTK历史悠久的英文分词工具#导入分词模块fromnltk.tokenizeimportword_tokenizefromnltk.textimportTextinput='''Therewereasensitivityandabeautytoherthathavenothingtodowithlooks.Shewasonetobelistenedto,whosewordsweresoeasyt
weixin_39869733
·
2023-10-27 21:02
python去停用词用nltk
2.3.NLTK工具包安装、分词、Text对象、停用词、过滤掉停用词、词性标注、分块、命名实体识别、
数据清洗
实例、参考文章
2.3.NLTK工具包安装2.3.1.分词2.3.2.Text对象2.3.3.停用词2.3.4.过滤掉停用词2.3.5.词性标注2.3.6.分块2.3.7.命名实体识别2.3.8.
数据清洗
实例2.3.9
涂作权的博客
·
2023-10-27 21:31
#
NLP(学习笔记)
【python】TXT文本
数据清洗
和英文分词、词性标注
去除空行defclean_line(raw_file_name,save_file_name):withopen(raw_file_name,'r+')asf_r,open(save_file_name,'w+')asf_w:f_r_list=list(set(f_r.readlines()))forsentenceinf_r_list:ifsentence=="\n":f_r_list.remo
温酒的周同学
·
2023-10-27 21:59
Python
NLP
python
自然语言处理
数据清洗
词性标注
NLTK进行文本清洗并进行词性标注
import
pandas
aspdimportreimportnltkfromnltkimportword_tokenize,pos_tagfromnltk.corpusimportstopwords#下载
Wenliam
·
2023-10-27 21:24
python
38 深度学习(二):tensorflow基础介绍
基础介绍基础张量自定义损失函数自定义模型和激活函数图函数(略)自动求导机制自定义fittensorflow基础介绍基础张量importtensorflowastfimportnumpyasnpimport
pandas
aspd
Micoreal
·
2023-10-27 20:13
个人python流程学习
深度学习
tensorflow
人工智能
10 个 Python 自动探索性数据分析神库!
DTale
Pandas
-profilingswee
编程小饴
·
2023-10-27 20:27
python
数据分析
开发语言
人工智能
软件测试
数据挖掘
大数据
10个小技巧:快速用Python进行数据分析
Pandas
中数据框数据的Profiling过程Profiling(分析器)是一个帮助我们理解数据的过程,而Pa
编程小饴
·
2023-10-27 20:27
python
数据分析
开发语言
人工智能
大数据
自动化
数据挖掘
区间估计
(统计学中“区间估计”指的是,用来描述根据样本求得的值与总体真实值之间的误差)一、工具Python:
pandas
包:画图、数据分析比Java更有优势Java:Range类:生成一个区间范围,方便判断数据是否在区间内
miaoyibosysu
·
2023-10-27 18:46
统计学
算法
有效区间
柱状图
java
python三维直方图宽度_Python
Pandas
直方图宽度
在我的代码非常简单:import
pandas
aspdimportnumpyasnpfrom
pandas
.plottingimportscatter_matriximportmatplotlib.pyplotasplt
weixin_39934640
·
2023-10-27 18:05
python三维直方图宽度
机器学习之KNN学习曲线
实例判断约会匹配精准度1、并未进行标准化或者归一化import
pandas
aspdimportwarningswarnings.simplefilter("ignore")fromsklearn.neighborsimportKNeighborsClassifierfromsklearn.model_selectionimporttrain_test_splitfromsklearn.prepro
qq_38404903
·
2023-10-27 17:37
机器学习
人工智能
机器学习之KNN交叉验证实例
实例之数字识别importmatplotlib.pyplotaspltimportscipy.ndimageasndimageimport
pandas
aspdimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.model_selectionimportcross_val_scorefromsklea
qq_38404903
·
2023-10-27 17:37
机器学习
人工智能
Pandas
-读取、查看数据
读取数据读取csvdf=pd.read_csv('x.csv')读取压缩包importzipfilewithzipfile.ZipFile('x.csv.zip','r')asz:f=z.open('x.csv')df=pd.read_csv(f,header=0)保存为csvout_df.to_csv('predict_result.csv',encoding='utf-8',index=0,h
davidic
·
2023-10-27 16:44
招募令丨面向领域应用的 Python 编程教学,让和鲸社区成为您的扩展课堂
课程内容很简单——NumPy基础、
Pandas
基础、实践案例,因为教学目标并不在于编程本身,而在于引导学生掌握在真实的心理学研究中所常用的数据操作。大家都知道,目前社区内的活动与内容与气象
ModelWhale
·
2023-10-27 16:21
python
开发语言
ML basis
GetstartedwithyourEDAnowbyexploringthisvotingrecordsdatasetnumerically.Ithasbeenpre-loadedforyouintoaDataFramecalleddf.Use
pandas
Horus_eye
·
2023-10-27 12:06
解决
Pandas
读取大文本文件导致内存溢出的问题
问题描述当使用
pandas
读取大文本文件时,会由于内存不足产生MemoryError异常,可以设置分块读取的方式来解决。
chenglansky
·
2023-10-27 11:51
【32
Pandas
+Pyecharts | 剧荒了?用Python找找最近的热播好剧!】
文章目录️1.导入模块️2.
Pandas
数据处理2.1读取数据2.2查看数据信息2.3拆分影视剧标签列️3.Pyecharts数据可视化3.1各影视剧类型数量占比3.2各剧情类型数量占比3.3电视剧热度榜单
Python当打之年
·
2023-10-27 09:11
Pyecharts系列
Python可视化系列
Python爬虫
python
数据可视化
数据分析
机器学习(python)笔记整理
import
pandas
aspdimportnumpyasnp#创建DataFrame,包含缺失值df
小辉懂编程
·
2023-10-27 08:24
机器学习
笔记
Python的
Pandas
库(一)基础使用
Python开发实用教程
Pandas
是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。
spiritx
·
2023-10-27 08:58
python
pandas
开发语言
Python的
Pandas
库(二)进阶使用
Python开发实用教程DataFrame的运算DataFrame重载了运算符,支持许多的运算算术运算运算方法运算说明df.add(other)对应元素的加,如果是标量,就每个元素加上标量df.radd(other)等效于other+dfdf.sub(other)对应元素相减,如果是标量,就每个元素减去标量df.rsub(other)other-dfdf.mul(other)对应元素相乘,如果是标
spiritx
·
2023-10-27 08:24
python
pandas
大数据
Pyenv 管理多版本 Python
Pyenv管理多版本PythonXcode升级到12.3后,本地Python版本自动升级到3.8,原先用3.7写的脚本程序用到了
pandas
库和numpy现在都无法正常运行,如果能在Mac上进行能进行Python
不知道是哪个号
·
2023-10-27 07:58
Python内置函数enumerate操作可迭代对象及for迭代
import
pandas
aspdimportnumpyasnp#创建一个示例DataFrame
铁松溜达py
·
2023-10-27 07:53
python
开发语言
Pandas
DataFrame(数据帧)
Pandas
-DataFrame数据帧数据帧(DataFrame)是二维数据结构,即数据以行和列的表格方式排列。
68YearHer
·
2023-10-27 05:10
爬虫练习(一)爬取知网、万方、维普文献标题、作者、刊物来源等信息
用到了chromedriver、selenium、xlrd、
pandas
xinbingo
·
2023-10-27 05:03
Pythong-爬虫
python
selenium
定位
7.2 球类水平聚类分析 3D绘图
1.聚类分析2.聚类的基本使用2.1思路1.生成有2个特征,分布有3个中心的假数据2.用散点图展示3.训练预测并展示2.2实现2.2.1导包importnumpyasnpimport
pandas
aspdfrom
pandas
importSeries
蓝天下悠闲的云朵
·
2023-10-27 04:17
对dataframe类型 时序数据按时间(戳)先后顺序排序并作图
import
pandas
aspdimportnumpyasnpimportmatplotlib.pyplotaspltimportmatplotlib.datesasmdatesimport
pandas
aspddf
大力水手(Popeye)
·
2023-10-27 03:50
python
数据结构
一文看懂怎么用 Python 做数据分析
从1787页的
pandas
官网文档中总结出最常用的36个函数,通过这些函
MasterD56
·
2023-10-27 03:31
Python
爬虫
python
数据分析
数据挖掘
RHCE---正则表达式
文章目录前言一、
pandas
是什么?
北 染 星 辰
·
2023-10-27 03:56
RHCE
linux
运维
Pandas
& NumPy Simple Practice Usage
(Thisblogmerelyforself-reading,self-reviewandeveryprogramminglover'sshareundernocommercialcircumstance.)Recentlyafriendofminehasaskedmedesperatelyforhelping.Itwashishomework,whichhastobeaccomplishedby
00drdelius
·
2023-10-27 02:40
笔记
pandas
机器学习之数据预备、清洗与特征工程
、概念:二、为什么要进行预处理:1-1数据预处理简介为什么要进行预处理:数据预处理的功能:①数据集成(DataIntegration)详解:②数据变换(BataTrartsformstian)详解:③
数据清洗
平原2018
·
2023-10-27 02:28
机器学习
数据清洗
数据清洗
与规范化详解
数据处理流程,也称数据处理管道,是将原始数据转化为有意义的信息和知识的一系列操作步骤。它包括数据采集、清洗、转换、分析和可视化等环节,旨在提供有用的见解和决策支持。在数据可视化中数据处理是可视化展示前非常重要的一步,本文就简单介绍一下数据处理流程:1.数据采集:首先,需要获取数据,这可以是来自各种来源的原始数据,如传感器、数据库、日志文件、社交媒体等。数据采集可能需要数据抓取、API调用、文件上传
枝上棉蛮
·
2023-10-27 02:52
数据可视化
教程
信息可视化
数据分析
数据挖掘
大数据
记本地开发环境连接oracle查询过慢问题
__name__=='__main__':fromsqlalchemy.engineimportcreate_enginefromsqlalchemy.poolimportNullPoolimport
pandas
aspdimporttimeimportdatetimedb_url
Jalen备忘录
·
2023-10-27 02:18
Database
数据库开发
oracle
数据库
【AI使用场景】50个在工作流中的运用场景示例
数据清洗
和预处理:使用机器学习算法和数据挖掘技术,自动清洗和预处
Bankcary
·
2023-10-26 23:54
人工智能
KNN-水仙花的分类
4、训练模型5、预测模型6、计算分类精度7、使用网格搜索法8、训练模型9、可视化结果:大致就是这样,代码如下:#加载数据集importnumpyasnpimport
pandas
aspdfrommatplotlibimportpyp
吉吉王后King
·
2023-10-26 23:17
题解
1024程序员节
安装
pandas
报错Consider using the `--user` option or check the permissions
安装
pandas
报错Considerusingthe--useroptionorcheckthepermissions解决方案pipinstall--user
pandas
一只蹦跶的小蹦跶
·
2023-10-26 21:15
动手学深度学习
python
深度学习
pandas
上一页
69
70
71
72
73
74
75
76
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他