杨核桃Alvin

python/pandas数据分析（十三）-数据清理、转换、合并，重塑

合并数据结构

pandas.merge 根据一个或多个键将不同DataFrame中的行连接起来。

pandas.concat 沿着一条轴将多个对象堆叠起来

具体可以参考之前专门讲数据合并的章节

索引上的合并

有时，DF中的链接键位于其索引中。left_index=True or right_index=True(or 两个都传入)以说明索引应该被用作链接键

left1=pd.DataFrame({'key':list('abaabc'),'value':range(6)})
right1=pd.DataFrame({'group_val':[3.5,7]},index=['a','b'])
left1
right1

pd.merge(left1,right1,left_on='key',right_index=True)

对于层次化索引也适用

righth=pd.DataFrame(np.arange(12).reshape((6,2)),
                  index=[['Nevada','Nevada','Ohio','Ohio','Ohio','Ohio'],
                  [2001,2000,2000,2000,2001,2002]],
                  columns=['event1','event2'])
righth

lefth=pd.DataFrame({'key1':['Ohio','Ohio','Ohio','Nevada','Nevada'],
                   'key2':[2000,2001,2002,2001,2002],
                  'data':np.arange(5.)})
lefth

pd.merge(lefth,righth,left_on=['key1','key2'],right_index=True)

DataFrame 还有一个更方便的join方法用于实现按索引进行合并，具体可以参考之前写的文章

轴向连接

concat axis=1 列

合并重叠数据

np.where 实现一种矢量化的if-else

np.where(pd.isnull(a),b,a)

重塑(reshape)与轴向转换（pivot）

stack 将数据的列旋转为行
unstack ：将数据的行旋转为列

ldata=pd.DataFrame(np.arange(12).reshape((4,3)),
                  columns=['date','item','value'])
ldata

pivoted=ldata.pivot('date','item','value')
pivoted

date, item 连个参数分别用作行和列索引的列名，最后一个参数值则用于填充DF.

增加一列：

ldata['value2']=np.random.randn(len(ldata))
ldata

如果不带最后一个参数则生成一个带有层次化的列

用set_index 创建层次化的索引

unstacked=ldata.set_index(['date','item'])
unstacked

unstacked.unstack('item')

就变成了povit

移除重复数据

DataFrame中常常出现重复行，如

data1=pd.DataFrame({'k1':['one']*3+['two']*4,
                   'k2':[1,1,2,3,3,4,4]})
data1!

DataFrame的duplicated方法返回一个布尔型的Series，表示各行是否是重复行

data1.duplicated()

0    False
1     True
2    False
3    False
4     True
5    False
6     True
dtype: bool

drop_duplicates方法返回一个移除了重复行的DataFrame

data1.drop_duplicates()

假设你只想过滤还多了一列v1，想过滤这一列的重复项

data1['v1']=range(7)
data1.drop_duplicates(['k1'])

默认保留第一个出现的组合

Map

data3=pd.DataFrame({'food':['bacon','beef','honey ham'],
                   'ounces': [3,2,1]})
data3

meat_to_animal={
    'bacon':'pig',
    'beef': 'cow',
    'honey ham':'cow'
}

data3['animal']=data3['food'].map(str.lower).map(meat_to_animal)
data3

Series的map方法可以接受一个函数或者含有映射关系的字典型对象

替换值

fillna
map
一次替换一个值

data.replace(-999,np.nan)

一次替换多个值

data.replace([-999,-1000], np.nan)

对不同的值进行不同的替换

data.replace([-999,-1000],[np.nan,0])

传入参数也可以是字典

data.replace({-999:np.nan, -1000:0})

重命名

data.rename(index=str.title,columns=str.upper)

离散化与面元划分

ages=[20,21,22,24,27,21,23,37,31,64,45,41,32]
bins=[18,25,35,60,100]
cats=pd.cut(ages,bins)
cats


[(18, 25], (18, 25], (18, 25], (18, 25], (25, 35], ..., (25, 35], (60, 100], (35, 60], (35, 60], (25, 35]]
Length: 13
Categories (4, object): [(18, 25] < (25, 35] < (35, 60] < (60, 100]]

pandas 返回一个特殊的categorical对象，将其看做一组表示面元名称的字符串。实际上，他含有一个表示不同分类名称的levels数组以及一个座位年龄数据进行标号的labels属性

cats.codes

array([0, 0, 0, 0, 1, 0, 0, 2, 1, 3, 2, 2, 1], dtype=int8)

cats.categories
Index(['(18, 25]', '(25, 35]', '(35, 60]', '(60, 100]'], dtype='object')


pd.value_counts(cats)
(18, 25]     6
(35, 60]     3
(25, 35]     3
(60, 100]    1
dtype: int64

qcut 可以按照样本分位数对数据进行面元分隔。

data5=np.random.randn(1000)# 正态分布
cats=pd.qcut(data,4) #按照4分位进行切割

检测或者过滤异常值

seed( ) 用于指定随机数生成时所用算法开始的整数值，如果使用相同的seed( )值，则每次生成的随即数都相同，如果不设置这个值，则系统根据时间来自己选择这个值，此时每次生成的随机数因时间差异而不同。

np.random.seed(12345)
data4=pd.DataFrame(np.random.randn(1000,4))
data4.describe()

col=data4[3]
col[np.abs(col)>3]

97     3.927528
305   -3.399312
400   -3.745356
Name: 3, dtype: float64

选出绝对值超过3的行

data4[(np.abs(data4)> 3).any(1)]

你可能感兴趣的:(数据分析与挖掘)

从零开始学python数据分析-从零开始学Python数据分析与挖掘 PDF 扫描版 weixin_37988176
给大家带来的一篇关于数据挖掘相关的电子书资源，介绍了关于Python、数据分析、数据挖掘方面的内容，本书是由清华大学出版社出版，格式为PDF，资源大小67.8MB，刘顺祥编写，目前豆瓣、亚马逊、当当、京东等电子书综合评分为：7.5。内容介绍从零开始学Python数据分析与挖掘本书以Python3版本作为数据分析与挖掘实战的应用工具，从Pyhton的基础语法开始，陆续介绍有关数值计算的Numpy、数
商业分析能力是怎样炼成的？ R3eE9y2OeFcU40
感谢关注天善智能，走好数据之路↑↑↑欢迎关注天善智能，我们是专注于商业智能BI，人工智能AI，大数据分析与挖掘领域的垂直社区，学习，问答、求职一站式搞定！对商业智能BI、大数据分析挖掘、机器学习，python，R等数据领域感兴趣的同学加微信：tstoutiao，邀请你进入数据爱好者交流群，数据爱好者们都在这儿。作者：接地气的陈老师链接：https://www.zhihu.com/question/
阿里云服务器内存型r7、r8a、r8y实例区别参考阿里云最新优惠和活动汇总
在阿里云目前的活动中，属于内存型实例规格的云服务器有内存型r7、内存型r8a、内存型r8y这几个实例规格，相比于活动内的经济型e、通用算力型u1实例来说，这些实例规格等性能更强，与计算型和通用型相比，它的内存更大，因此这些内存型实例规格主要适用于数据库、中间件和数据分析与挖掘，Hadoop、Spark集群等场景，本文为大家介绍内存型r7、r8a、r8y实例区别及最新活动价格，以供参考。2核16G可
python金融数据分析与挖掘实战黄恒秋_金融数据分析与挖掘——股票时间序列数据处理... weixin_39849930 黄恒秋
1、什么是时间序列分析时间序列分析(timeseriesanalysis)方法,强调的是通过对一个区域进行一定时间段内的连续观察计算，提取相关特征，并分析其变化过程。时间序列分析主要有确定性变化分析和随机性变化分析确定性变化分析：移动平均法，移动方差和标准差、移动相关系数随机性变化分析：AR、ARMA模型2、移动平均法2.1移动窗口主要用在时间序列的数组变换，不同作用的函数将它们统称为移动窗口函数
阿里云服务器内存型r7、r8a、r8y实例区别及最新活动价格参考阿里云最新优惠和活动汇总
在阿里云目前的活动中，属于内存型实例规格的云服务器有内存型r7、内存型r8a、内存型r8y这几个实例规格，相比于活动内的经济型e和通用算力型u1等实例规格来说，这些实例规格等性能更强，适用于数据分析与挖掘，Hadoop、Spark集群、数据库、中间件、大数据等场景。本文为大家介绍内存型r7、r8a、r8y实例区别及最新活动价格，以供参考。一、内存型实例规格族r7性能介绍1、r7的内存型、存储、网络
numpy和matplotlib小例子 Roy Teng numpy matplotlib
最近准备学《Python数据分析与挖掘实战》这本书，刚看到第二章numpy和matplotlib这一部分，发现这个图挺有意思的，就做个笔记记录一下，日后发现有意思的继续更。importnumpyasnpimportmatplotlib.pyplotaspltx=np.linspace(0,10,1000)y=np.sin(x)+1z=np.cos(x**2)+1plt.figure(figsize
Python3数据分析与挖掘建模（7）使用matplotlib和seaborn画图鮀城小帅 python 数据分析 matplotlib python 柱状图饼图
1.可视化分析1.1概述可视化分析是数据分析中重要的一环，它可以帮助我们更直观地理解数据的特征、趋势和关系。在Python中，有多个库可以用于数据可视化，包括matplotlib、seaborn和plotly等。1.2常用的可视化方法和对应的库：（1）折线图和曲线图：用于显示数据随时间或其他连续变量的变化趋势。可以使用matplotlib和seaborn来创建这些图形。（2）柱状图和条形图：用于比
面试算法LeetCode刷题班—BAT面试官带你刷真题、过笔试 Dan Boneh 高级程序设计算法
课程名称:《面试算法LeetCode刷题班》——BAT面试官带你刷真题、过笔试主讲老师:林老师BAT资深研发工程师(T7/P8级)，致力于搜索引擎及其子系统的研发、迭代与优化，数据分析与挖掘领域专家，多年担任校园招聘、社会招聘面试官，丰富的面试候选人经验。课程简介:掌握算法与数据结构是成为优秀程序员的必经之路，众多国内外知名互联网企业都将算法面试作为程序员招聘的重要和必需途径，只有高效应对各类题目
python财政收入预测分析_python 数据分析-- 实战1（收入预测分析） weixin_39572152 python财政收入预测分析
说明：本文用途只做学习记录：参考书籍：从零开始学Python数据分析与挖掘／刘顺祥著．—北京：清华大学出版社，2018首先看一下刘老师介绍的数据分析和数据挖掘的区别：1.预览数据集，明确分析目的通过Excel工具打开income文件，可发现该数据集一共有32561条样本数据，共有15个数据变量，其中9个离散型变量，6个数值型变量。数据项主要包括：年龄，工作类型，受教育程度，收入等，具体可见下面两个
阿里云服务器2核16G、4核32G、8核64G配置最新收费标准及活动价格阿里云最新优惠和活动汇总
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8，这种配比的云服务器一般适用于数据分析与挖掘，Hadoop、Spark集群和数据库，缓存等内存密集型场景，因此，多为企业级用户选择，目前用户购买2核16G配置活动价格最低为2439.24元/1年起，购买4核32G配置活动价格最低为4499.88元/1年起，购买8核64G配置活动价格最低为8621.16元/1年起，本文介绍这些配置
《Python数据分析与挖掘实战》第12章——电子商务网站用户行为分析及服务推荐（协同推荐）数据探索分析篇①1 背景与目标分析2.数据探索分析 marraybug python
文章目录1背景与目标分析2.数据探索分析2.1网页类型分析2.1.1统计各个网页类型所占的比例2.1.2网页107类型中的内部统计2.1.3统计带"?"问号网址类型统计2.1.4统计199类型中的具体类型占比2.1.5统计瞎逛用户中各个类型占比2.2点击次数分析2.2.1统计点击次数2.2.2点击次数与用户数量关系2.2.3统计1~7次数及7次以上的点击数2.2.4浏览一次的用户行为分析2.3网页
阿里云服务器2024年2核16G、4核32G、8核64G配置最新收费标准及活动价格 qq_3304559116 阿里云阿里云服务器云计算
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8，这种配比的云服务器一般适用于数据分析与挖掘，Hadoop、Spark集群和数据库，缓存等内存密集型场景，因此，多为企业级用户选择，目前用户购买2核16G配置活动价格最低为1473.41元/1年起，购买4核32G配置活动价格最低为2896.42元/1年起，购买8核64G配置活动价格最低为5742.43元/1年起，本文介绍这些配置
并行化K-means聚类算法的实现与分析 OverlordDuke 聚类算法算法 kmeans 聚类并行聚类算法
并行化K-means聚类算法并行化K-means聚类算法的实现与分析项目背景与意义算法原理与串行实现分析并行化策略与关键细节实验结果与讨论未来改进方向结语并行化K-means聚类算法的实现与分析在大数据时代，对数据进行高效的聚类是数据分析与挖掘的重要工具之一。本文将介绍并讨论使用OpenMP在C++中实现的并行化K-means聚类算法。我们将深入探讨算法的原理、并行化策略以及实验结果，以期为相关领
从零开始学python第二版_从零开始学Python数据分析与挖掘-从零开始学Python数据分析与挖掘第二版pdf下载电子版-精品下载... weixin_39874366 从零开始学python第二版
从零开始学Python数据分析与挖掘第二版以Python3.7版本作为数据分析与挖掘实战的应用工具，从Python的基础语法开始，陆续介绍有关数值计算的numpy、数据处理的pandas、数据可视化的matplotlib和数据挖掘的sklearn等内容编辑推荐"为满足用人单位对数据分析和挖掘人员在编程方面的技能要求，本书遵循由浅入深的原则，详细地介绍了利用Python及其相关工具实现数据分析和挖掘
【毕设选题指导】2024 数据分析与挖掘方向毕业设计选题推荐 Mini_hailang_IT 毕设选题指导人工智能毕业设计算法数据挖掘数据分析毕设
目录前言数据挖掘方向选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。对毕设有任何疑问都可以问学
【大数据分析与挖掘技术】概述 Francek Chen 大数据技术基础数据分析数据挖掘 Mahout
目录一、数据挖掘简介（一）数据挖掘对象（二）数据挖掘流程（三）数据挖掘的分析方法（四）经典算法二、Mahout（一）Mahout简介（二）主要特性（三）Mahout安装与配置一、数据挖掘简介需要是发明之母。近年来，数据挖掘引起了信息产业界的极大关注，其主要原因是存在大量数据，可以广泛使用，并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用，包括商务管理，生产控制，市
【大数据分析与挖掘技术】Mahout推荐算法 Francek Chen 大数据技术基础数据分析人工智能数据挖掘 Mahout
目录一、推荐的定义与评估（一）推荐的定义（二）推荐的评估二、Mahout中的常见推荐算法（一）基于用户的推荐算法（二）基于物品的推荐算法（三）基于SVD的推荐算法（四）基于线性插值的推荐算法（五）基于聚类的推荐算法三、对GroupLens数据集进行推荐与评价（一）如何使用推荐器进行推荐（二）如何评估推荐器的好坏推荐是Mahout机器学习算法的主题之一，它极大地渗透到了人们日常生活的方方面面，比如，
数据中台概念大数据驱动 #8数据中台-S级信息可视化大数据
数据中台1.数据中台模块数据采集数据存储数据处理数据分析数据应用2.数据中台的核心功能数据采集与集成数据清洗与预处理数据建模与存储数据分析与挖掘数据可视化与报告数据质量管理数据安全与隐私保护数据共享与开放3.如何建立数据中台确定业务需求收集数据源数据清洗和预处理数据建模和存储数据分析和挖掘数据可视化和报告数据质量管理数据安全和隐私保护数据共享和开放持续优化和升级4.数据中台的优点5.数据中台的缺点
1688商品数据API接口的数据分析与挖掘技巧爱吃猫的菜菜 api接口数据分析 java 数据库安全大数据
随着电子商务的发展，越来越多的商家开始将业务拓展到线上。而1688作为中国最大的B2B电商平台之一，其商品数量和交易额均居于世界前列。因此，对于商家来说，了解商品的实时信息非常重要，可以帮助他们更好地管理商品、制定营销策略等。本文将介绍如何使用API接口来获取1688商品详情。一、API简介1688提供了丰富的API接口，用于获取商品数据、交易数据、用户数据等。其中，商品详情API是常用的接口之一
Python环境下基于自适应滤波器的音频信号（wav格式）降噪方法哥廷根数学学派 python 开发语言
Python的集成环境我一般使用的是Winpython，Winpytho脱胎于pythonxy，面向科学计算，兼顾数据分析与挖掘；Anaconda主要面向数据分析与挖掘方面，在大数据处理方面有自己特色的一些包；Winpytho强调便携性，被做成绿色软件，不写入注册表，安装其实就是解压到某个文件夹，移动文件夹甚至放到U盘里在其他电脑上也能用。抛开软件包的差异，我个人也推荐初学者用winpython，
数据分析与挖掘简介数据蜗牛
20世纪40年代第一台数字计算机出现到90年代中期之前，信息化建设可归为以单机应用为主要特征的数字化阶段（可称为信息化1.0），而第一次的信息化浪潮，始自20世纪80年代个人计算机的大规模普及应用。从90年代中期开始，以美国提出“信息高速公路”建设计划为重要标志，互联网开始了其大规模商用进程，带来了信息化建设的第二次浪潮，即以联网应用为主要特征的网络化阶段（可称为信息化2.0）。当前，信息化建设的
电商API接口的大数据分析与挖掘技巧爱吃猫的菜菜 api接口数据分析信息可视化数据挖掘大数据数据库
随着电商行业的快速发展，电商平台上的交易数据量也越来越大。如何对这些数据进行分析和挖掘，从中获取有价值的信息，已经成为电商企业和开发者关注的重点。本文将介绍电商API接口的大数据分析与挖掘技巧。一、数据采集1.确定分析目标：在进行大数据分析之前，需要明确分析的目标和问题，以便针对性地采集数据。2.选择数据源：根据分析目标，选择合适的数据源。电商平台提供的API接口是获取数据的重要途径，可以通过调用
大数据分析与挖掘-期末复习大纲[HBU] 洛杉矶县牛肉板面 AI学习数据分析数据挖掘
前言这篇博客针对河北大学大数据分析与挖掘课程期末复习，目的是给同学们一个比较清晰的复习方向，具体的学习还需要平时认真听讲、写作业。我们使用的教材是这本：练习题目我只更新了部分答案，至于剩下的答案老师上课的时候会带着讲解的。在这里我只是为同学们提供一个复习纲要和复习方向。希望大家能快速抓到考试重点，不在其他方向上浪费精力。选择题答案：1.C2.D判断题答案：1.X2.√3.X4.X(若答案有误，请及
Pytorch环境下基于Transformer的滚动轴承故障诊断哥廷根数学学派 pytorch python 人工智能
关于python的集成环境，我一般Anaconda和winpython都用，windows下主要用Winpython，IDE为spyder（类MATLAB界面）。winpython脱胎于pythonxy，面向科学计算，兼顾数据分析与挖掘；Anaconda主要面向数据分析与挖掘方面，在大数据处理方面有自己特色的一些包；winpython强调便携性，被做成绿色软件，不写入注册表，安装其实就是解压到某个
Python+MySQL+PowerBI 抖音用户浏览行为数据分析与挖掘材哥儿 mysql python 数据库数据分析 powerbi 数据挖掘
项目概述：抖音作为当下最火热的短视频软件，探索其产生的数据可以得到极高的价值。本项目模拟从将csv文件导入python工具进行数据分析并对用户点赞预测建模分析，且将python处理后的数据存储到MySQL数据库中，最后用可视化工具输出分析结果，最终可以更好地进行内容优化、产品运营。数据具体字段信息：字段字段说明字段字段说明uid用户idlike是否点赞user_city用户城市music_id音乐
python数据分析与挖掘论文_《Python数据分析与机器学习实战-唐宇迪》读书笔记第10章-特征工程... weixin_39616477 python数据分析与挖掘论文
第10章特征工程特征工程是整个机器学习中非常重要的一部分，如何对数据进行特征提取对最终结果的影响非常大。在建模过程中，一般会优先考虑算法和参数，但是数据特征才决定了整体结果的上限，而算法和参数只决定了如何逼近这个上限。特征工程其实就是要从原始数据中找到最有价值的信息，并转换成计算机所能读懂的形式。本章结合数值数据与文本数据来分别阐述如何进行数值特征与文本特征的提取。10.1数值特征实际数据中，最常
数据分析与挖掘入门——学习笔记（八）Pandas基本操作、运算、画图和IO操作无敌的白金之星数据分析与挖掘
一、基本操作为了更好的理解这些基本操作，我们将读取一个真实的股票数据。关于文件操作，后面在介绍，这里只先用一下API#读取文件data=pd.read_csv("./stock_day/stock_day.csv")#删除一些列，让数据更简单些，再去做后面的操作data=data.drop(["ma5","ma10","ma20","v_ma5","v_ma10","v_ma20"],axis=1
基于协同过滤算法的人才资源大数据分析与挖掘平台毕设源码 sj52abcd 算法数据分析课程设计
博主介绍：✌专注于VUE,小程序，安卓，Java,python,物联网专业，有16年开发经验，长年从事毕业指导，项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题，我会尽力帮助你。目录开发背景：国外研究现状分析：国内研究现状分析：社会可行性：功能：数据库表设计：K-means算法实现：代码实现：开发背景：随着人才市场的不断扩大和竞争的加剧，如何更好地利用大数据技术，实现人才资源
【基于Python的信用卡客户历史数据分析与挖掘】爱欲无极机器学习数据分析与挖掘数据可视化 python 数据分析开发语言
基于Python的信用卡客户历史数据分析与挖掘前言技术栈数据获取与预处理描述性分析建立预测模型模型评估与结果展示Web应用搭建结语前言随着金融科技的迅猛发展，信用卡客户的历史数据分析变得越来越重要。本文将介绍如何使用Python、Sklearn和Flask对公开数据集进行信用卡客户违约预测分类模型的建立与分析。我们将运用SVM算法、决策树算法、KNN算法以及随机森林算法，通过ROC曲线、混淆矩阵等
【当当网图书数据分析与挖掘】爱欲无极数据分析与挖掘数据分析数据挖掘 python 爬虫聚类
包含内容：文档+源代码+爬虫数据+爬虫代码+当当网图书数据分析与挖掘演示视频数据集技术栈数据分析维度摘要创新点文档截图私聊我吧演示视频演示-当当网图书分析挖掘数据集爬取当当网的图书销售数据技术栈Flask：用于构建Web应用程序。MySQL：用于存储和管理爬取到的图书数据。Echarts：用于可视化数据分析结果。数据分析维度在数据的分析部分，主要分为四个维度，分别是类型、出版社、作者、出版时间，分
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他