胡子哥_

【ML】主成分分析 PCA（Principal Component Analysis）原理 + 实践（基于sklearn）

【ML】主成分分析 PCA（Principal Component Analysis）原理 + 实践（基于sklearn）

原理简介
实践
- 数据集
- 数据处理
- 使用KNN模型进行分类预测（为了和PCA处理后做对比）
- 数据归一化
- 保持与原始数据维度数，观察维度方差占比
- 计算两个维度的PCA
- 再次用KNN计算PCA获取的新维度的准确度
总结

原理简介

PCA（Principal Component Analysis）主成分分析，顾名思义，找出一组更低维度的特征，可以代表原始特征（精度会些许降低，但计算速度会大大加快）【主要目的是降维】。注意：不是筛选出原始维度的某几个维度，新的特征维度不是之前的特征维度，而是计算出来的新的特征数据。

详细推导可以参考这篇文章：https://www.jianshu.com/p/73080c9de848

实践

数据集

鸢尾花数据集：https://www.kaggle.com/datasets/himanshunakrani/iris-dataset

数据处理

import numpy as np
import pandas as pd

# 数据处理
origin_data = pd.read_csv("/kaggle/input/iris-dataset/iris.csv")
origin_data.loc[:,'species'].value_counts()
data = origin_data.replace({'species':{'setosa':1,'versicolor':2,'virginica':3}})

X = data.drop(columns=['species'])
y = data.loc[:,'species']

使用KNN模型进行分类预测（为了和PCA处理后做对比）

# 使用knn模型进行
from sklearn.neighbors import KNeighborsClassifier
# 周围3个点作为判断条件
KNN = KNeighborsClassifier(n_neighbors=3)
KNN.fit(X,y)
y_predict = KNN.predict(X)
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y,y_predict)
print(accuracy)

输出：0.96

数据归一化

至于为什么要归一化：

是为了加快计算速度
因为需要距离计算，归一化后将各个维度量纲拍平

# 归一化
from sklearn.preprocessing import StandardScaler
X_norm = StandardScaler().fit_transform(X)
print(type(X_norm)) # 

# 验证归一化后整体图形不变
from matplotlib import pyplot as plt
fig1 = plt.figure(figsize=(10,5))
plt.subplot(121)
plt.hist(X.loc[:,'sepal_length'], bins=100)

plt.subplot(122)
plt.hist(X_norm[:,0], bins=100)
plt.show()

#归一化后 均值=0，标准差=1
print(X_norm[:,0].mean(), X_norm[:,0].std()) #-4.736951571734001e-16 1.0

归一化后，图像的形状不变

保持与原始数据维度数，观察维度方差占比

方差越小，说明数据变化越小，对结果的影响就越小

# 查看各个维度的方差
from sklearn.decomposition import PCA
# 四个维度都计算
pca = PCA(n_components=4)
x_pca = pca.fit_transform(X_norm)
print(pca.explained_variance_ratio_)

# 绘图更直观
fig2 = plt.figure(figsize=(10,5))
plt.bar([1,2,3,4],pca.explained_variance_ratio_)
# 注意已经不是原始的特征了，所以用PC1,2,3,4代替
plt.xticks([1,2,3,4],['PC1','PC2','PC3','PC4'])
plt.ylabel('pca variance ratio')
plt.show()

显然，有两个维度对结果影响很大，所以我们取两个维度作为特征维度。

计算两个维度的PCA

# 训练两个纬度的pca
pca_2 = PCA(n_components=2)
x_pca_2 = pca.fit_transform(X_norm)
print(type(x_pca_2))

# 可视化两个维度
fig3 = plt.figure(figsize=(5,5))
setosa = plt.scatter(x_pca_2[:,0][y==1],x_pca_2[:,1][y==1])
versicolor = plt.scatter(x_pca_2[:,0][y==2],x_pca_2[:,1][y==2])
virginica = plt.scatter(x_pca_2[:,0][y==3],x_pca_2[:,1][y==3])
plt.legend((setosa,versicolor,virginica),('setosa','versicolor','virginica'))
plt.show()

再次用KNN计算PCA获取的新维度的准确度

# 再次训练，对比准确度变化
KNN_norm = KNeighborsClassifier(n_neighbors=3)
KNN_norm.fit(x_pca_2,y)
y_predict_norm = KNN_norm.predict(x_pca_2)
accuracy_norm = accuracy_score(y,y_predict_norm)
print(accuracy_norm)

输出：0.9533333333333334

总结

使用4个维度的准确率为：96%，使用PCA后的准确率是：95.3%，相差很小

你可能感兴趣的:(机器学习,算法,python,sklearn,python)

Python中的enumerate函数详解程序员一点 python python enumerate
在Python编程中，我们经常需要在循环遍历一个序列时同时获取元素的索引和值。为了实现这一需求，Python提供了一个内置的enumerate函数，它能够方便地为我们提供序列中每个元素的索引和值。enumerate函数enumerate函数接受两个参数：一个可迭代对象和一个可选的起始索引值。语法enumerate(iterable,start=0)iterable：一个可迭代的对象，如列表、元组等
Github 2024-06-05 开源项目日报 Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-06-05统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目7JupyterNotebook项目2Rust项目1初学者的生成式人工智能（第2版）创建周期：259天开发语言：JupyterNotebook协议类型：MITLicenseStar数量：25764个Fork数量：16105次关注人数：
自然语言处理（NLP）入门：基础概念与应用场景 Ash Butterfield nlp 自然语言处理人工智能
什么是自然语言处理（NLP）？自然语言处理（NaturalLanguageProcessing,NLP）是人工智能（AI）的一个重要分支，研究如何让计算机理解、生成、分析和与人类语言进行交互。换句话说，NLP是让机器像人一样“读、写、听、说”的技术，它结合了语言学、机器学习、计算机科学等多学科知识。NLP的核心目标是将非结构化的自然语言（如文本和语音）转化为结构化数据，使机器能够高效处理、分析和生
机器学习算法工程师笔试选择题（1） Ash Butterfield 机器学习算法人工智能
1.关于梯度下降的说法正确的是：A.梯度下降法可以确保找到全局最优解。B.随机梯度下降每次使用所有数据来更新参数。C.批量梯度下降（BatchGradientDescent）通常收敛更快。D.学习率过大会导致梯度下降过程震荡。答案：D（学习率过大会导致不稳定，可能震荡或无法收敛）2.在以下算法中，哪种算法属于无监督学习？A.逻辑回归B.K-近邻算法C.支持向量机D.K-均值聚类答案：D（K-均值聚
YOLO各版本原理和优缺点解析 Ash Butterfield 计算机视觉
YOLO（YouOnlyLookOnce）是一种实时目标检测算法，以其高速度和较高精度著称。以下是各版本的详细介绍及优缺点分析：1.YOLOv1（2016年）原理：将输入图像划分为S×SS\timesSS×S的网格，每个网格预测多个边界框和类别置信度。使用单个神经网络直接对图像进行前向传播预测边界框和类别标签。优点：速度快，适合实时应用。模型结构简单，易于实现和训练。缺点：对小目标检测效果差，容易
Python 适合大型软件项目(不是基于 Web 的)吗? 潮易 python 开发语言
Python适合大型软件项目(不是基于Web的)吗?Python非常适合于大型软件项目的开发，尤其是那些不依赖于Web技术的项目。以下是一些关于如何在Python中开发大型软件项目的建议：1.设计明确的架构：在编写代码之前，你需要明确你的软件系统的架构。你应该考虑模块化的设计，以便更容易地扩展和维护。2.使用合适的数据结构和算法：根据你的需求，选择合适的数据结构或算法可以提高你的程序的性能。3.测
国产化板卡设计原理图：2288-基于FMC接口的JFM7K325T PCIeX4 3U VPX接口卡 hexiaoyan827 3U VPX FMC子卡 JFM7K325T板卡软件无线电处理平台数据采集IO卡
基于FMC接口的JFM7K325TPCIeX43UVPX接口卡一、板卡概述标准VPX3U板卡，基于JFM7K325T芯片，pin_to_pin兼容FPGAXC7K410T-2FFG900，支持PCIeX8、64bitDDR3容量2GByte，HPC的FMC连接器，板卡支持各种接口输入，软件支持windows，Linux驱动。可应用于高性能计算，频域算法，如与FFT的加速等；配合AD，DAFMC子卡
多模态大模型（LMMs）与大语言模型（LLMs）的比较大F的智能小课底层技术解析人工智能语言模型
前言现在的大模型分为两大类：大语言模型（LargeLanguageModels，简称LLMs）和多模态大模型（LargeMultimodalModels，简称LMMs）。本文将从基础定义、输入数据、应用场景、训练过程这几方面讨论下两者的区别。基础定义LLMs(LargeLanguageModels,大型语言模型)-深度学习的应用之一，是基于深度学习的大规模机器学习模型，通常由数十亿到数万亿个参数构
人工智能之推荐系统实战系列(协同过滤,矩阵分解,FM与DeepFM算法) weixin_58351028 人工智能深度学习神经网络算法机器学习
一.推荐系统介绍和应用(1)推荐系统通俗解读推荐系统就是来了就别想走了。例如在大数据时代中京东越买越想买，抖音越刷越是自己喜欢的东西，微博越刷越过瘾。(2).推荐系统发展简介1)推荐系统无处不在，它是根据用户的行为决定推荐的内容。用户每天在互联网中都会留下足迹，这样就会越来越多的用户画像。2)为什么要推荐系统卖的好的商品就那几种，其它就不管了吗？答案是否定的。80%的销售来自20%的热门商品，要想
手把手教你给 windows装个vmware虚拟机 python算法小白
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
appium环境搭建 weixin_43516809 appium appuim
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言记录手机自动化环境搭建学习过程一、jdk安装配置（省略）二、AndroidSDK安装配置三、python环境安装配置四、pycharm开发工具安装五、安装node.js六、appium安装1.安装2.检查appium环境是否搭建成功七、appium工作原理总结前言记录手机自动化环境搭建学习过程一、jdk安装配置（省略）cm
VS Code 通知中一直显示“Reactivating terminals...”的问题解决随猿Fa IDE python ide vscode
VSCode通知中一直显示“Reactivatingterminals...”的问题解决问题截图解决方案修复截图相关链接问题截图解决方案点击顶部放大镜()->输入尖括号(>)->然后搜索(Python:ClearWorkspaceInterpreterSetting)->最后点击即可修复截图之后就没有这个烦人的通知啦!相关链接GitHubissueofvscode-pythonforReactiv
【语义分割专题文章】 BoostingIsm Segmentation python
本栏聚焦在语义分割的相关算法，专栏内文章的代码均已实现。一、数据篇【遥感】【道路】篇：【语义分割】【专题系列】一、MassachusettsRoadsDataset马萨诸塞州道路数据集获取二、CNN篇Unet(2015)：【语义分割】【专题系列】二、Unet语义分割代码实战PSPNet(2017)：【语义分割】【专题系列】三、PSPNet语义分割代码实战Linknet(2017)FPN(Featu
【Elasticsearch】分词器概述 risc123456 Elasticsearch elasticsearch
Elasticsearch分词与神经网络分词的区别Elasticsearch的分词过程产生的是优化用于搜索和检索的语言学分词。这与机器学习和自然语言处理中的神经分词不同。神经分词器将字符串转换为更小的子词分词，这些分词被编码为向量，供神经网络使用。Elasticsearch没有内置的神经分词器。分词器接收一个字符流，将其分解为单独的分词（通常是单个单词），并输出一个分词流。例如，`whitespa
一、C语言编程LeetCode数据结构题失败才是人生常态考研初试准备 c语言数据结构
一、链表1、两数相加算法思想：1、设置两个指针p,q，分别指向两个链表的头结点2、设置一个临时变量temp，用来记录两个数相加时是否有进位，初始化为0。只要p,q指针不指向空，就循环把两个指针所指向节点的值和temp相加。如果大于9，就让一个临时变量设置为1，并把相加结果减10，把结果赋给两个指针所指向节点的值；如果小于9就直接赋值给两个节点所指向的值。然后p,q指针分别后移一个节点。3、最后，判
Python网络请求详解 wespten 全栈软件测试人工智能测试开发自动化测试性能测试软件测试
一、网络请求测试人员对于接口测试的理解总是停留在工具使用层面。很多情况下，测试人员会花很大的代价去学习一个工具。而测试工具本身的局限性，又导致测试人员陷入想直接用现成的测试框架却又无法进行扩展的僵局。最后由于项目的特殊性等客观因素，测试人员只能放弃工具，脱离了工具的可视化界面友好操作，发现自己连接口是什么都不明白，更不要说自行完成接口自动化测试了。随即接口自动化测试由于项目成本及人员能力问题宣告失
基于 Python 的云笔记平台分析与设计程序员奇奇计算机毕设 Python 云笔记毕业设计
完整代码：https://download.csdn.net/download/qq_38735017/873824351前言1.1背景苏联著名教育学家苏霍姆林斯基说得好：“如果学生的智力生活仅局限于教科书，如果他做完了功课就觉得任务已经完成，那么他是不可能有自己特别爱好的。”每一个学生要在书籍的世界里，有自己的生活。把读书，应视为自己的乐趣。当每读完一本有意思的书时，很多时候都想把书中感触深刻亦
Windows下安装CPU用的Tensorflow Coder LM Wang Python
刚在电脑上安装了Tensorflow，还是碰到了一些麻烦，记录一下：很多教程是介绍怎么在Linux平台下安装的，或者是Windows平台下GPU用的，很可惜，这些教程对我来说太麻烦了。安装步骤：1）安装Python。版本：python-3.6.4-amd64.exe。2）cmd，命令行输入：python，查看Python版本号，以验证Python是否安装成功了。3）继续在命令行输入：pipinst
【算法】动态规划专题⑪ —— 区间DP python 查理零世动态规划专题算法动态规划 python
目录引入进入正题回归经典总结引入区间动态规划（区间DP）适用于解决涉及区间最优化的经典问题，如石子合并、最长回文子序列等。进入正题石子合并https://www.acwing.com/problem/content/284/有N堆石子排成一排，其编号为1,2,3,…,N。每堆石子有一定的质量，可以用一个整数来描述，现在要将这N堆石子合并成为一堆。每次只能合并相邻的两堆，合并的代价为这两堆石子的质量
【必看】凭啥？DeepSeek如何用1/179的训练成本干到GPT-4o 98%性能大F的智能小课人工智能算法
一、DeepSeek降低训练成本的核心方法1.1创新训练方法DeepSeek通过独特的训练方案显著降低了训练成本。其核心策略包括减少监督微调（SFT）步骤，仅依赖强化学习（RL）技术。DeepSeek-R1-Zero版本完全跳过SFT，仅通过RL进行训练。尽管初期计算开销较大，但添加少量冷启动数据后，训练稳定性和模型推理能力大幅提升。此外，DeepSeek还采用了组相对策略优化（GRPO）算法替代
python创建画布语句_canvas元素创建画布 weixin_39847945 python创建画布语句
Phaser桌面和手机游戏HTML5框架Phaser是一个流行的2D开源游戏框架，可以用来开发桌面或手机浏览器HTML5游戏，适合侧视或顶视风格：Phaser同时支持Canvas和WebGL渲染引擎，预置了完备的精灵动画、输入管理、瓦片地图、补间动画、资源加载器、物理系统、粒子系统等特性，几乎能够满足你开发一个2D游戏的任何...文章马拉喀什2017-11-021163浏览量HTML5学习手笔四：
Python.pyecharts.charts折线图新旧版本对比详解！唔使般若 python
旧版本(0.5.10)实现frompyechartsimportLineline=Line("美国邮费阶梯图")datax=[1995,1996,1997,1998,1999,2001,2002,2003,2004,2005,2006,2007,2008,2009]datay=[0.32,0.32,0.32,0.32,0.33,0.33,0.34,0.37,0.37,0.37,0.37,0.39,
【2024年华为OD机试】 (C卷,200分)- 亲子游戏（JavaScript&Java & Python&C/C++）妄北y 算法汇集笔记总结(保姆级)华为od c语言游戏 java javascript 矩阵
一、问题描述宝宝和妈妈的糖果游戏问题题目描述在一个N×N的二维矩阵中，宝宝和妈妈分别用抽签决定自己的初始位置。每个格子可能有不同的糖果数量，同时部分格子有障碍物，妈妈需要遵循以下规则：妈妈必须在最短的时间内到达宝宝的位置（每单位时间只能移动一步）。妈妈沿路可以拾取格子上的糖果，糖果数量会累加。妈妈不能走障碍物的格子，只能上下左右移动。如果妈妈无法到达宝宝，则输出-1。输入格式：第一行输入为N，表示
书籍-《强化学习数学基础》强化学习数学人工智能
书籍：MathematicalFoundationsofReinforcementLearning作者：赵世钰出版：Springer编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《强化学习数学基础》01书籍介绍本书对基本概念、核心挑战和经典强化学习算法进行了数学但易于理解的介绍。它旨在帮助读者理解算法的理论基础，提供对其设计和功能的见解。整个过程中包括许多说明性示例。数学内容经过精心设计，以
以C语言为基石，轻松理解Python的核心逻辑 welcome_123_ c语言 python 开发语言
一、编程思维的桥梁：从C到Python对于掌握C语言的开发者来说，Python的学习就像在熟悉的城市中发现一条新的捷径。本文将通过对比C语言和Python的核心特性，揭示两种语言的本质联系与差异，帮助C开发者快速建立Python编程思维。二、基础语法对照表2.1变量定义与使用操作C语言实现Python实现核心差异定义整型变量intnum=10;num=10Python无需声明类型浮点数运算floa
探索Python爬虫：获取淘宝商品详情与订单API接口的深度解析不爱搞技术的技术猿 Python 淘宝API python 爬虫开发语言
引言在数字化时代，电子商务平台的数据挖掘和分析已成为企业获取市场洞察的重要手段。淘宝，作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于商家和市场分析师来说，如何高效、合规地获取这些数据，成为了一个迫切需要解决的问题。本文将深入探讨如何利用Python爬虫技术，通过淘宝提供的API接口，合法合规地获取商品详情和订单数据。淘宝API接口概览淘宝开放平台提供了丰富的API接口，允许开发者在
多级数组Tree如何做搜索前端tree算法递归
两种方案1、数组打平，根据搜索字符在打平数组里去filter出满足条件的node节点，但此时被筛选的节点只有子节点，然后再通过被筛选出的子节点去找对应的父节点，然后拿到结果后转成tree结构优点：思路简单，打平数组用了递归，好理解缺点：找父节点的时候相对麻烦。2、写一个递归算法，满足条件就返回tree比如有一个简单个treeconsttreeData=[{title:'a',children:[{
使用Python爬虫获取淘宝订单商品接口的全面指南 JelenaAPI小小爬虫 API Python python 爬虫数据库
引言淘宝作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于开发者来说，获取淘宝订单商品接口是一个常见的需求。本文将介绍如何使用Python编写爬虫，获取淘宝订单商品信息。一、淘宝订单商品接口概览淘宝提供了多个与订单相关的API接口，以下是几个主要的接口：订单详情API接口：taobao.trade.fullinfo.get：获取订单的详细信息，包括订单状态、支付信息、物流信息等。订单批
python爬虫6个经典常用案例（完整代码）小北画画 python 爬虫开发语言人工智能 pycharm
文章目录1.抓取静态网页内容2.抓取多个网页（分页）3.使用正则表达式提取数据4.处理动态内容（使用Selenium）5.抓取带有登录认证的网页6.使用Scrapy框架Python爬虫是一种强大的工具，可以用来从网页中提取数据。以下是六个常用的Python爬虫案例，涵盖了从简单的网页抓取到更复杂的动态内容抓取。1.抓取静态网页内容目标：抓取一个静态网页的内容，并提取其中的特定信息。示例：抓取一个新
【爬虫案例】2025最新python爬虫案例！5个经典案例！（完整代码）小北画画爬虫 python 开发语言蓝桥杯职场和发展 pycharm
文章目录案例1：爬取豆瓣电影Top250案例2：爬取猫眼电影Top100案例3：爬取某吧帖子内容案例4：多线程爬取小说章节内容案例5：爬取全国高校名单—————其他案例分享—————案例1：爬取豆瓣电影Top250目标：获取豆瓣电影Top250的电影名称、评分和评价人数等信息。方法：使用requests库发送HTTP请求，BeautifulSoup库解析网页内容，csv库保存数据到CSV文件。代码
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 alxw4616@Msn.com 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他