CristinaM

【特征工程】在机器学习中使用地理空间数据（转载）

原文：Working with Geospatial Data in Machine Learning

如何使用地理空间类数据。
首先通过可视化数据集（坐标点）来获得有价值的信息，
然后，提出用于提取和创造新特征的不同方法，这些新特征将优化模型的建立。

数据集来自：New York City Taxi Fare Prediction
由于数据集实在太大，我只使用了测试集。

import numpy as np # linear algebra
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.read_csv("C:\\Users\\Nihil\\Documents\\pythonlearn\\data\\kaggle\\spatial.csv")
data.rename(columns={'pickup_longitude':'Pickup Long', 'pickup_latitude':'Pickup Lat'}, inplace = True) 
print(data.columns.values)

可视化

可视化的目的：

检测、异常值、模式和趋势；
在真实情景中考虑数据；
了解城市，州或国家/地区之间的数据分布；
查看数据的总体外观。

通过可视化，我们决定是否移除数据。

Scatter Plot

对于地理空间数据，最快的可视化路径是散点图，其基本上显示了这些点之间的关系。

plt.figure(figsize = (7,5))
sns.scatterplot(data['Pickup Lat'], data['Pickup Long'])
plt.show()

数据有点少。用前面芝加哥犯罪集的数据试试。

Map Plot

第二种技术是在真实的地图上绘制数据。这是显示坐标和调查数据的一种更明显、更真实的方法。这里引入folium库。

使用folium库的方法：

1.创建一个可以作为数据中心点的位置的地图；

2.将点添加到地图；

3.显示地图。

但我使用失败了，下次再琢磨吧，略过。

import folium
map_pickup = folium.Map(location=[-74.252193,41.709555])
map_pickup.save('map_pickup.html')

Techniques & Ideas

在看到数据是什么样子之后，就该到特性工程阶段了。在这里，我们将提出一些技巧，以提取和构建更好的特征，从而对预测模型进行改进。

1.按原样使用特性（经度，纬度）

即：使用经度和纬度，就像它们目前在预测模型中一样。

但是请记住，这经度和纬度是不同的，你需要使用的模型需要具有”不用标准化“的特性，比如树模型。否则，您必须执行标准化并将它们包含在特性集中。

方法1 四舍五入

可以使用不需要任何规范化的模型。
取而代之的是，可以将数值四舍五入到小数点后三位或四位，这能对模型的性能作出改善。

train = train.round({'Pickup Long':4,'Pickup Lat':4})
print(train['Pickup Lat'].head())
print(train['Pickup Long'].head())

0    40.7638
1    40.7194
2    40.7513
3    40.7678
4    40.7898
Name: Pickup Lat, dtype: float64
0   -73.9733
1   -73.9869
2   -73.9825
3   -73.9812
4   -73.9660
Name: Pickup Long, dtype: float64

方法2 转化为弧度

另一个简单但功能强大的转换是将纬度和经度转换为弧度。
可以使用NumPy函数radians（）来实现。

train['Pickup Long'] = np.radians(train['Pickup Long'])
train['Pickup Lat'] = np.radians(train['Pickup Lat'])
print(train['Pickup Lat'].head())
print(train['Pickup Long'].head())

0    0.711463
1    0.710688
2    0.711244
3    0.711532
4    0.711916
Name: Pickup Lat, dtype: float64
0   -1.291078
1   -1.291315
2   -1.291238
3   -1.291216
4   -1.290950
Name: Pickup Long, dtype: float64

2.Perform Clustering

2.1 坐标点聚类的目的

处理点坐标的方法之一是处理它们之间的关系。
为此，可以采用聚类的方法，给每个聚类ID分配给一个点。
这样，将创建一个分类变量，可以对其进行热编码以获得更好的结果。

2.2 坐标点聚类的算法

聚类算法的选择很重要。
文章的作者测试了许多算法，例如K-means，DBSCAN和Hierarchical clustering。
作者认为，在地理空间要素方面，后两者似乎提供了更好的结果。
当然。这取决于特征空间是否是线性的。如果是线性，可选择K-means。如果是非线性，最好选择后两种。

2.3 clusters的数量

clusters的数量将取决于项目，但是一般来说，必须进行测试，看看什么可以提供更好的结果。

Demo（K-means，5个clusters）

from sklearn.cluster import KMeans,AgglomerativeClustering

agc = AgglomerativeClustering(n_clusters=5,affinity='euclidean', linkage='ward')
train['pickup cluster'] = agc.fit_predict(train[['Pickup Lat','Pickup Long']])
Kmeans = KMeans(5)

clusters = Kmeans.fit_predict(train[['Pickup Lat','Pickup Long']])

sns.scatterplot(train['Pickup Lat'], train['Pickup Long'],hue=clusters)

之前学习的时候还没有开始看K-means，这部分待看。

这是原作者画的图。

3.Reverse Geocoding

应用场景：

坐标点之间较为离散（距离较远），并且，数据行包含来自世界不同城市或国家/地区的坐标。

功能：

将点坐标转换为可读的地址或地名(即城市或国家)。这样，我们可以创建一个新的分类变量。

Demo：


from geopy.geocoders import Nominatim

# create the locator
geolocator = Nominatim(timeout=3)

# getting the location address
location = geolocator.reverse("52.509669, 13.376294")
print(location.address)

Backwerk, Potsdamer Platz, Tiergarten, Mitte, Berlin, 10785, Deutschland

GeoPy的官方文档
用本文的例子

from geopy.geocoders import Nominatim

# create the locator
geolocator = Nominatim(timeout=3)

# getting the location address
location = geolocator.reverse("40.7898, -73.9812")
print(location.address)

Riverside Park 6, Riverside Drive, Upper West Side, Manhattan Community Board 7, Manhattan, New York County, New York, 10024, United States of America

NOTE：

location = geolocator.reverse("latitude, longitude")

从整体信息中获取部分信息（街区，邮编等）

from geopy.geocoders import Nominatim

# create the locator
geolocator = Nominatim(timeout=3)

# getting the location address
location = geolocator.reverse("52.509669, 13.376294")

# getting address compontent like street, city, state, country, country code, postalcode and so on.
print('State is {}'.format(location.raw.get('address').get('state')))
print('city_district is {}'.format(location.raw.get('address').get('city_district')))
print('country is {}'.format(location.raw.get('address').get('country')))
print('Postcode is {}'.format(location.raw.get('address').get('postcode')))

State is Berlin
city_district is Mitte
country is Deutschland
Postcode is 10785

由此，我们可以为城市或国家创建一个字段。
注：该方法不适用于只有唯一值的城市变量（只有一个城市时）

4.Distance Feature

4.1所需参数

首先，让我们考虑确定估计到达时间（Estimated Time of Arrival）的问题。为此，数据集将包含出发和目的地坐标。

4.2功能，返回值

通过出发点和目的点的距离计算，可获得一个距离特性。可改善模型。
如果没有两个坐标点，可计算到某一个固定点的举例，这将取决于项目需求。

4.3距离公式

4.3.1 “ Harvsine公式”

demo:

train.rename(columns={'dropoff_longitude':'Destination Long', 'dropoff_latitude':'Destination Lat'}, inplace = True) 
def haversine_distance(row):
    lat_p,lon_p = row['Pickup Lat'],row['Pickup Long']
    lat_d,lon_d = row['Destination Lat'],row['Destination Long']
    radius = 6371
    dlat = np.radians(lat_d - lat_p)
    dlon = np.radians(lon_d - lon_p)
    a = np.sin(dlat/2) * np.sin(dlat/2) + np.cos(np.radians(lat_p)) * np.cos(np.radians(lat_d)) * np.sin(dlon/2) * np.sin(dlon/2)
    c = 2 * np.arctan2(np.sqrt(a), np.sqrt(1-a))
    distance = radius * c

    return distance

train['distance'] = train.apply(haversine_distance, axis = 1)
print(train.distance.head())

5.抽取X,Y,Z

可以适度地帮助改善模型，但是可能不如以前的方法有效。
x = cos(lat) * cos(lon)
y = cos(lat) * sin(lon)
z = sin(lat)

DEMO


import numpy as np

train['pickup x'] = np.cos(train['Pickup Lat']) * np.cos(train['Pickup Long'])
train['pickup y'] = np.cos(train['Pickup Lat']) * np.sin(train['Pickup Long'])
train['pickup z'] = np.sin(train['Pickup Lat'])

你可能感兴趣的:(特征处理)

图像识别技术与应用课后总结（18）一元钱面包人工智能
·YOLO-V3RetinaNet系列，YOLO-V3在不同变体（如YOLOV3-320、YOLOV3-416等）下，在推理时间和精度上有不同的表现，展示了其在速度和准确性上的平衡。YOLO-V3的改进点网络结构：相比之前版本，YOLO-V3的网络结构进行了优化，使其更适合小目标检测。特征处理：对特征的处理更加细致，通过融入多持续特征图信息来预测不同规格的物体。先验框：先验框更加丰富，有3种sca
(即插即用模块-特征处理部分) 三十、(2024) BFAM & CBM & DFEM 特征聚合+特征提取+边界感知御宇w 即插即用-特征处理深度学习计算机视觉即插即用模块
文章目录1、BitemporalFeatureAggregationModule2、ChangeBoundary-AwareModule3、DeepFeatureExtractionModule4、代码实现paper：B2CNet:AProgressiveChangeBoundary-to-CenterRefinementNetworkforMultitemporalRemoteSensingIm
100.13 AI量化面试题：支持向量机（SVM）如何处理高维和复杂数据集？ AI量金术师金融资产组合模型进化论支持向量机人工智能算法金融 python 机器学习数学建模
目录0.承前1.解题思路1.1基础概念维度1.2技术实现维度1.3实践应用维度2.核函数实现2.1基础核函数2.2自定义核函数3.特征处理与优化3.1特征工程3.2参数优化4.实践应用策略4.1核函数选择指南4.2性能优化策略5.回答话术0.承前本文通过通俗易懂的方式介绍支持向量机(SVM)如何处理高维和复杂数据集，包括核函数技巧、特征工程和优化方法。如果想更加全面清晰地了解金融资产组合模型进化论
NLP_[2]-认识文本预处理闵少搞AI NLP 自然语言处理人工智能
文章目录1认识文本预处理1文本预处理及其作用2.文本预处理中包含的主要环节2.1文本处理的基本方法2.2文本张量表示方法2.3文本语料的数据分析2.4文本特征处理2.5数据增强方法2.6重要说明2文本处理的基本方法1.什么是分词2什么是命名实体识别3什么是词性标注¶1认识文本预处理1文本预处理及其作用文本语料在输送给模型钱一般需要一系列的预处理工作才能符合模型输入的要求,如将文本转化成模型需要的张
数值型特征处理 - 归一化和分桶 Ivanqhz 设计模式 java spark 大数据分布式
归一化概述归一化，好像是把数据缩放到某个范围内，比如0到1或者标准化处理。而分桶可能是指把连续的数值分成不同的区间，比如年龄段分成0-18，19-30这样的区间消除特征间的量纲差异，使不同特征具有可比性，适用于依赖距离或梯度的模型（如SVM、神经网络、KNN）最大最小归一化（Min-MaxScaling）将数据线性映射到[0,1]计算公式:xnorm=x−xminxmax−xminx_{norm}
爆改yolov8|利用BSAM改进YOLOv8，高效涨点不想敲代码！！！爆改yolov8 即插即用 YOLO yolov8 目标检测人工智能深度学习
1，本文介绍BSAM基于CBAM进行改进，经实测在多个数据集上都有涨点。BSAM（BiLevelSpatialAttentionModule）是一个用于提升深度学习模型在空间特征处理中的能力的模块。它主要通过双层注意力机制来增强模型对重要空间信息的关注，从而提升任务性能。核心特点：双层空间注意力：BSAM结合了两个层次的注意力机制——全局和局部。全局注意力捕捉图像或特征图的整体信息，而局部注意力则
spark mllib 特征学习笔记（一）路人与大师 spark-ml 学习笔记
PySparkMLlib特征处理详解PySparkMLlib提供了丰富的特征处理工具，帮助我们进行特征提取、转换和选择。以下是PySparkMLlib中常用的特征处理类及其简要介绍。1.BinarizerBinarizer是将连续特征二值化的转换器。frompyspark.ml.featureimportBinarizerbinarizer=Binarizer(threshold=0.5,inpu
【大厂AI课学习笔记】【1.6 人工智能基础知识】（4）深度学习和机器学习 giszz 学习笔记人工智能人工智能学习笔记
关于深度学习和机器学习，出来包含关系之外，还有如上总结的知识点。分别从特征处理、学习方法、数据依赖、硬件依赖等4个方面，进行了总结。从特征处理上看：深度学习从数据中习得高级特征，并自行创建新的特征。这比普通的机器学习，更少的人工特征训练的参与，机器更加自主的学习。人既是加快了机器学习的性能，但同时也是束缚，要想解决更多的问题，获得更高级的智能，目前这是较好的出路。从学习方法上看：深度学习通过端到端
task 13 集成学习罐罐儿111
蒸汽量预测1.特征工程一般流程：1.去掉无用特征2.去掉冗余特征3.利用存在的特征、特征转换、内容中的特征以及其他数据源生成新特征4.特征转换（数值化、类别转换、归一化）5.特征处理（异常值、最大值、最小值、缺失值）观察特征核密度估计，已知散点图，做回归，要求连线尽可能平滑，大致观察数据的分布情况。在本例中，通过核密度估计，观察训练集与测试集数据的分布情况，从而删除不具有相似分布的属性值计算相关性
XGboost常见特征处理及其他问题噶噶~ 机器学习--数据处理机器学习机器学习算法人工智能 python
1.Bagging和Boosting区别RF,GBDT,XGBoost,lightGBM都属于集成学习（EnsembleLearning），集成学习的目的是通过结合多个基学习器的预测结果来改善基本学习器的泛化能力和鲁棒性。（1）形式上Bagging：基本学习器之间不存在强依赖关系、必须并行生成的序列化方法；例如：随机森林bagging主要关注降低方差Boosting：基本学习器间存在强依赖关系、可
tf特征处理常用函数 frostjsy tensorflow 人工智能 python
1、特征拼接1.1、将特征在最后一个维度进行拼接#将特征按照最后一个维度进行拼接defconcat_fun(inputs,axis=-1):iflen(inputs)==1:returninputs[0]else:#returntf.keras.layers.Concatenate(axis=axis)(inputs)returntf.concat(inputs,axis=axis)eg：a=[a
08. BI - 万字长文，银行如何做贷款违约的预测，特征处理及学习茶桁茶桁的AI秘籍#BI 特征处理机器学习银行贷款
本文为「茶桁的AI秘籍-BI篇第08篇」文章目录课程回顾案例分析案例实战Hi，你好。我是茶桁。课程回顾上节课，咱们讲了一个股票的指标：MACD。在趋势行情里面它应该还是有效的指标。它比较忌讳动荡行情，比如说它一会上升一会下降，那还没有等12天过完，就是均线还没有画好它又马上变成了另一个行线，这样MACD有可能会失效。这个问题我们大家自己去思考一下，如果你采用这个策略在过去一段时间里面选择一些股票来
2021-07-14 卢坚辉
动手学数据分析之数据清洗及特征处理1.开始之前，导入numpy、pandas包和数据(1)#加载所需的库importnumpyasnpimportpandasaspd(2)加载数据train.csvdf=pd.read_csv('train.csv')df.head(3)image.png2.数据清洗简述(1)我们拿到的数据通常是不干净的，所谓的不干净，就是数据中有缺失值，有一些异常点等，需要经过
机器学习笔记02：特征工程 fafagege11520 机器学习机器学习
机器学习笔记02：特征工程文章目录机器学习笔记02：特征工程1.特征工程定义2.数据的特征抽取：1.字典特征抽取：2.文本特征抽取：3.tf-df分析问题3.特征预处理1.特征处理的方法：1.数值型数据：标准缩放：2.类别型数据：3.事件类型：4.数据降维：1.特征选择：2.主成分分析PCA---->降维：3.特征选择和主成分分析的比较：5.需要明确的几点问题：6.机器学习基础1.数据类型2.机器
2021-06-17 第二章：数据清洗及特征处理 Akai_
2.1缺失值观察与处理2.1.1任务一：缺失值观察pandas里边查找NaN值的话，可以是.isna()，也可以是.isnull()isna的意思是判断是不是notanumber，主要是数值字段；isnull的意思是判断是否为空值1）df.isna().sum()查看空值信息df.isnull().sum()查看空值信息df.info()查看数据信息2）df[['Age','Cabin','Emb
第一次直播笔记 Skyscraper_4586
赛题理解部分一、赛题理解1.赛题理解1.1了解赛题类型：回归、分类、其他1.2赛题背景：是否包含异常值、确实、漂移；是否包含多种情况，需要注意模型的繁华性；高效性、工序流程的差异性，模型运行时间、系统鲁棒性2.数据理解2.1字段含义2.1.1明确的特征：分类、连续、变量间的交互2.1.2匿名特征处理：四则运算、取log、统计指标等2.2数据量：观察数据量以了解需要电脑配置的情况2.3评测标准2.3
特征工程-特征处理（二） alstonlou 特征工程算法机器学习人工智能
特征处理二、时间特征处理将原本的具体时间拆分为年月日等多个特征变量，同时可以引入在一天的某个时间段，或者是当天是否为节假日等其他条件，还可以进一步结合其他特征，进行前后一个时间段或是多个时间段时间的特征差值。dt.shift(periods=1,freq=None,axis=0)连续型变量处理（一）单特征归一化和标准化数据的归一化和标准化是特征缩放的方法。不同评价指标往往具有不同的量纲和量纲单位，
特征工程-特征处理（三） alstonlou 特征工程人工智能机器学习
特征处理连续型变量处理（二）多特征降维PCAPCA是一种常见的数据分析方式，通过数据分解，将高维数据降低为低维数据，同时最大程度保持数据中保存的信息。fromsklearn.decompositionimportPCAA=np.array([[84,65,61,72,79,81],[64,77,77,76,55,70],[65,67,63,49,57,67],[74,80,69,75,63,74]
生存分析序章4——生存分析之Python篇：自定义方法与进阶技术探索 theskylife 数据分析 20天玩转数据分析数据挖掘 python 开发语言数据分析数据挖掘生存分析
目录写在开头1.定制生存曲线1.1利用Python自定义生存曲线1.1.1构建生存函数1.1.2自定义曲线样式1.2特殊需求下的曲线绘制2.高级Cox模型2.1引入时间依赖性的Cox模型2.1.1时间依赖性的概念2.1.2模型调整2.1.3场景举例2.2处理复杂数据的Cox模型应用2.2.1类别型特征处理2.2.2非线性关系建模2.2.3处理缺失数据2.2.4时间相关协变量3.处理截尾与左删失数据
Information Sciences 2022 | 利用图嵌入和图神经网络实现社交网络中的影响力最大化 Cyril_KI 影响力最大化 Papers 影响力最大化图神经网络图嵌入 SIR模型
目录前言1.影响力最大化2.SGNN2.1标签生成2.2struc2vec2.3GNN特征处理2.4回归预测2.5整体框架3.实验3.1数据集3.2评价指标前言题目：Influencemaximizationinsocialnetworksusinggraphembeddingandgraphneuralnetwork期刊：InformationSciences2022论文地址：Influence
特征工程-特征处理（一） alstonlou 特征工程算法机器学习 python
特征处理-（离散型特征处理）完成特征理解和特征清洗之后，我们要进行特征工程中最为重要和复杂的一步了——特征处理离散型特征处理离散型特征通常为非连续值或以字符串形式存在的特征，离散型特征通常来讲是不能直接喂入模型中的，例如性别：男/女，绝大部分模型无法对这些变量进行识别，所以，我们需要将离散型特征进行编码数字化，使得模型能够正常识别和学习该数据。1.LabelEncoding简单来说LabelEnc
ML12-朴素贝叶斯分类杨强AT南京
朴素贝叶斯分类是一种经典的机器学习算法，本主题从贝叶斯的应用场景，到其数学基础，并到最终的实现与应用做了介绍。主要内容包含： 1.NaiveBayes的分类思想； 2.NaiveBayes分类的数学基础； 3.NaiveBayes分类算法实现； 4.NaiveBayes算法的sklearn调用； 5.文本特征处理； 6.NaiveBayes算法的简历薪资预测实现；朴素贝叶斯算法说明朴素
机器学习案例【决策树】--泰坦尼克号幸存者预测 Stitch的实习日记机器学习决策树人工智能
前置知识点：数据的处理与清洗交叉验证网格搜索1.数据处理：查看数据信息：data.info()data.head()将文字转为数字:我们的决策树的分类器只能处理数字，所以我们的标签的类型必须是数字,所以如果下面的特征是object的类型的话，都需要转换成数字才能够使用筛选特征处理缺失值#1.导入所需要的库importpandasaspdfromsklearn.treeimportDecisionT
数据挖掘聚类算法--划分(partitioning) Mr_Peter_Hu 数据挖掘 clustering partition
数据挖掘--聚类算法简介聚类是对物理的或者抽象的对象集合分组的过程，聚类生成的组称为簇，而簇是数据对象的集合。所划分的簇有两个特征：(1)簇内部的任意两个对象之间具有较高的相似度（2）属于不同的簇的两个对象间具有较高的相异度。聚类算法--特征处理不同类型属性的能力；对大型数据集的可扩展性；处理高维数据的能力；发现任意形状簇的能力；处理孤立点或“噪声”数据的能力；对“噪声”数据具有较低的敏感性；合理
【nn.Parameter】Pytorch特征融合自适应权重设置（可学习权重使用） bao文机器视觉 pytorch 学习深度学习
2021年11月17日11:32:14今天我们来完成Pytorch自适应可学习权重系数，在进行特征融合时，给不同特征图分配可学习的权重！原文：基于自适应特征融合与转换的小样本图像分类（2021）期刊：计算机工程与应用（中文核心、CSCD扩展版）实现这篇论文里面多特征融合的分支！实现自适应特征处理模块如下图所示：特征融合公式如下：Fff=α1∗Fid+α2∗Fdconv+α3∗Fmax⁡+α4∗Fa
cnn lstm结合网络 AI视觉网奇深度学习基础 python 深度学习人工智能
目录特征处理例子：cnn5张图片一组，提取特征后，再给lstm，进时间序列分类。特征处理例子：importtorch#假设tensor是形状为15x64的张量tensor=torch.arange(15*2).reshape(15,2)#生成顺序编号的张量，替换成你的数据#将形状为15x64的张量变形为3x5x64的形状reshaped_tensor=tensor.view(3,5,2)#打印变形
机器学习入门-数值特征-时间特征处理 weixin_34026276 人工智能 python
我们可以将一连串的时间特征进行拆分，比如：2015-03-0810:30:00.360000+00:00，我们可以将其转换为日期类型，然后从里面提取年，月，日等时间信息对于一些hour，month等信息，我们也可以使用pd.cut将hour信息按照时刻转换为离散数据，如morning，afternonn等等代码：第一步：载入数据第二步：将数据转换为DataFrame格式第三步：使用pd.Times
聚类算法汇集 HELLOTREE1
1，k均值的k如何确定K-means怎么选K?数据科学家必须了解的六大聚类算法：带你发现数据之美|机器之心用于数据挖掘的聚类算法有哪些，各有何优势？-知乎K-means聚类算法如何应对数据的噪音和离散特征处理的问题？-知乎
推荐算法架构7：特征工程谢杨易推荐算法算法机器学习深度学习 python
1概述特征工程[1]（FeatureEngineering）是推荐算法的基础，它对收集到的原始数据进行解析和变换，从而提取出模型所需要的信息。通过挖掘丰富和高质量的特征，并对其进行合理的处理，可以提升模型预估准确度，从而提升推荐系统业务效果。特征工程是一项需要重点掌握的技术。本文先讲解特征类目体系，分析推荐系统中一般会有哪些特征。然后讲解特征处理范式，分析如何对特征进行离散化、归一化、池化和缺失值
决策树和回归树(Decision_Tree_and_Regression_Tree) geter_CS 机器学习决策树回归树 decision tree regression tree
参考了统计学习方法，西瓜书，MachineLearnigwithpython做的总结，所以不能作为教程，还包含自己用sklearn做的一些对比实验，原文是写在jupyter上的，这里是直接转为.md导过来的，所以格式有些问题，有些东西还待完善…注意几点：连续特征处理，预测问题或者说回归问题（连续性目标特征）决策树（Decisiontree）熵熵表示随机变量不确定性的度量。离散随机变量X的概率分布为
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他