weixin_39683692

python基础模型_零基础python代码策略模型实战

内容摘要

本文概述

本文主要介绍了python基础、爬虫、与数据库交互、调用机器学习、深度学习、NLP等。分别介绍了各个模块的安装，环境的搭建等。并且以机器学习选股为例，把各个模块连贯起来，核心代码基本都有详尽的解释。

大数据AI时代，python无往不胜

Python的包装能力、可组合性、可嵌入性都很好，可以把各种复杂性包装在Python模块里,非常友好的供调用。Python资源丰富，深度学习如keras，机器学习如sk-learn，科学计算如numpy、pandas，自然语言处理如jieba等。

Python将极大提高工作效率

无论是科学计算，还是图形界面显示；无论是机器学习还是深度学习；无论是操作excel,txt等还是连接数据库；无论是搭建网站还是爬虫；无论是自然语言处理还是打包成exe执行文件，python都能快速完成。以最少的代码，最高效的完成。

人人可编写人工智能模型

人工智能给人感觉难于入手，重要原因是机器学习、深度学习、自然语言处理等门槛太高；python则以最简洁的方式，让你快速使用人工智能相关算法。本文以实战为目的，对模块的安装，搭建环境，核心代码等进行了详细的介绍。

人工智能选股模型策略(Logistic为例)

以传统因子滚动12个月值为特征值，个股下一期按收益大小排序，排名前30%作为强势股，排名靠后30%作为弱势股。用机器学习算法进行训练预测。用当期因子作为输入，预测未来一个月个股相对走势的强弱。根据个股的相对强势，我们把排名靠前20%的作为多头，排名后20%的作为空头进行了研究，样本外20090105到20171130期间，行业中性等权年化多空收益差为16.45%，年化波动率为7.34%，最大回撤为10.84%。

◢ Part I ◣Python基础介绍

Python是一种面向对象的解释型计算机程序设计语言，由荷兰人Guido van Rossum于1989年发明。有以下优点简单、易学、免费开源、可移植性、解释性强；缺点为单行语句输出、同C++和Matlab比运行速度较慢。Python有较为强大的标准库和模块，方便用户进行调用：如科学计算的Numpy、Pandas、Scipy库；如机器学习和深度学习的Scikit-learn、Keras库；如爬虫的Pyquery、BeautifulSoup、Scrapy库。Python的应用领域较为广泛包括Web开发、人工智能、云计算、网络爬虫，游戏开发等。

一

Python的科学计算库

1、Numpy库

Numpy是Python的一个科学计算的库，提供了矩阵运算的功能，其一般与Scipy、matplotlib一起使用。其实，list已经提供了类似于矩阵的表示形式，不过Numpy为我们提供了更多的函数。操作方法有以下几种：

1) 导入模块；

2) 以list或tuple变量为参数产生一维或者多维度的数组；

3) 通过reshape方法，创建一个只改变原数组尺寸的新数组，原数组的shape保持不变；

4) arange函数通过指定开始值、终值(不包括)和步长来创建一维数组；

5) linspace函数通过指定开始值、终值(包括)和元素个数来创建一维数组;

6) 合并数组可以分为vstack(垂直方向)和hstack(水平方向)操作;

2、Pandas库

pandas核心为两大数据结构，即Series和DataFrame。数据分析相关的所有事务都是围绕着这两种结构进行，pandas库的Series对象是由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即Index)组成。DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型(数值、字符串、布尓值等)，DataFrame既有行索引(Index)，也有列索引(Columns)。

Pandas的相关操作有以下几种：

1) 导入模块(与Numpy类似)；

2) 创建Series，DataFrame；

3) 用describe()函数对数据的快速汇总；

4) 运用concat合并DataFrame；

5) 进行groupby分组；

6) 按值进行排序。

3、Scipy库

SciPy库是基于Numpy构建的一个集成了多种数学算法和方便的函数的Python模块。通过给用户提供一些高层的命令和类，SciPy在python交互式会话中，大大增加了操作和可视化数据的能力。

4、Matplotlib库

Matplotlib库是一个用于创建出版质量图表的桌面绘图包(主要是2D方面)，这是一个用Python构建的MATLAB式的绘图接口，所以库函数的参数以及调用方法大都与MATLAB一致。以下是Matplotlib使用的简单示例：

二

Python的爬虫相关库

网络爬虫(Web crawler)，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，它们被广泛用于互联网搜索引擎或其他类似网站，可以自动采集所有其能够访问到的页面内容，以获取或更新这些网站的内容和检索方式。从功能上来讲，爬虫一般分为数据采集，处理，储存三个部分。传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂，需要根据一定的网页分析算法过滤与主题无关的链接，保留有用的链接并将其放入等待抓取的URL队列。然后，它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL，并重复上述过程，直到达到系统的某一条件时停止。

网络爬虫的基本工作流程如下：

1) 首先选取一部分精心挑选的种子URL；

2) 将这些URL放入待抓取URL队列；

3) 从待抓取URL队列中取出URL，解析DNS，得到主机的IP，并将URL对应的网页下载下来，存储进已下载网页库中。此外，将这些URL放进已抓取URL队列；

4) 分析已抓取URL队列中的URL，分析其对应网页中的其他子URL，并且将未抓取过的子URL放入待抓取URL队列，从而进入下一个循环。

1、Scrapy库

Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试、信息处理和历史档案等大量应用范围内抽取结构化数据的应用程序框架，广泛用于工业和大数据领域。Scrapy的安装步骤如下:

1) 在dos窗口输入：pip install scrapy回车；

2) 测试scrapy是否安装成功,在dos窗口输入scrapy回车；

Scrapy主要包括了以下组件：

1) 引擎，用来处理整个系统的数据流处理，触发事务。

2) 调度器，用来接受引擎发过来的请求，压入队列中，并在引擎再次请求的时候返回。

3) 下载器，用于下载网页内容，并将网页内容返回给蜘蛛。

4) 蜘蛛，蜘蛛是主要干活的，用它来制订特定域名或网页的解析规则。

5) 项目管道，负责处理有蜘蛛从网页中抽取的项目，他的主要任务是清洗、验证和存储数据。当页面被蜘蛛解析后，将被发送到项目管道，并经过几个特定的次序处理数据。

6) 下载器中间件，位于Scrapy引擎和下载器之间的钩子框架，主要是处理Scrapy引擎与下载器之间的请求及响应。

7) 蜘蛛中间件，介于Scrapy引擎和蜘蛛之间的钩子框架，主要工作是处理蜘蛛的响应输入和请求输出。

调度中间件，介于Scrapy引擎和调度之间的中间件，从Scrapy引擎发送到调度的请求和响应

2、BeautifulSoup库

BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式。BeautifulSoup对象表示的是一个文档的全部内容。大部分时候,可以把它当作Tag对象,它支持遍历文档树和搜索文档树中描述的大部分的方法。BeautifulSoup的安装方法如下：

①　　在dos窗口输入pip install beautifulsoup4

② 　　进入python，输入from bs4 import BeautifulSoup运行，若不报错则安装成功。

3、Pyquery库

Pyquery是一个类似jquery的库, 通过使用lxml来处理xml和html. 所以在使用pyquery时得先安装lxml库,在使用前需要先安装lxml，下载地址如下：

①　　 http://codespeak.net/lxml/lxml-2.2.8.tgz

② 　　 http://pypi.python.org/packages/source/p/pyquery/pyquery-0.6.1.tar.gz

快速简便的安装方法是在dos窗口输入：

①　　 pip install libxml2-devel, pip install libxslt (Anaconda一般默认已安装，直接第下一步便可)

② 　　 pip install pyquery

到此时安装已经完成。但以作者的经验，不知是PyQuery的bug还是什么原因，对于中文是乱码，解决方法如下：

把pyquery/openers.py 的_requests 函数中的 if encoding: resp.encoding = encoding

换成 resp.encoding = encoding or None

以上是目前主流的一些爬虫框架，相对来说，Scrapy功能最强大，BeautifulSoup比较经典，Pyquery则处理中文更加友好。当然，在爬虫中，会比样例复杂太多，爬虫者对css,js等前端技术有了解则更好，有些目标网页可能会有反爬虫机制，这是一个斗智斗勇的过程，你可能需要设置代理IP,模拟浏览器等相关技术。

三

Python的数据交互

Python提供了多种数据的接口包括与MySQL，SQL Server，Wind等多类数据库，同时对于小批量的数据格式，例如csv、excel和txt等文件也可以完成数据的导入和导出。

1、Python与数据库的交互

PyMySQL是用于Python连接MySQL数据库的接口，在使用之前需要安装，安装的语句为：

pip install pymysql

其主要操作如下：

1) 查询记录；

2) 插入数据；

3) 更新数据；

4) 删除数据。

Pyodbc是用于Python连接SQL Sever数据库的接口，在使用之前需要安装，安装的语句为：

pip install pyodbc

其主要操作如下：

1) 查询记录；

2) 插入数据；

3) 更新数据；

4) 删除数据。

二、 Python与csv、excel和txt文件的交互

对于csv、excel和txt格式的文件，Pandas和Python内置函数提供了导入和保存数据的方法，具体如下：

三、 Python与Wind客户端的交互

1) 正常WindPy接口安装

打开Wind资讯终端，点击“量化”选项，出现下方的界面，点击“Python插件”，会弹出广告说明；

2) 特殊安装WindPy方式

假设Wind终端安装在C:\Wind\Wind.NET.Client\WindNET目录(目录下有bin等等子目录)，Python安装在C:\python28目录。首先通过Windows进入cmd命令，然后输入如下命令即可：

C:\Python28\python.exeC:\Wind\Wind.NET.Client\WindNET\bin\installWindPy.py C:\wind\wind.net.client\windnet

按任意键WindPy安装过程结束。

说明：以上接口安装说明来自于wind客户端，若有更新，请参考最新wind说明。

◢ Part II ◣ python与人工智能

一

Python自然语言的处理

1、jieba库

jieba是一个python实现的分词库，对中文有着很强大的分词能力。Jieba安装方法为：

pip install jieba

jieba库的优点如下：

1) 支持三种分词模式；

精确模式，试图将句子最精确地切开，适合文本分析；

全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义；

搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。

2) 支持繁体分词

3) 支持自定义词

除了jieba分词外，还有以外分词库等也非常流行：

1) NLTK库

在使用 Python 处理自然语言的工具中也处于领先的地位。它提供了 WordNet 这种方便处理词汇资源的接口，以及分类、分词、词干提取、标注、语法分析、语义推理等类库。

网站

http://www.nltk.org/

安装 :

pip install -U nltk

2) TextBlob库

TextBlob 是一个处理文本数据的 Python 库。它提供了一个简单的 api 来解决一些常见的自然语言处理任务，例如词性标注、名词短语抽取、情感分析、分类、翻译等等。

网站：

http://textblob.readthedocs.org/en/dev/

安装：

pip install -U textblob

二

Python与机器学习

基于python的机器学习库非常多，主要有以下几类：

1)Scikit-learn 是一个简单且高效的数据挖掘和数据分析工具，易上手，可以在多个上下文中重复使用。它基于NumPy, SciPy 和 matplotlib，开源，可商用(基于 BSD 许可)。

2)Statsmodels 是一个 Python 模块，可以用来探索数据，估计统计模型，进行统计测试。对于不同类型的数据和模型估计，都有描述性统计，统计测试，绘图功能和结果统计的详细列表可用。

3)Shogun 是一个机器学习工具箱，它提供了很多统一高效的机器学习方法。这个工具箱允许多个数据表达，算法类和通用工具无缝组合。

等等。以下主要介绍Scikit-learn。

1、Scikit-learn库

Scikit-learn是Python里面一个机器学习相关的库，它是构建于NumPy, SciPy, and matplotlib基础上的简单高效的数据挖掘和数据分析工具，而且是开源的，内部自带的算法包较多。

安装方法如下：

Anaconda一般都包含了这些包，但有时可能需要更新，更新方法为：

pip install -U scikit-learn

主要内容如下：

1) 按算法的功能分类，分为分类(classification)，回归(regression)，聚类(clustering)，降维，预处理等。sklearn提供了很全面的算法实现；

(具体清单可以参考http://scikit-learn.org/stable/index.html)

2) 测试数据集，比如iris，boston房价等，总共10个左右；

3) 数据预处理，比如二值化，正规化，特征提取；

4) 测试数据选择、测试算法以及确定参数，甚至pipeline化的支持；

5) 其他支持功能，比如评分matrix；

使用sklearn进行计算的主要步骤：

1) 数据准备。需要把数据集整理为输入X[sample_count, feature_count]，结果y[label_count]的格式，其中sample_count应该等于label_count；

2) [可选的降维过程]，原始数据维度大可能会出现The curse of dimensionality 问题，严重影响性能和算法的扩展性，sklearn会以降维(PCA等)或者一些原型算法(Kmeans，Lasso等，也叫shrinkage)去掉贡献度低的一些维度；

3) 学习以及预测的过程。生成一个算法的预测器Estimator，同时可以自己设置参数，比如K近邻聚类；调用该预测器的fit(x,y)函数对输入数据和结果label进行学习，从中得到学习的结果，即分类器的各种参数；对未知数据进行预测；

4) 反复学习的过程。仅仅使用一个预测器，或者使用一个预测器的一种参数，对未知数据进行预测可能会有不准确性，所以会使用多种策略：把已知的数据分为多份进行多次计算，常用的是k-fold ,k-label-fold, leave-1, leave-1-lable等；多个预测器进行预测，或者独立进行预测，或者组合预测；对一个预测器设置不同的参数进行多次进行预测，同时把数据分组。基本上每一种分类器都有cross- validation(交叉验证)版本，即把预测器加上cv，比如LassoCV。

2、分类算法，以朴素Bayes为例

单一的分类方法主要包括：决策树、贝叶斯、人工神经网络、K-近邻、支持向量机和基于关联规则的分类等；另外还有用于组合单一分类方法的集成学习算法，如Bagging和Boosting等。以下主要介绍朴素贝叶斯。

朴素贝叶斯方法，其中朴素指的是特征条件独立，贝叶斯指的是基于贝叶斯定理。分类：通过学到的概率，给定未分类新实例X，就可以通过上述概率进行计算，得到该实例属于各类的后验概率。具体步骤如下：先计算该实例属于类的概率，再确定该实例所属的分类其中。

下面用具体的sklearn中的案例来说明朴素Bayes分类的应用：

3、回归算法：以 Logistic为例

回归算法是试图采用对误差的衡量来探索变量之间的关系的一类算法。常见的回归算法包括：最小二乘法(Ordinary Least Square)，逻辑回归(Logistic Regression)，逐步式回归(Stepwise Regression)，多元自适应回归样条(Multivariate Adaptive Regression Splines)以及本地散点平滑估计(Locally Estimated Scatterplot Smoothing)。以下主要介绍Logistic回归。

Logistic回归是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法。通常的问题是，研究某些因素条件下某个结果是否发生。根据线性回归可以预测连续的值，对于分类问题，我们需要输出0或者1。所以，在分类模型中需要将连续值转换为离散值。我们可以预测: 当大于等于0.5时，输出为y=1；当小于0.5时，输出为y=0。

4、聚类算法：以 k-means为例

聚类指事先并不知道任何样本的类别标号，通过某算法来把一组未知类别的样本划分成若干类别，叫作 unsupervised learning (无监督学习)。在本文中，我们主要介绍一个比较简单的聚类算法：k-means算法。

我们把样本间的某种距离或者相似性来定义聚类，即把相似的(或距离近的)样本聚为同一类，而把不相似的(或距离远的)样本归在其他类。

k-means算法是一种很常见的聚类算法，它的基本思想是：通过迭代寻找k个聚类的一种划分方案，使得用这k个聚类的均值来代表相应各类样本时所得的总体误差最小。k-means算法的基础是最小误差平方和准则。

k-means 算法的主要实现步骤如下：

1)　　从N个数据对象中随机挑选k 个对象当作聚类的初始聚类的中心，即种子点；

2)　　分别计算剩下其它对象与这些聚类的中心的相似度即其距离，然后将其分别将它们划分给与相似最多的聚类心；

3)　　计算该聚类中所有相关对象的平均值，即点群中心点，然后种子点移动到属于他的“点群”的中心；重复2,3过程，一直到其标准测度的函数开始收敛结束，即种子点没有移动。

三

Python与深度学习

目前常用的深度学习框架包括Caffe、CNTK、TensorFlow、Theano和Torch，keras等。

Caffe开始于2013年底,具有出色的卷积神经网络实现。在计算机视觉领域Caffe依然是最流行的工具包，但对递归网络和语言建模的支持很差。在Caffe中图层需要使用C++定义，而网络则使用Protobuf定义。

CNTK中网络会被指定为向量运算的符号图，运算的组合会形成层。CNTK通过细粒度的构件块让用户不需要使用低层次的语言就能创建新的、复杂的层类型。

TensorFlow是一个理想的RNN(递归神经网络) API和实现，TensorFlow使用了向量运算的符号图方法，使得新网络的指定变得相当容易，但TensorFlow并不支持双向RNN和3D卷积，同时公共版本的图定义也不支持循环和条件控制。

Theano支持大部分先进的网络，现在的很多研究想法都来源于Theano，它引领了符号图在编程网络中使用的趋势。Theano的符号API支持循环控制，让RNN的实现更加容易且高效。

Torch对卷积网络的支持非常好。Torch通过时域卷积的本地接口使得它的使用非常直观。Torch通过很多非官方的扩展支持大量的RNN，同时网络的定义方法也有很多种。与Caffe相比，在Torch中定义新图层非常容易，不需要使用C++编程，图层和网络定义方式之间的区别最小。

本文主要介绍keras，原因如下：

1) 纯Python，方便查看/修改源代码

2) 支持theano和Tensorflow两种模式

3) 配置非常简单，可快速搭建自己的模型

4)文档齐全，社区非常活跃

5)封装的非常好，简单好用

1、Keras框架

1)简单介绍

Keras是基于Theano、TensorFlow的一个深度学习框架，它的设计参考了Torch，用Python语言编写，是一个高度模块化的神经网络库，支持GPU和CPU(使用的文档为http://keras.io/)。以下是深度学习几个说明：

激活函数：加入非线性因素的，因为线性模型的表达能力不够

放弃层(Dropout)：防止过拟合

损失函数：模型试图最小化的目标函数，衡量模型预测的好坏

池化层：Mean pooling(均值采样)、Max pooling(最大值采样)、Overlapping (重叠采样)、L2 pooling(均方采样)、Local Contrast Normalization(归一化采样)、Stochasticpooling(随即采样)、Def-pooling(形变约束采样)。其中最经典的是最大池化，作用是降维,可以扩大感知野

优化算法：最常用的为SGD算法，也就是随机梯度下降算法

全连接层(Dense):负责分类或者回归；全连接层会丢失一些特征位置信息，矩阵乘法，相当于一个特征空间变换，可以把有用的信息提取整合；维度变换，尤其是可以把高维变到低维，同时把有用的信息保留下来。

2)框架搭建

1) 以Windows版本作为基础环境

2) 目前Tensorflow不支持Windows版本，所以本文选用Theano安装

3) Python环境建议使用Anaconda3

4) 安装Theano ,首先要安装C++ 编译器，因为windows下面没有，所以首先安装MinGw，这是一个GCC的编译环境:

1、在cmd中输入conda install mingw libpython

2、配置环境变量：path：C:\Anaconda\MinGW\bin;C:\Anaconda\MinGW\x86_64-w64-mingw32\lib;

3)、path中还要加入：C:\Anaconda2;C:\Anaconda2\Scripts;

注：以以路径请修改为自己的anaconda所在位置

5) 安装theano库

pip install theano

6) 安装keras库

pip install keras

7) 在用户文件夹的.keras子文件夹下找到keras.json，然后记事本编辑改'tensorflow'为'theano'(不能为Theano，必须全部小写，否则报错)

8) 验证keras是否安装成功

>>> import keras

Using Theano backend.

没有报错则恭喜您，深度学习环境已搭建成功！

2、长短期记忆网络

经济学家靠ARMA模型预测的时间序列模型。该模型对小数据集效果很好，可容纳时间序列的记忆效应，如持久性、均值回归、季节性等。在深入学习中，长短期记忆(Long short-term memory，LSTM)可类比于ARIMA。LSTM是一个循环神经网络，能记忆通过网络预先输入的信息。LSTM对RNN进行了结构上的修改，来避免长期依赖问题。

3、卷积神经网络

卷积神经网络(Convolutional Neural Network，CNN)一种专门处理图像的特殊的多层神经网络，包括卷积层(alternating convolutional layer)和池层(pooling layer)。CNN的基本结构一般包括两层，一为特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征。随着该局部特征被提取，它与其它特征间的位置关系也确定下来。二是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。

◢ Part III ◣ 结论分析

一

人工智能因子打分策略

1、策略代码实战

整体策略模型，我们基本都是模块化编写，即各功能都是严格分开编写，方便后续修改，也方便代码重用。各大模块代码实战分析：

1) 提取数据库模块代码分析

该模块功能主要用于从数据库提取数据，但不作任何处理。

核心代码分析：

def conFactor():

该函数为数据库连接模块，顾名思义，就是连接数据库模块

import pyodbc：导入连接数据库驱动模块，pyodbc用于Python连接sql server数据库

import configInfo：导入参数模块，为了方便修改，我们把所有参数放在该模块

sql_data：查询语句，此处功能是查询指定个股指定时间的指定因子值

cur.execute(sql_data)：执行查询语句

for row in cur.fetchall():用于获取所有查询到的数据，然后进行封装。

Python需要严格缩进。否则代码则出错。比如函数体都需要缩进，for循环等也需要缩进。

2) 数据预处理模块

a.没满一年的新股不进行机器学习因子计算：因为需要用最近历史一年的数据作为训练。

b.对于缺失值，用平均值代替，当缺失达到10%，则该因子丢弃。

c. z-score标准化，要求原始数据的分布可以近似为高斯分布，否则效果不好。

对a_value,turnover_1等这一类不不符合高斯分布因子，需要用ln(t1/t0)(同一个股当期与上期比值的对数)进行处理，才近似高斯分布。但对sec_return_1,MACD等这一类变化率等相关因子，直接用原始值便可以，因为他们本身已经近似符合正态分布。

预处理之所有没有处理掉极值和去掉涨跌停个股因子，原因是因为此处只是训练特征，而不是最终选股。再次，我们所选的因子是经过人工核对的，基本没有太多相似性，故也没有降维这一步。

核心代码分析：

from utils import publicVariables：有些公用变量，建议单独建在一个模块，这样方便调用。

from sklearn import preprocessing：导入预处理模块。

temp_factor[i,:] = np.log(factor[i]/temp[i-1])：经验告诉我们，有些因子已经近似为高斯分布，比如动量因子，普通的因子经过取对数后与高斯分布比较接近，比如流动市值因子。

array_data = preprocessing.scale(array_data)：z-score标准化，要求原始数据的分布可以近似为高斯分布，否则效果不好。

3) 中性化处理模块

中性化处理我们包含二层含义，一是市值中性化，二是行业中性化。

首先，我们都知道，市值因子对个股的影响十分显著，如果不考虑市值带来的干扰，则我们的策略可能被市值因子带来严重的影响。为此，我们市值分成20组，分别在不同市值组各选取20%作为策略多头与空头，使多头与空头有相同的市值分布，以消除市值可能带来的影响。

其次，众所周知，不同行业，因子特征可能差异明显，放在一起可能不具备可比性。为了去除行业带来的影响，我们也分别在不同行业选取20%作为我们的空头与多头，使多头与空头保持同样的行业暴露，以消除行业带来的影响。

中性化处理代码相对比较简单，且基本是按照逻辑编写便可，在此不作详细介绍。

4) 机器学习模块

机器学习模块是核心，也是重点，也最简单，因为一般情况下，我们没有特殊要求，直接调用现在的机器学习包便可。重点要注意的是处理好数据成机器学习输入的形式就可以了。一般机器学习算法的输入形式为：自变量为n*m数组，n为样本数量，m为因子个数，因变量为对应的标签列表。

核心代码分析：

k = math.floor(np.sqrt(len(array_data)))：经验参数，n一般少于训练集的平方根。表示n个邻近。

knn=KNeighborsClassifier(n_neighbors=k,weights='distance')：实例化算法，weights为加权方式，weights='distance',对距离加权，可以降低k值设定的影响。

knn.fit(array_data,list_target) ：模型训练拟合。

list_predict = list(knn.predict_proba(array_predict)[:,1])：模型预测结果。

1) 策略计算模块

该模块主要负责计算策略整体评估功能，主要包括：计算多空收益差模块，计算IC模块，分N组计算各组收益模块。主要考虑了以下几种情况：

a. 当期单个因子在全市场缺失达40%时，则该因子丢弃，不进行计算。

b. 调仓当天停牌，涨停，跌停个股剔除。

c. 新股一个月之内不能作为候选股(上市小于20个交易日)。

核心代码分析：

import pandas as pd：导入pandas模块

order_data = pd.Series(order_data)：原型为pd.Series(data, index=index)， data是数据源，可以是Python字典类型，ndarray或者标量值。index代表轴标签，传递列表类型。若index省略，则默认为[0,1,2,…,len(data)-1]

order_data.corr(order_ret)：计算序列order_data与序列order_ret的相关系数。

1) 结果入库模块

该模块功能简单明了，即只是把计算结果保存到数据库。

核心代码分析：

sql = "insert into "+table+tableField+" values("+factors_str+")"：插入数据库语句

cur.execute(sql)：执行插入数据库语句

conn.commit()：提交执行插入数据库语句

except pyodbc.Error as e:

print (sql) ：若执行错误则输出。目的是为了调试，出了问题也方便第一时间找到原因。

2、策略结果(以Logistic为例)

你可能感兴趣的:(python基础模型)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
Xinference如何注册自定义模型玩人工智能的辣条哥人工智能 AI 大模型 Xinference
环境：Xinference问题描述：Xinference如何注册自定义模型解决方案：1.写个model_config.json，内容如下{"version":1,"context_length":2048,"model_name":"custom-llama-3","model_lang":["en","ch"],"model_ability":["generate","chat"],"model
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
第二十 python基础--语句九樱MOL
目录具体内容1：if语句的使用格式判断语句2：if-else的使用格式3：if-elif-else的使用格式4：if嵌套1：while循环的格式循环语句2：while循环嵌套3：for循环的格式一、判断语句在程序中如果某些条件满足，才能做某件事情，而不满足时不允许做，这就是所谓的判断1.1if语句的使用格式if要判断的条件:条件成立时，要做的事情案例:判断年纪，如果age大于18，输入成年age=
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
如何用matlab灵活控制feko的求解 NingrLi matlab 开发语言
https://bbs.rfeda.cn/read.php?tid=3778Feko中的模型和求解设置等都可以通过editfeko进行设置，其文件存储为.pre文件，该文件可以用文本打开，因此，我们可以通过VB、VC、matlab等工具对.pre文件进行读写操作，以达到更灵活的使用feko。同样，对于.out文件，我们也可以进行读操作。熟练使用对.pre文件和.out文件的操作后，我们可以方便的计
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
计算机网络八股总结 Petrichorzncu 八股总结计算机网络笔记
这里写目录标题网络模型划分（五层和七层）及每一层的功能五层网络模型七层网络模型（OSI模型）==三次握手和四次挥手具体过程及原因==三次握手四次挥手TCP/IP协议组成==UDP协议与TCP/IP协议的区别==Http协议相关知识网络地址，子网掩码等相关计算网络模型划分（五层和七层）及每一层的功能五层网络模型应用层：负责处理网络应用程序，如电子邮件、文件传输和网页浏览。主要协议包括HTTP、FTP
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
《算法》四学习——1.1节进阶的Farmer 算法算法笔记
前言买了一本算法4，每天看一点，对每个小结来个学习总结，输出驱动输入。本篇笔记针对第一章基础1.1基础编程模型1.1节总结了相关的语法、语言特性和书中将会用到的库。笔记自己在编码中容易遗漏的点&&优先级比||高在开发中习惯了加括号，所以没注意到这点，教材上也有但是忘记了二分查找中计算mid=left+(right-left)/2这样计算可以有效避免(left+right)/2溢出答疑java无穷大
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite