技术 · 杂谈

GitChat · 安全 | 基于机器学习的 Webshell 发现技术探索

GitChat 作者：兜哥
原文：基于机器学习的 Webshell 发现技术探索
关注公众号：GitChat 技术杂谈，一本正经的讲技术

第十一章WebShell检测

WebShell就是以ASP、PHP、JSP或者CGI等文件形式存在的一种命令执行环境，也可以将其称做为一种网页后门。黑客在入侵了一个网站后，通常会将ASP或PHP后门文件与网站服务器web目录下正常的网页文件混在一起，然后就可以使用浏览器来访问ASP或者PHP后门，得到一个命令执行环境，以达到控制网站服务器的目的。顾名思义，“web”的含义是显然需要服务器开放web服务，“shell”的含义是取得对服务器某种程度上操作权限。WebShell常常被称为入侵者通过网站端口对网站服务器的某种程度上操作的权限。由于WebShell其大多是以动态脚本的形式出现，也有人称之为网站的后门工具。

在攻击链模型中，整个攻击过程分为以下几个步骤：

Reconnaissance（踩点）
Weaponization（组装）
Delivery（投送）
Exploitation（攻击）
Installation（植入）
C2（控制）
Actions （行动

攻击链模型

在针对网站的攻击中，通常是利用上传漏洞，上传WebShell，然后通过WebShell进一步控制web服务器，对应攻击链模型是Install和C2环节。

常见的WebShell检测方法主要有以下几种：

静态检测，通过匹配特征码，特征值，危险函数函数来查找WebShell的方法，只能查找已知的WebShell，并且误报率漏报率会比较高，但是如果规则完善，可以减低误报率，但是漏报率必定会有所提高。

动态检测，执行时刻表现出来的特征，比如数据库操作、敏感文件读取等。

语法检测，根据PHP语言扫描编译的实现方式，进行剥离代码、注释，分析变量、函数、字符串、语言结构的分析方式，来实现关键危险函数的捕捉方式。这样可以完美解决漏报的情况。但误报上，仍存在问题。

统计学检测，通过信息熵、最长单词、重合指数、压缩比等检测。

本章主要以常见的WebShell数据集为例子介绍基于WebShell文件特征的检测技术。介绍WebShell检测使用的数据集以及对应的特征提取方法，介绍使用的模型以及对应的验证结果，包括朴素贝叶斯和深度学习的MLP、CNN。基于WebShell文件访问特征的检测方法不在本章范围内。

数据集

数据集包含WebShell样本2616个，开源软件PHP文件9035个。

WebShell数据来自互联网上常见的WebShell样本，数据来源来自github上相关项目，为了演示方便，全部使用了基于PHP的WebShell样本。

github上WebShell相关项目

白样本主要使用常见的基于PHP的开源软件，主要包括以下几种。

WordPress

WordPress是一种使用PHP语言开发的博客平台，用户可以在支持PHP和MySQL数据库的服务器上架设属于自己的网站。也可以把 WordPress当作一个内容管理系统（CMS）来使用。

WordPress是一款个人博客系统，并逐步演化成一款内容管理系统软件，它是使用PHP语言和MySQL数据库开发的。用户可以在支持 PHP 和 MySQL数据库的服务器上使用自己的博客。

WordPress有许多第三方开发的免费模板，安装方式简单易用。不过要做一个自己的模板，则需要你有一定的专业知识。比如你至少要懂的标准通用标记语言下的一个应用HTML代码、CSS、PHP等相关知识。WordPress官方支持中文版，同时有爱好者开发的第三方中文语言包，如wopus中文语言包。WordPress拥有成千上万个各式插件和不计其数的主题模板样式。

项目地址为：https://wordpress.org/

WordPress主页

PHPCMS

PHPCMS是一款网站管理软件。该软件采用模块化开发，支持多种分类方式，使用它可方便实现个性化网站的设计、开发与维护。它支持众多的程序组合，可轻松实现网站平台迁移，并可广泛满足各种规模的网站需求，可靠性高，是一款具备文章、下载、图片、分类信息、影视、商城、采集、财务等众多功能的强大、易用、可扩展的优秀网站管理软件。

PHPCMS由国内80后知名创业者钟胜辉（网名：淡淡风）于2005年创办，是国内知名的站长建站工具。2009年，PHPCMS创办人钟胜辉离开PHPCMS，创办国内针对媒体领域的CMS产品CmsTop（思拓合众）。

项目地址为：http://www.phpcms.cn/

phpcms主页

phpMyAdmin

phpMyAdmin 是一个以PHP为基础，以Web-Base方式架构在网站主机上的MySQL的数据库管理工具，让管理者可用Web接口管理MySQL数据库。借由此Web接口可以成为一个简易方式输入繁杂SQL语法的较佳途径，尤其要处理大量资料的汇入及汇出更为方便。其中一个更大的优势在于由于phpMyAdmin跟其他PHP程式一样在网页服务器上执行，但是您可以在任何地方使用这些程式产生的HTML页面，也就是于远端管理MySQL数据库，方便的建立、修改、删除数据库及资料表。也可借由phpMyAdmin建立常用的php语法，方便编写网页时所需要的sql语法正确性。

项目地址为：https://www.phpMyAdmin.net/

phpMyAdmin主页

Smarty

Smarty是一个使用PHP写出来的模板引擎，是目前业界最著名的PHP模板引擎之一。它分离了逻辑代码和外在的内容，提供了一种易于管理和使用的方法，用来将原本与HTML代码混杂在一起PHP代码逻辑分离。简单的讲，目的就是要使PHP程序员同前端人员分离，使程序员改变程序的逻辑内容不会影响到前端人员的页面设计，前端人员重新修改页面不会影响到程序的程序逻辑，这在多人合作的项目中显的尤为重要。

项目地址为：https://github.com/smarty-php/smarty

Yii

Yii是一个基于组件的高性能PHP框架，用于开发大型Web应用。Yii采用严格的OOP编写，并有着完善的库引用以及全面的教程。从 MVC，DAO/ActiveRecord，widgets，caching，等级式RBAC，Web服务，到主题化，I18N和L10N，Yii提供了今日Web 2.0应用开发所需要的几乎一切功能。事实上，Yii是最有效率的PHP框架之一。

Yii是一个高性能的PHP5的web应用程序开发框架。通过一个简单的命令行工具 yiic 可以快速创建一个web应用程序的代码框架，开发者可以在生成的代码框架基础上添加业务逻辑，以快速完成应用程序的开发。

项目地址为：http://www.yiiframework.com/

Yii主页

特征提取

方法一：词袋&TF-IDF模型

我们使用最常见的词袋模型&TF-IDF提取文件特征。

把一个PHP文件作为一个完整的字符串处理，定义函数load_one_file加载文件到一个字符串变量中返回。

def load_one_file(filename):
    x=""
    with open(filename) as f:
        for line in f:
            line = line.strip('\r')
            x+=line
    return x

由于开源软件中包含大量图片、js等文件，所以遍历目录时需要排除非php文件。另外开源软件的目录结构相对复杂，不像前面章节的垃圾邮件、垃圾短信等是平面目录结构，所以要求我们递归访问指定目录并加载指定文件。

def load_files_re(dir):
    files_list = []
    g = os.walk(dir)
    for path, d, filelist in g:
        for filename in filelist:
            if filename.endswith('.php'):
                fulepath =
os.path.join(path, filename)
                print "Load %s"
% fulepath
                t = load_file(fulepath)
                files_list.append(t)
    return files_list

加载搜集到的WebShell样本，并统计样本个数，将WebShell样本标记为1。

WebShell_files_list = load_files_re(WebShell_dir)
y1=[1]*len(WebShell_files_list)
black_count=len(WebShell_files_list)

加载搜集到的开源软件样本，并统计样本个数，将开源软件样本标记为0。

wp_files_list =load_files_re(whitefile_dir)
y2=[0]*len(wp_files_list)
white_count=len(wp_files_list)

将WebShell样本和开源软件样本合并。

x=WebShell_files_list+wp_files_list
y=y1+y2

使用2-gram提取词袋模型，并使用TF-IDF进行处理。

CV = CountVectorizer(ngram_range=(2, 2),
decode_error="ignore",max_features=max_features,
token_pattern = r'\b\w+\b',min_df=1, max_df=1.0)
x=CV.fit_transform(x).toarray()
transformer = TfidfTransformer(smooth_idf=False)
x_tfidf = transformer.fit_transform(x)
x = x_tfidf.toarray()

所谓的2-gram是词袋模型的一个细分类别，也有的机器学习书籍里面单独把2-gram或者说n-gram作为单独的模型介绍。n-gram基于这样一种假设，第n个单词只和它前面的n-1个词有关联，每n个单词作为一个处理单元。

2-gram举例

通过设置CountVectorizer函数的ngram_range参数和token_pattern即可实现n-gram，其中ngram_range表明n-gram的n取值范围，如果是2-gram设置成（2，2）即可。token_pattern表明词切分的规则，通常设置为r'\b\w+\b'即可。

划分训练集与测试集，测试集的比例为40%。

x_train, x_test, y_train,y_test = train_test_split(x, y, test_size=0.4, random_state=0)

方法二：opcode&n-gram模型

opcode是计算机指令中的一部分，用于指定要执行的操作，指令的格式和规范由处理器的指令规范指定。除了指令本身以外通常还有指令所需要的操作数，可能有的指令不需要显式的操作数。这些操作数可能是寄存器中的值，堆栈中的值，某块内存的值或者IO端口中的值等等。通常opcode还有另一种称谓：字节码(byte codes)。例如Java虚拟机(JVM)，.NET的通用中间语言(CIL: Common Intermeditate Language)等等。PHP中的opcode则属于前面介绍中的后着，PHP是构建在Zend虚拟机(Zend VM)之上的。

PHP的opcode就是Zend虚拟机中的指令，常见的opcode如下图所示。

PHP常见opcode

通常可以通过PHP的VLD（Vulcan Logic Dumper，逻辑代码展现)是扩展来查看PHP文件对应的opcode。

wget http://pecl.php.net/get/vld-0.13.0.tgz

tar zxvf vld-0.13.0.tgz

cd ./vld-0.13.0

/configure--with-php-config=/usr/local/php/bin/php-config --enable-vld

make && makeinstall

然后在php.ini配置文件中添加extension=vld.so 用于激活VLD，其中php.ini默认位置位于lib目录中。VLD还可以从github上下载并安装，步骤为：

git clone https://github.com/derickr/vld.git

cd vld

phpize

./configure

make && makeinstall

VLD项目的主页为：

http://pecl.php.net/package/vld

VLD扩展下载主页

以PHP文件hello.php为例：

 

   echo"Hello World";

   $a = 1 +1;

   echo $a;

?>

通过使用PHP的VLD扩展查看对应的opcode，其中vld.active=1表示激活VlD，vld.execute=0表示只解析不执行。

php -dvld.active=1 -dvld.execute=0hello.php

显示结果为：

function name:  (null)

number of ops:  5

compiled vars:  !0 = $a

line     #* E I O op                         fetch          ext  return  operands

\-----------------------------------------------------------------------------

   2     0  E >  ECHO                                              'Hello+World'

   3     1       ADD                                            ~0      1, 1

         2       ASSIGN                                                 !0, ~0

   4     3       ECHO                                                   !0

   6     4     > RETURN                                                 1



branch: #  0; line:    2-    6; sop:     0; eop:     4; out1:  -2

path #1: 0,

对应的opcode为：

ECHO     

ADD       

ASSIGN

ECHO

以一个常见的一句话木马为例：



         echo $_GET['r'];

?>

通过VLD查看的结果为：

function name:  (null)

number of ops:  5

compiled vars:  none

line     #* E I O op                         fetch          ext  return  operands

\-------------------------------------------------------------------------------------

   2     0  E >  FETCH_R                     global              $0     '_GET'

         1       FETCH_DIM_R                                    $1      $0, 'r'

         2       ECHO                                                   $1

   4     3       ECHO                                                   '+%0A'

         4     > RETURN                                                 1



branch: #  0; line:    2-    4; sop:     0; eop:     4; out1:  -2

path #1: 0,

对应的opcode为：

FETCH_R

FETCH_DIM_R 

ECHO 

ECHO

RETURN

使用2-gram对opcode进行分组，结果为：

(FETCH_R, FETCH_DIM_R) (FETCH_DIM_R, ECHO) (ECHO, ECHO) (ECHO, RETURN)

完整的处理流程为：

PHP代码处理流程图

代码实现方面，首先使用VLD处理PHP文件，把处理的结果保存在字符串中。

t=""
cmd=php_bin+" -dvld.active=1 -dvld.execute=0 "+file_path
output=commands.getoutput(cmd)

PHP的opcode都是由大写字母和下划线组成的单词，使用findall函数从字符串中提取全部满足条件的opcode，并以空格连接成一个新字符串。

t=output
tokens=re.findall(r'\s(\b[A-Z_]+\b)\s',output)
t=" ".join(tokens)

遍历读取指定目录下全部PHP文件，保存其对应的opcode字符串。

def
load_files_opcode_re(dir):
    files_list = []
    g = os.walk(dir)
    for path, d, filelist in g:
        for filename in filelist:
            if filename.endswith('.php')
:
                fulepath =
os.path.join(path, filename)
                print "Load %s
opcode" % fulepath
                t =
load_file_opcode(fulepath)
                files_list.append(t)
    return files_list

依次读取保存WebShell样本以及正常PHP文件的目录，加载对应的opcode字符串，其中标记WebShell为1，正常PHP文件为0。

WebShell_files_list
= load_files_re(WebShell_dir)
y1=[1]*len(WebShell_files_list)
black_count=len(WebShell_files_list)
wp_files_list =load_files_re(whitefile_dir)
y2=[0]*len(wp_files_list)
white_count=len(wp_files_list)

使用2-gram处理opcode字符串,其中通过设置ngram_range=(2, 2)就可以达到使用2-gram的目的，同理如果使用3-gram设置ngram_range=(3, 3)即可。

CV
= CountVectorizer(ngram_range=(2, 2), decode_error="ignore",max_features=max_features,
token_pattern = r'\b\w+\b',min_df=1, max_df=1.0)
x=CV.fit_transform(x).toarray()

使用TF-IDF进一步处理。

transformer
= TfidfTransformer(smooth_idf=False)
x_tfidf = transformer.fit_transform(x)
x = x_tfidf.toarray()

另外，开发调试阶段会频繁解析相同的PHP文件获取对应的opcode，可以使用PHP的opcode缓存技术提高效率。opcode缓存技术[6]可以有效减少不必要的编译步骤，减少cpu和内存的消耗。正常情况下PHP代码的执行过程会经历文本扫描、语法解析、创建opcode、执行opcode这几部。

未使用opcode缓存的情况下PHP代码执行过程

使用了opcode缓存技术后，对于曾经解析过的PHP文件，opcode会缓存下来，遇到同样内容的PHP文件就可以直接进入opcode执行阶段。

使用opcode缓存的情况下PHP代码执行过程.

开启opcode的缓存功能非常方便，PHP 5.5.0以后在编译PHP源码的时候开启–enable-opcache，编译选型为：

./configure--prefix=/opt/php --enable-opcache

config.status:creating php5.spec

config.status:creating main/build-defs.h

config.status:creating scripts/phpize

config.status:creating scripts/man1/phpize.1

config.status:creating scripts/php-config

config.status:creating scripts/man1/php-config.1

config.status:creating sapi/cli/php.1

config.status:creating sapi/cgi/php-cgi.1

config.status:creating ext/phar/phar.1

config.status:creating ext/phar/phar.phar.1

config.status:creating main/php_config.h

config.status:executing default commands

编译安装

make-j4 & make install

修改配置文件php.ini，加载对应的动态库。

zend_extension=/full/path/to/opcache.so

配置opcode缓存对应的配置选项,典型的配置内容如下所示。

engine= On

zend_extension=/lib/php/extensions/no-debug-non-zts-20131226/opcache.so

opcache.memory_consumption=128

opcache.interned_strings_buffer=8

opcache.max_accelerated_files=4000

opcache.revalidate_freq=60

opcache.fast_shutdown=1

opcache.enable_cli=1

opcache.enable=1

方法三：opcode调用序列模型

在opcode&n-gram模型中，我们假设第n个opcode之与前n-1个opcode有关联，现在我们以一个更加长的时间范围来看opcode的调用序列，把整个PHP的opcode当成一个调用序列来分析，为了便于程序处理，截取整个文件opcode的固定长度的opcode序列分析，超过固定长度的截断，不足的使用0补齐。以一个常见的一句话木马为例：



         echo $_GET['r'];

?>

图11-13 解析PHP文件获取opcode调用序列的过程

该文件通过VLD处理获得对应的opcode为：

FETCH_R

FETCH_DIM_R 

ECHO 

ECHO

RETURN

获得对应的opcode序列为：

（FETCH_R，FETCH_DIM_R，ECHO，ECHO，RETURN ）

模型训练与验证

方法一：朴素贝叶斯算法

使用朴素贝叶斯算法，特征提取使用词袋&TF-IDF模型，完整的处理流程为：

将WebShell样本以及常见PHP开源软件的文件提取词袋。
使用TF-IDF处理。
随机划分为训练集和测试集。
使用朴素贝叶斯算法在训练集上训练，获得模型数据。
使用模型数据在测试集上进行预测。
验证朴素贝叶斯算法预测效果。

特征提取使用词袋&TF-IDF模型算法使用朴素贝叶斯的流程图

实例化朴素贝叶斯算法，并在训练集上训练数据，针对测试集进行预测。

gnb = GaussianNB()
gnb.fit(x_train,y_train)
y_pred=gnb.predict(x_test)

评估结果的准确度和TP、FP、TN、FN四个值。

print metrics.accuracy_score(y_test, y_pred)
print metrics.confusion_matrix(y_test, y_pred)

在词袋最大特征数为15000的情况下，使用词袋&TF-IDF模型时，TP、FP、TN、FN矩阵如下表所示。

表1-1 基于词袋&TF-IDF模型的朴素贝叶斯验证结果

类型名称**	相关**	不相关**
检索到	3566	52
未检索到	71	972

整个系统的准确率为94.92%，召回率为93.19%。

完整输出结果为：

metrics.accuracy_score:

0.97361081313

metrics.confusion_matrix:

[[3566   52]

 [  71  972]]

metrics.precision_score:

0.94921875

metrics.recall_score:

0.931927133269

metrics.f1_score:

0.940493468795

方法二：深度学习算法之MLP

使用MLP算法，隐含层设计为2层，每次节点数分别为5和2。

MLP隐藏层设计

使用MLP算法，特征提取使用词袋&TF-IDF模型，完整的处理流程为：

将WebShell样本以及常见PHP开源软件的文件提取词袋。
使用TF-IDF处理。
随机划分为训练集和测试集。
使用MLP算法在训练集上训练，获得模型数据。
使用模型数据在测试集上进行预测。
验证MLP算法预测效果。

实例化MLP算法，并在训练集上训练数据，针对测试集进行预测。

clf = MLPClassifier(solver='lbfgs',
                    alpha=1e-5,
                    hidden_layer_sizes =
(5, 2),
                    random_state = 1)
print  clf
clf.fit(x_train, y_train)
y_pred = clf.predict(x_test)

评估结果的TP、FP、TN、FN四个值。

print metrics.accuracy_score(y_test, y_pred)
print metrics.confusion_matrix(y_test, y_pred)

评估结果的准确率与召回率以及F1分值。

print "metrics.precision_score:"
print metrics.precision_score(y_test, y_pred)
print "metrics.recall_score:"
print metrics.recall_score(y_test, y_pred)
print "metrics.f1_score:"
print metrics.f1_score(y_test,y_pred)

在词袋最大特征数为15000且同时使用TF-IDF模型的情况下， TP、FP、TN、FN矩阵如下表所示。

表1-2 基于词袋和TF-IDF模型的MLP验证结果

类型名称**	相关**	不相关**
检索到	3583	35
未检索到	51	992

准确率为96.59%，召回率为95.11%。

完整输出结果为：

metrics.confusion_matrix:

[[3583   35]

 [  51  992]]

metrics.precision_score:

0.965920155794

metrics.recall_score:

0.951102588686

metrics.f1_score:

0.95845410628

使用MLP算法，特征提取使用特征提取使用opcode&n-gram,完整的处理流程为：

将WebShell样本以及常见PHP开源软件的文件提取opcode.
使用n-gram处理。
随机划分为训练集和测试集。
使用MLP算法在训练集上训练，获得模型数据。
使用模型数据在测试集上进行预测。
验证MLP算法预测效果。

特征提取使用opcode&n-gram,n取4，最大特征数取2000的情况下，TP、FP、TN、FN矩阵如下表所示。

表1-3 基于opcode&n-gram模型的MLP验证结果

类型名称**	相关**	不相关**
检索到	2601	97
未检索到	20	484

准确率为83.30%，召回率为96.03%。

完整输出结果为：

0.963460337289

metrics.confusion_matrix:

[[2601   97]

 [  20 484]]

metrics.precision_score:

0.833046471601

metrics.recall_score:

0.960317460317

metrics.f1_score:

0.892165898618

方法三：深度学习算法之CNN

使用方法二中生成的opcode&n-gram数据，算法使用CNN，完整的处理流程为：

将WebShell样本以及常见PHP开源软件的文件提取opcode.
使用n-gram处理。
随机划分为训练集和测试集。
使用CNN算法在训练集上训练，获得模型数据。
使用模型数据在测试集上进行预测。
验证CNN算法预测效果。

使用方法二中生成的opcode&n-gram数据，获得训练数据集和测试数据集。

x, y = get_feature_by_opcode()

x_train, x_test, y_train, y_test = train_test_split(x, y,test_size = 0.4, random_state = 0)

将训练和测试数据进行填充和转换，不到最大长度的数据填充0，由于是二分类问题，把标记数据二值化。定义输入参数的最大长度为文档的最大长度。

trainX = pad_sequences(trainX, maxlen=max_document_length,
value=0.)
testX = pad_sequences(testX, maxlen=max_document_length, value=0.)
# Converting labels to binary vectors
trainY = to_categorical(trainY, nb_classes=2)
testY = to_categorical(testY, nb_classes=2)

network = input_data(shape=[None,max_document_length],name='input')

定义CNN模型，使用3个数量为128，长度分别为3、4、5的一维卷积函数处理数据。

network = tflearn.embedding(network, input_dim=1000000,
output_dim=128)
branch1 = conv_1d(network, 128, 3, padding='valid', activation='relu',
regularizer="L2")
branch2 = conv_1d(network, 128, 4, padding='valid', activation='relu',
regularizer="L2")
branch3 = conv_1d(network, 128, 5, padding='valid', activation='relu',
regularizer="L2")
network = merge([branch1, branch2, branch3], mode='concat', axis=1)
network = tf.expand_dims(network, 2)
network = global_max_pool(network)
network = dropout(network, 0.8)
network = fully_connected(network, 2, activation='softmax')
network = regression(network, optimizer='adam', learning_rate=0.001,
loss='categorical_crossentropy', name='target')

实例化CNN对象并进行训练数据，一共训练5轮。

model = tflearn.DNN(network, tensorboard_verbose=0)
model.fit(trainX, trainY,
          n_epoch=5, shuffle=True,
validation_set=0.1,
          show_metric=True,
batch_size=100,run_id="webshell")

完整的CNN结构如下图所示。

用于识别WebShell的CNN结构图

考核CNN对应的准确率、召回率，误报数和漏报数。

print "metrics.accuracy_score:"
print metrics.accuracy_score(y_test, y_pred)
print "metrics.confusion_matrix:"
print metrics.confusion_matrix(y_test, y_pred)
print "metrics.precision_score:"
print metrics.precision_score(y_test, y_pred)
print "metrics.recall_score:"
print metrics.recall_score(y_test, y_pred)
print "metrics.f1_score:"
print metrics.f1_score(y_test,y_pred)

运行程序，经过5轮训练，在的情况下，使用opcode&n-gram模型时，n取4，TP、FP、TN、FN矩阵如下表所示。

表1-4 基于opcode&n-gram模型的CNN验证结果

类型名称**	相关**	不相关**
检索到	2669	29
未检索到	367	137

整个系统的准确率为82.53%，召回率为27.18%。

完整输出结果为：

metrics.accuracy_score:

0.87632729544

metrics.confusion_matrix:

[[2669   29]

 [ 367 137]]

metrics.precision_score:

0.825301204819

metrics.recall_score:

0.271825396825

metrics.f1_score:

0.408955223881

使用方法三中生成的opcode序列数据，算法使用CNN，完整的处理流程为：

将WebShell样本以及常见PHP开源软件的文件提取opcode.
使用词袋处理，针对opcode进行编号，生成opcode序列。
随机划分为训练集和测试集。
使用CNN算法在训练集上训练，获得模型数据。
使用模型数据在测试集上进行预测。
验证CNN算法预测效果。

使用方法三中opcode调用序列编码后的数据，获得训练数据集和测试数据集。

x_train, x_test, y_train, y_test= get_feature_by_opcode ()

运行程序，经过5轮训练，在opcode序列长度为3000的情况下，使用opcode序列模型时，TP、FP、TN、FN矩阵如下表所示。

表1-5 基于opcode序列模型的CNN验证结果

类型名称**	相关**	不相关**
检索到	2685	13
未检索到	89	415

整个系统的准确率为96.96%，召回率为82.34%。

完整输出结果为：

metrics.accuracy_score:

0.968144909432

metrics.confusion_matrix:

[[2685   13]

 [  89 415]]

metrics.precision_score:

0.969626168224

metrics.recall_score:

0.823412698413

metrics.f1_score:

0.890557939914

本章小结

本章基于搜集的PHP的WebShell数据集介绍了WebShell的识别方法。针对PHP的WebShell数据集，特征提取方法有词袋&TF-IDF、opcode&n-gram以及opcode序列三种方法。训练模型介绍了朴素贝叶斯以及深度学习的MLP和CNN算法，其中基于基于词袋和TF-IDF模型的MLP准确率和召回率综合表现最佳，基于opcode序列模型的CNN准确率较高。

http://www.darkreading.com/attacks-breaches/leveraging-the-kill-chain-for-awesome/a/d-id/1317810
http://www.freebuf.com/news/80820.html
http://www.cnxct.com/pecker-scanner-beta-release-support-cloud-confirmation/
http://blog.csdn.net/u011066706/article/details/51175971
http://www.nowamagic.net/librarys/veda/detail/1325
http://www.cnblogs.com/JohnABC/p/4531029.html

实录：《刘焱：基于机器学习发现 Webshell 实战解析》

彩蛋

重磅 Chat 分享：《一场 Chat 让你搞清 BAT 程序员的技术职级》

分享人：
胜洪宇，一线互联网公司前端技术组长，掘金签约作者，前端博客博主，所讲课程帮助超过20万前端小伙伴学习。
Chat简介：
很多程序员向往进入 BAT 这样的大型互联网公司，但是又不知道他们如何评定技术职级。
- 阿里集团薪资职级如何划分？让你快速得到马云的青睐。
- 在百度明白这些，你将快速晋升。
- 腾讯职级里的小秘密，这样工作你会更强。
一场 Chat 让你搞清 BAT 的技术评价体系，为您进入超级互联网公司指明技术方向，时刻做好准备！如果您希望您的技术团队也像这些互联网巨头一样强大，本场 Chat 我将帮您马上模仿建立有效的技术职级体系。

想要免费参与本场 Chat ？很简单，「GitChat技术杂谈」公众号后台回复「BAT」

你可能感兴趣的:(安全,人工智能专栏)

零基础小白学习网络安全的必备指南！ Stanford_1106 学习网络运维网络微信开放平台微信小程序微信公众平台 twitter web安全安全
成长路上不孤单【14后///计算机爱好者///持续分享所学///如有需要欢迎收藏转发///】今日分享关于网络安全方面的相关内容！关于【网络安全】目录：一、了解网络安全基础知识二、学习计算机和网络基础知识三、掌握网络安全技术四、使用网络安全工具五、实战操作六、了解法律法规与职业道德七、持续学习与提升网络安全对于现代社会的重要性不言而喻，它关乎到个人信息安全、企业机密保护乃至国家安全。然而，对于许多零
数据传输中遇到问题要怎么解决 sanx18 网络数据库
在数据传输过程中遇到问题时，可以采取以下几种解决方案：1.**使用可靠的传输协议**：选择稳定性和可靠性高的传输协议，如HTTPS、SFTP、FTPS等，它们提供了加密和安全的数据传输机制。2.**创建冗余备份**：在不同的存储设备中保存数据的多个副本，即使在传输过程中发生故障或错误，也可以从备份中恢复数据。云存储服务和网络存储设备是实现冗余备份的常见选择。3.**数据压缩和加密**：通过压缩减少
如何完美的实现一个线程安全的单例模式？ coding_-_半生设计模式单例模式 java
单例模式文章目录单例模式一、介绍二、单例的几种实现方式三、细分实现方式1、饿汉模式2、懒汉模式四、总结优缺点一、介绍一个类只有一个实例，旨在确保类只有一个实例，并提供全局访问点以访问该实例。唯一实例:类只能有一个实例存在。全局访问点:提供一个访问该实例的全局接口，以便其他类可以轻松地访问它。二、单例的几种实现方式饿汉模式、懒汉模式懒汉式:在需要时才创建实例。这种方法在多线程环境下需要考虑线程安全性
VPN是什么？高校为什么用？创意锦囊网络
虚拟专用网络（VPN）：隐私保护与安全上网的利器随着互联网的普及和网络安全威胁的增加，越来越多的人开始关注如何在网上保护自己的隐私和安全。虚拟专用网络（VPN，VirtualPrivateNetwork）作为一种有效的解决方案，正受到广泛关注和使用。本文将详细介绍VPN的工作原理及其优势，帮助您全面了解VPN的功能和应用场景。VPN的工作原理VPN是一种通过加密隧道技术将用户的设备与互联网资源连接
从SSL到TLS——互联网传输的护卫军创意锦囊 ssl 网络安全
在这个信息化高度发展的时代，我们每天都在不知不觉中接触到大量的网络传输协议，但大多数人对于这些协议背后的技术并不清楚。TLS（TransportLayerSecurity）就是这样一种守护网络传输安全的技术，悄然为我们保驾护航。TLS的前身是SSL（SecureSocketsLayer），如今已发展成互联网传输协议的基石。今天，我们就来聊聊TLS的发展历程，从SSL到TLS，它是如何一步步成为互联
【SpringBoot实现xss防御】龙少9543 后端 spring boot xss 后端
SpringBoot实现xss防御在SpringBoot中实现XSS防御，可以通过多种方式来确保输入的安全性和防止恶意脚本的注入。下面提供了一些具体的实现代码示例，包括输入清理、输出编码以及设置安全响应头。1.输入清理创建一个简单的工具类来进行HTML转义：importorg.jsoup.Jsoup;importorg.jsoup.nodes.Document.OutputSettings;imp
青少年编程与数学 02-007 PostgreSQL数据库应用 12课题、存储过程编写明月看潮生编程与数学第02阶段数据库青少年编程 postgresql 编程与数学
青少年编程与数学02-007PostgreSQL数据库应用12课题、存储过程编写一、存储过程二、分类三、创建四、调用五、修改六、删除七、应用示例八、内置存储过程课题摘要:本课题详细介绍了PostgreSQL中存储过程的编写和操作。存储过程是一系列SQL语句的集合，可作为单元保存在数据库中，用于执行数据查询、更新、插入和删除等操作。它们具有封装性、提高性能、增强安全性、事务管理、参数化和返回结果等特
使用宝塔面板以jar包方式部署SpringBoot个人博客（以IP+端口号访问） emmastone 部署 spring boot ssh centos 服务器
使用宝塔面板以jar包方式部署SpringBoot个人博客购买阿里云服务器ECS在服务器端创建数据库修改SpringBoot项目的配置文件上传jar包和配置文件到服务器同一个目录下放行相关端口号首先需要在阿里云的控制台放行相关端口号然后在宝塔面板的安全放行相关端口号购买阿里云服务器ECS购买ECS服务器时，选择附带宝塔面板的，会默认安装好LAMP（Apache+Mysql+php），只需在安装to
ChatGPT搜索漏洞：AI代码生成器安全隐患及应对策略前端
近年来，随着人工智能技术的飞速发展，各种AI代码生成器层出不穷，为程序员带来了极大的便利。然而，技术进步的同时也伴随着安全风险的提升。最近，OpenAI的ChatGPT搜索工具曝出重大安全漏洞，引发了业界广泛关注。本文将深入探讨该漏洞的细节、影响以及应对措施，并展望未来AI工具安全发展趋势。ChatGPT作为一款强大的AI工具，其搜索功能本意是帮助用户快速获取信息。然而，英国卫报近期报道揭露了Ch
日志管理系统的系统目标是什么？运维日志管理
在网络安全、数据管理、故障排查等领域，日志都被广泛使用并需要进行有效的管理与分析。因此，日志管理系统的系统目标显得尤为重要，如以下几方面。1、确保数据的安全性及完整性在企业和组织的日常运营中，各类信息数据都会通过系统生成和传递，而这种数据往往是宝贵且敏感的。日志管理系统需要确保生成的日志信息被准确记录、安全保存，非授权人员无法篡改或删除，从而保证数据的完整性和真实性。2、数据的存储和检索大量的日志
基于云端的SIEM解决方案运维
最近的一项市场研究爆出了一组惊人的数字，在2024年，网络攻击增加了600%！更加令人担忧的是，这恐怕只是冰山一角。世界各地的组织都已经认识到了这一威胁，并正在采取多重措施来抵御来自线下和远程混合式办公模式带来的网络安全问题。尽管如此，根据福布斯顾问提供的数据，2023年数据泄露事件仍然增加了72%，2365次网络攻击影响了3.43亿受害者，比两年前创下的历史纪录大幅增加。随着企业的数字化转型，受
deepin分享-Linux 磁盘分区和挂载指南 deepin
在Linux系统中(如deepin等)，磁盘分区和挂载是系统管理的重要组成部分。了解如何进行分区、格式化和挂载操作，可以帮助你更好地管理磁盘空间，优化系统性能，并确保数据的安全存储。本文将详细介绍Linux磁盘分区和挂载的基本概念、操作步骤以及一些实用的命令。1.基本概念Linux系统采用了一种独特的文件系统结构，无论系统中有多少个分区，它们最终都归属于一个根目录（/），形成一个统一的文件系统。每
证券会工程师：重视证券期货业信息安全 weixin_34087307 系统安全运维网络
本文讲的是证券会工程师：重视证券期货业信息安全，2009中国计算机网络安全应急年会于2009年10月21日至24日在湖南长沙召开，本届年会主题是“网络促进发展安全创造价值”。23日进入会议第二天，本次会议众专家学者探讨了有关电子商务安全方面的问题，下面为中国证监会信息中心总工程师罗凯谈话实录：林鹏：大家下午好，我们这里本次分论坛——金融安全与电子商务作为分论坛的主题。这个活动得到金融界高度的关注。
java经典面试题及答案：集合心有猛虎嗷嗷叫 java 面试题集合 java
1、常用的集合有哪些？集合框架分为两类：Map和Collection，实现类分别有1）Map：HashMap、TreeMap、HashTable和ConcurrentHashMap2）Collection：List接口实现类有ArrayList和LinkedList；Set实现类有TreeSet和HashSet2、HashMap和HashTable的区别？1）HashMap是线程不安全的，Hash
Java中Queue集合的面试试题及答案解析 HappyAcmen java面试题相关总结 java 面试开发语言后端
Java集合类是Java编程中非常重要的一部分，主要用于存储和管理对象。以下是一些常见的Java集合类及其简要介绍：List接口ArrayList：基于动态数组实现，支持随机访问元素，适合频繁的索引操作，但插入和删除元素时可能需要移动大量元素，效率相对较低。LinkedList：基于双向链表实现，插入和删除元素的效率高，但随机访问元素的速度较慢。Vector：线程安全的ArrayList，但在多线
Java中Map集合面试试题解析 HappyAcmen java面试题相关总结 java 面试开发语言
Java集合类是Java编程中非常重要的一部分，主要用于存储和管理对象。以下是一些常见的Java集合类及其简要介绍：List接口ArrayList：基于动态数组实现，支持随机访问元素，适合频繁的索引操作，但插入和删除元素时可能需要移动大量元素，效率相对较低。LinkedList：基于双向链表实现，插入和删除元素的效率高，但随机访问元素的速度较慢。Vector：线程安全的ArrayList，但在多线
Java中Set集合的面试试题及答案解析 HappyAcmen java面试题相关总结 java 面试开发语言
Java集合类是Java编程中非常重要的一部分，主要用于存储和管理对象。以下是一些常见的Java集合类及其简要介绍：List接口ArrayList：基于动态数组实现，支持随机访问元素，适合频繁的索引操作，但插入和删除元素时可能需要移动大量元素，效率相对较低。LinkedList：基于双向链表实现，插入和删除元素的效率高，但随机访问元素的速度较慢。Vector：线程安全的ArrayList，但在多线
第十五章：组织保障（15.1信息和文档管理--15.2配置管理） HappyAcmen 系统集成项目管理工程师第三版数据库网络运维
15.1信息和文档管理15.1.1信息和文档1.信息系统信息信息系统中的信息可以分为用户信息、业务信息、经营管理信息和系统运行信息等。2.信息系统文档类型含义包括开发文档描述开发过程本身①可行性研究报告和项目任务书;②需求规格说明;③功能规格说明;④设计规格说明，包括程序和数据规格说明;⑤开发计划;⑥软件集成和测试计划;⑦质量保证计划;⑧安全和测试信息产品文档描述开发过程的产物①培训手册;②参考手
Java中List集合的面试试题及答案解析 HappyAcmen java面试题相关总结 java list 面试
Java集合类是Java编程中非常重要的一部分，主要用于存储和管理对象。以下是一些常见的Java集合类及其简要介绍：List接口ArrayList：基于动态数组实现，支持随机访问元素，适合频繁的索引操作，但插入和删除元素时可能需要移动大量元素，效率相对较低。LinkedList：基于双向链表实现，插入和删除元素的效率高，但随机访问元素的速度较慢。Vector：线程安全的ArrayList，但在多线
群晖NAS备份建议及备份方式江东网群晖NAS存储数据库
我们都知道，数据备份建议3-2-1原则，至少要有3份数据备份，将这些数据备份存放在2种不同的存储设备上，至少异地备份1份。这样才能确保我们的数据安全。那怎样把群晖NAS内的数据备份到本地或异地呢？群晖提供以下几种备份方式：备份到另一台群晖NASHyperBackup:数据、应用程序和系统设置进行自动备份ActiveBackupforBusiness:支持整机备份DSM系统，支持文件级还原Snaps
C++ 线程安全之互斥锁 __雨夜星辰__ c++开发语言学习笔记 visual studio 多线程
目录线程安全1.原子性2.可见性3.顺序性互斥锁1.mutex类2.timed_mutex类3.recursive_mutex类4.lock_guard类线程安全线程安全是多线程编程是的计算机程序代码中的一个概念。在拥有共享数据的多条线程并行执行的程序中，线程安全的代码会通过同步机制保证各个线程都可以正常且准确的执行，不会出现数据污染等意外情况。上述是百度百科给出的一个概念解释。换言之，线程安全就
计算机网络基础知识点简记 UV Youth 计算机网络网络
OSI七层网络模型TCP/IP四层网络模型模型图解IP地址与子网划分基础概念IPV4与IPV6的区别子网划分的目的子网掩码的使用CIDR表示法路由器与交换机TCP与UDP协议HTTP与HTTPS协议DNS域名系统网络攻击与防御机制网络安全协议网络性能优化云计算基础
以Python构建ONE FACE管理界面：从基础至进阶的实战探索 Allen_LVyingbo python python pyqt
一、引言1.1研究背景与意义在人工智能技术蓬勃发展的当下，面部识别技术凭借其独特优势，于安防、金融、智能终端等众多领域广泛应用。在安防领域，可助力监控系统精准识别潜在威胁人员，提升公共安全保障水平；金融行业中，实现刷脸支付、远程开户等便捷服务，优化用户体验并强化交易安全。智能终端方面，为设备解锁、身份验证等功能提供支持，提升设备使用的便捷性与安全性。然而，现有面部识别系统在数据安全、检索效率及用户
明达云：赋能化工园区，智绘安全高效新蓝图明达技术物联网网络
在日新月异的科技浪潮中，数字化转型已成为各行各业转型升级的关键驱动力。尤其在化工这一关乎国家经济命脉与安全环保的重要领域，如何实现智能化管理、提升运营效率、确保生产安全，成为了摆在众多化工园区面前的重大课题。在此背景下，明达云平台以其卓越的技术实力与深厚的行业经验，正逐步成为化工园区智慧化升级的首选伙伴。智慧监管，安全先行化工生产，安全为先。明达云平台通过集成物联网、大数据、人工智能等先进技术，为
探索分布式IO模块的介质冗余：赋能工业自动化的稳健之心明达技术分布式自动化运维
在日新月异的工业自动化领域，每一个细微环节的稳定性都直接关系到生产线的效率与安全。随着智能制造的深入发展，分布式IO（Input/Output）模块作为连接现场设备与控制系统的关键桥梁，其重要性日益凸显。我们自主研发的带有介质冗余功能的MR30分布式IO模块，正以其独特的优势，为工业自动化系统构建起一道坚不可摧的防护网。介质冗余：保障数据传输的“双保险”在传统工业自动化系统中，单一介质（如网线、光
CDN防御如何保护我们的网络安全？ cdncdn缓存网络安全
在当今数字化时代，网络安全成为了一个至关重要的议题。随着网络攻击的日益频繁和复杂化，企业和个人都面临着前所未有的安全威胁。内容分发网络（CDN）作为一种分布式网络架构，不仅能够提高网站的访问速度和用户体验，还能够在很大程度上增强网络安全防护能力。本文将探讨CDN防御如何保护我们的网络安全。1、CDN防御的首要本领是分布式抗DDoS攻击DDoS攻击，即分布式拒绝服务攻击，犹如网络中的“洪水猛兽”，攻
PHP基于Google Authenticator双因素身份验证实现动态码验证
一：介绍GoogleAuthenticator双因素身份验证是谷歌推出的一款动态口令工具，解决大家各平台账户遭到恶意攻击的问题，一般在相关的服务平台登陆中除了用正常用户名和密码外，需要再输入一次谷歌认证器生成的动态口令才能验证成功，相当于输入二次密码，以达到账户的高安全性。二：拓展安装composerrequirehuaweichenai/google-authenticator三：使用1：创建密
Containerd 插件系统深度解析
前言Containerd是一个工业级的容器运行时,其插件系统是其架构中最核心的部分之一。本文将深入解析containerd的插件机制,帮助读者理解其设计理念和实现原理。1.插件系统概述1.1设计目标模块化:将功能解耦为独立插件可扩展性:支持动态添加新功能类型安全:基于Go接口的类型检查依赖管理:自动处理插件间依赖关系1.2核心概念typeRegistrationstruct{TypeTypeIDs
怎么做DNS污染检测域名解析dnsdns劫持
DNS污染是指通过恶意手段篡改DNS解析结果，导致用户访问错误或恶意网站的行为。这种行为不仅影响用户体验，还可能带来安全风险。以下是几种检测DNS污染的方法：1.使用在线DNS检查工具可以使用在线工具如帝恩思旗下的拨测在线DNS检测工具等来检查DNS设置和解析结果。这些工具会返回当前的DNS解析结果，从而判断是否存在异常。2.手动检查DNS解析结果通过命令行工具（如nslookup、dig）手动查
网络安全常见十大漏洞总结（原理、危害、防御）安全防护服务器安全加固服务器
一、弱口令产生原因与个人习惯和安全意识相关，为了避免忘记密码，使用一个非常容易记住的密码，或者是直接采用系统的默认密码等。危害通过弱口令，攻击者可以进入后台修改资料，进入金融系统盗取钱财，进入OA系统可以获取企业内部资料，进入监控系统可以进行实时监控等等。防御设置密码通常遵循以下原则：（1）不使用空口令或系统缺省的口令，为典型的弱口令；（2）口令长度不小于8个字符；（3）口令不应该为连续的某个字符
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那