Icoding_F2014

网络流量领域公开数据集

流量分类领域数据集

本博客持续更新，收集平常读论文时提高的公开数据集。

数据集详情

1. 马萨诸塞大学系列

http://traces.cs.umass.edu/index.php/Network/Network 系列：
这个网站提供了该学院很多数据集，这些数据集是他们发表论文时提取的，然后公开出来。

1.1 WebIdent 2 Traces

数据集描述：
A collection of traces of web requests and responses over an encrypted SSH tunnel. The collection spans traces of connections to 2000 sites, collected four times a day over several months from February 2006 through April 2006. Each connection was encrypted; the traces include only the TCP headers, and not the payload.

2000个网站的SSH隧道上SSL连接的流量，只有TCP 头，PCAP大约2.5G 。
这个数据集是标注好了的。label: website。

地址：http://skuld.cs.umass.edu/traces/network/README-webident2

2. WIDE Project项目

http://mawi.wide.ad.jp/mawi/

该项目是日本和美国的合作项目，该项目会按照不同的时间周期（如每天的某分钟，每个月）采集从日本到美国的某条骨干网络的网络流量，里面一共涉及了7个采样点，其中C-D采样点采集的是IPv6的数据包。时间跨度特别大：从2001年到2018 都有。

网络流量做了数据脱敏，里面的IP地址是经过处理的，而且只有IP包头。

当然这个数据集更适合做测量，因为它是没有标注过的。

3.Youtube 加密视频流量标题识别数据集

数据集地址：
http://www.cse.bgu.ac.il/title_fingerprinting/
数据集描述：
作者采集了10000个Youtube视频流量，其中包含100个视频，每个视频观看100次。然后每个pcap，都有标注好对应的视频标题。pcap都没做数据脱敏，就是原始的pcap数据包。

例如：
http://www.cse.bgu.ac.il/title_fingerprinting/dataset_chrome_100/Hollyweezy/Train/
这个目录下有100个pcap,其中 Hollyweezy，就是他的视频标题。

同时作者该采集了一些带延时和丢包的数据包用来作为测试集。

作者的工作就是建立模型识别加密视频流量对应的视频标题。

4.流量分析对抗实验数据集

这个数据集需要自己根据源码自己生成：
https://github.com/kpdyer/website-fingerprinting.git
源码生成的结果是会访问2000个 website 和775个SSH的Sockets代理的website的流量，里面的还有11个流量混淆的方法（包括包长填充等）可供选择，里面还有11个流量分类器。

5. 网络防御比赛的数据集

里面有SSL的数据包，尚未标注好的。可以作为协议格式自动化推断的数据包。

https://www.netresec.com/?page=MACCDC

6.Tor流量

一般来说Tor上面的加密流量分类叫做webfingerprint attack,这个领域有很多公开的数据集，但是这个领域的很多数据集一般只给出cell的方向序列。例如：
[-1,1,1,-1,-1,…] 是{1,-1}的序列。正负号表示cell是Outgoing还是ingoing。每个cell的实际大小一般是512，因此可以根据cell的方向序列推断出cell的大小序列，只需要乘以512即可。
常见的数据集有：

AWF模型
https://github.com/jmhIcoding/DLWF?organization=jmhIcoding&organization=jmhIcoding

里面有 Closed World ，Open World ，Concept drift 等流量。有100，200,500,900个类别的分梯度的标注数据，每个类别有2500条数据。这个数据集还是很大的！

Deep fingerping数据集
https://github.com/deep-fingerprinting/df 这个是深度学习的一个数据集，里面有95个类别。训练集有75000多个样本，测试集和验证集还各有9500条样本。

7. Tor流量

URL:
http://home.cse.ust.hk/~taow/wf/data/
这里也是标注好的tor的website的流量，里面的数据都是基于cell的，都是+1，-1的序列。但是原始数据都带了相对时间戳。
有100多个类别，每个类别有100个左右的trace。

http://home.cse.ust.hk/~taow/wf/data/walkiebatch-defended.zip 是使用walkie-talkie手段构造的逃逸样本。

8.移动APP加密流量

8.1 Andrubis 数据集

https://drive.google.com/drive/folders/1IXa3IJS9zJS4vggpyU7yda8f7jZjz4gB
介绍：
这个数据集超大，包含了103万个Android APP的带标注的流量数据，而且是pcap原始数据包。这个就很棒啊。

这个数据集包括了正常APP和恶意APP，是否正常是通过VirusTotal来判断的。
每个APP在Android模拟器里面跑4分钟。

8.2 Browser 数据集

https://drive.google.com/open?id=1wOdrfazbrcMDrL0NfA4GLoWegtPqkPj3
在三星Note4 安卓6.0.1设备上使用Chrome,Firefox,三星自带流量和UC浏览器访问Alexa Top 1000的站点。每个站点访问15秒。
这里是为了分类不同的浏览器。

8.3 Cross Platform数据集

PPT链接：https://www.ndss-symposium.org/wp-content/uploads/2018/03/NDSS2018_05B-2_Ren_Slides.pdf

Cross Platform dataset: https://recon.meddle.mobi/cross-market.html
The Cross Platform dataset [51] consists of
user-generated data for 215 Android and 196 iOS apps. The
iOS apps were gathered from the top 100 apps in the App
Store in the US, China and India. The Android apps originate
from the top 100 apps in Google Play Store in the US and
India, plus from the top 100 apps of the Tencent MyApps and
360 Mobile Assistant stores, as Google Play is not available in
China. Each app was executed between three and ten minutes
while receiving real user inputs. Procedures to install, interact,
and uninstall the apps were given to student researchers who
followed them to complete the experiments while collecting
data. We use this dataset to evaluate both the performance
of our method with user-generated data and the performance
between different operating systems.
这个数据集做了相同APP不同版本之间的分析。
这个数据集有pcap文件。数据集有大约8个G

数据下载地址：https://drive.google.com/drive/folders/1cmG_5FIAh1DOGPI9el1K5WD9fUIpfw-x

8.4 ReCon dataset:

https://recon.meddle.mobi/appversions/
The ReCon AppVersions dataset [52, 53] consists
of labeled network traces of 512 Android apps from the
Google Play Store, including multiple version releases over
a period of eight years. The traces were generated through
a combination of automated and scripted interactions on five
different Android devices. The apps were chosen among the
600 most popular free apps on the Google Play Store ranking
within the top 50 in each category. In addition, this dataset
contains extended traces of five apps, including multiple version releases. The network traffic of each of these five apps
was captured daily over a two-week period. In this work, we
refer the AppVersions dataset as ReCon and to the extended
dataset as ReCon extended.
里面的数据主要是基于载荷的。
数据下载地址：https://recon.meddle.mobi/appversions/raw_data.tar.gz

9 CIC数据集

https://www.unb.ca/cic/datasets/
这个网站上面的数据集特别多，主要是一些入侵检测、恶意软件的数据集。
还有TOR的，这个可以！！！

9.1 Android 恶意软件流量

介绍页面：https://www.unb.ca/cic/datasets/andmal2017.html
数据页面：http://205.174.165.80/CICDataset/CICMalAnal2017/Dataset/PCAPS/

We installed 5,000 of the collected samples (426 malware and 5,065 benign) on real devices. Our malware samples in the CICAndMal2017 dataset are classified into four categories:

Adware 广告软件
Ransomware 勒索软件
Scareware 恐吓软件
SMS Malware 短信恶意软件

Our samples come from 42 unique malware families.

数据有426个恶意软件，5000多个正常软件的流量。
这些恶意软件可以分为4大类，共42个家族。

9.2 Investigation of the Android Malware (CICInvesAndMal2019)

这个数据集是对上面这个数据集的丰富，主要是把以下信息加进去了：
which includes permissions and intents as static features and API calls and all generated log files as dynamic features in three steps (During installation, before restarting and after restarting the phone).
APP的种类是没有变的。

9.3 Android Adware and General Malware Dataset

CICAAGM dataset is captured by installing the Android apps on the real smartphones semi-automated. The dataset is generated from 1900 applications with the following three categories。
有1900多个应用的流量，其中有400个恶意软件。
https://www.unb.ca/cic/datasets/android-adware.html
这个数据集里面的广告软件特别多，有250个。

9.4 恶意URL数据集

URL: https://www.unb.ca/cic/datasets/url-2016.html
下载链接： http://205.174.165.80/CICDataset/ISCX-URL-2016/Dataset/ISCXURL2016.zip

Benign URLs: Over 35,300 benign URLs were collected from Alexa top websites. The domains have been passed through a Heritrix web crawler to extract the URLs. Around half a million unique URLs are crawled initially and then passed to remove duplicate and domain only URLs. Later the extracted URLs have been checked through Virustotal to filter the benign URLs.

Spam URLs: Around 12,000 spam URLs were collected from the publicly available WEBSPAM-UK2007 dataset.

Phishing URLs: Around 10,000 phishing URLs were taken from OpenPhish which is a repository of active phishing sites.

Malware URLs: More than 11,500 URLs related to malware websites were obtained from DNS-BH which is a project that maintain list of malware sites.

Defacement URLs: More than 45,450 URLs belong to Defacement URL category. They are Alexa ranked trusted websites hosting fraudulent or hidden URL that contains both malicious web pages.

9.5 VPN-noVPN 数据集

刷水文必备的数据集。。。
https://www.unb.ca/cic/datasets/.html
7大类网络服务，各自都有VPN和非VPN的流量：We captured a regular session and a session over VPN, therefore we have a total of 14 traffic categories: VOIP, VPN-VOIP, P2P, VPN-P2P, etc.

Stratosphere IPS数据集

https://www.stratosphereips.org/datasets-overview
这个IPS有提供比较多的数据集，更多是僵尸网络的数据集。

你可能感兴趣的:(流量分类)

每日一练 | 复杂流分类的应用 HCIE考证研究所网络华为网络工程师华为认证 HCIE
01真题题目复杂流分类是指根据五元组（源地址、目的地址、源端口号、目的端口号、协议类型）等信息对报文进行分类，通常应用在网络的核心位置。A.正确B.错误02真题答案B03答案解析复杂流分类通常并不是主要应用在网络的核心位置，而是更多地应用在网络的边缘或接入层。这是因为核心网络的主要职责是高效地转发数据，而不是进行复杂的流量分类和处理。核心网络关注的是高吞吐量和低延迟，而复杂的流分类通常需要更多的处
每日一练 | 华为认证真题练习Day38 GLAB-Mary 网络华为真题
Day38华为认证中级考试真题1、在AgileController的无线准入控制场景中，推荐使用下列哪种方式控制企业内部员工和访客接入网络?A.根据不同的用户名控制接入B.根据无线终端MAC地址是否注册控制接入C.为内部员工和方可设置不同的SSID控制接入D.根据无线终端的类型控制接入2、按照分类规则参考信息的不同，流量分类可以分为(多选)A.简单流分类B.复杂流分类C.按需流分类D.业务流分类3
【RDMA】RoCE网络QoS|应用层设置PFC等级|Tos|Priority|TC bandaoyu RDMA 网络服务器运维
目录1.什么是QoS2.为什么RoCE网络需要QoS3.为了实现每个流有不同的优先级，硬件层如何对流量分类4.应用层如何对流量分类5.应用层对流量的分类是怎么映射到硬件层上的分类6.映射完成之后硬件是怎么针对优先级对网络流进行调度的6.1严格优先级6.2最小带宽保证(EnhancedTransmissionSelection增强传输选择,ETS)6.3速率限制Incast和PFCPFC和globa
基于KMeans聚类算法的网络流量分类预测(毕业论文) 桃宝护卫队算法 kmeans 聚类
点我完整下载：基于KMeans聚类算法的网络流量分类预测.docx基于KMeans聚类算法的网络流量分类预测"NetworkTrafficClassificationPredictionbasedonKMeansClusteringAlgorithm"目录目录2摘要3关键词4第一章引言41.1研究背景41.2研究目的51.3研究意义6第二章相关技术和理论82.1KMeans聚类算法82.2网络流量
【RNN+加密流量A】EBSNN: Extended Byte Segment Neural Network for Network Traffic Classification 过动猿文献阅读 rnn 人工智能深度学习
文章目录论文简介摘要存在的问题论文贡献1.EBSNN2.实验总结论文内容数据集可读的引用文献论文简介原文题目：EBSNN:ExtendedByteSegmentNeuralNetworkforNetworkTrafficClassification中文题目：用于网络流量分类的扩展字节段神经网络发表期刊：IEEETransactionsonDependableandSecureComputing（T
基于深度学习的恶意流量分类复现-part2 一直在努力的吴二胖笔记深度学习分类人工智能
基于深度学习的恶意流量分类复现第二部分-对原始数据集处理1.从原始流量中提取flow和session一共准备了10个流量数据集，目标是对上述流量进行进行分类。运行工具集中的第一个脚本文件，得到处理后的流量包,实验中提取的是原始流量包的flowforeach($fingci1_Pcap\Malware*.pcap)#遍历文件{0_Tool\SplitCap_2-1\SplitCap-p50000-b
网络流量分类概述想出成果的acmer 分类数据挖掘人工智能
1.什么是网络流量？一条网络流量是指在一段特定的时间间隔之内，通过网络中某一个观测点的所有具有相同五元组(源IP地址、目的IP地址、传输层协议、源端口和目的端口)的分组的集合。比如(10.134.113.77，47.98.43.47，TLSv1.2，51990，443)2.什么是网络流量分类？网络流量分类是指，构造一个分类模型，对收集到的各种网络流量进行分类识别，分类识别的结果是某种应用程序或者应
Linux操作系统：Firewalld 明月Java全宇宙网络安全入门到精通 linux 网络运维
Linux防火墙是通过netfilter来处理的，它是内核级别的框架。iptables被作为netfilter的用户态抽象层，iptables将包通过一系列的规则进行检查，如果包与特定的IP/端口/协议的组合匹配，规则就会被应用到这个包上，以决定包是被通过、拒绝或丢弃。firewalld是最新的netfilter用户态抽象层。firewalld可以通过定义的源IP和/或网络接口将入站流量分类到不同
加密流量分析-2.研究背景小坤兽加密流量安全
研究背景1.加密流量分类概述1.1识别方法1.2识别粒度1.3识别对象等级2.加密流量识别粒度相关研究2.1加密与未加密流量分类2.2加密协议识别2.2.1IPSec2.2.2SSL/TLS2.2.3SSH2.3服务识别2.4异常流量识别2.5内容参数识别3.加密流量精细化分类方法相关研究（六种）3.1基于有效载荷3.2数据报负载随机性检测3.3机器学习3.4基于行为的识别方法3.5基于数据报大小
【RDMA】RoCE网络QoS|应用层设置PFC等级|Tos|Priority|TC bdview 网络
目录1.什么是QoS2.为什么RoCE网络需要QoS3.为了实现每个流有不同的优先级，硬件层如何对流量分类4.应用层如何对流量分类5.应用层对流量的分类是怎么映射到硬件层上的分类6.映射完成之后硬件是怎么针对优先级对网络流进行调度的6.1严格优先级6.2最小带宽保证(EnhancedTransmissionSelection增强传输选择,ETS)6.3速率限制Incast和PFCPFC和globa
【RDMA】RoCE网络QoS总结|Qos和PFC|应用层设置PFC等级 bdview 网络 python java linux 大数据
目录1.什么是QoS2.为什么RoCE网络需要QoS3.为了实现每个流有不同的优先级，硬件层如何对流量分类4.应用层如何对流量分类5.应用层对流量的分类是怎么映射到硬件层上的分类6.映射完成之后硬件是怎么针对优先级对网络流进行调度的6.1严格优先级6.2最小带宽保证(EnhancedTransmissionSelection增强传输选择,ETS)6.3速率限制7.额外补充知识文档1.什么是QoSQ
读论文：ByteSGAN: A semi-supervised Generative Adversarial Network for encrypted traffic classification 不会绑马尾的女孩论文深度学习分类
ByteSGAN：半监督生成对抗网络，用于SDNEdge网关中的加密流量分类0、摘要SDNEdgeGateway作为距离用户最近的网络元素，可以通过流量分类能力来提升用户体验。目前针对于捕获大型标记数据集是繁琐且耗时的体力劳动，半监督学习可以有效的解决这个问题。本文提出一种基于生成对抗网络GAN的半监督学习加密流量分类方法ByteSGAN,嵌入到SDNEdge网关中，以实现细粒度流量分类的目标，进
读论文：Lightweight Models for Traffic Classification: A Two-Step Distillation Approach 不会绑马尾的女孩论文深度学习多分类
流量分类的轻量级模型:两步蒸馏方法采用基于两步蒸馏方法的compressed模型，为了解决分类精度和模型复杂度之间的权衡问题，本文首先设计了轻量级模型，然后提出了一种新的训练过程来提高模型的分类精度。提取不同流量的响应、关系和特征知识来训练小模型。关键词：流量分类、自蒸馏、知识蒸馏、模型压缩、深度学习1、介绍模型压缩技术旨在将大型深度模型压缩成轻量级的小魔仙，以满足资源有限的硬件部署。诸如剪枝、知
读论文：Real-Time Encrypted Traffic Classification via Lightweight Neural Networks 不会绑马尾的女孩论文分类深度学习
基于轻量级神经网络的实时加密流量分类0、摘要提出一种轻量级模型，设计原则“maximizethereuseofthinmodules”，thinmodules采用多头注意和一维卷积网络。由于所有数据包的一步交互和多头注意力机制的并行计算，所提出的模型的优势是参数的数量和运行时间显著减少。因为一个流只需要连续的三个数据包，所以该模型可以很好地实时工作。关键词：加密流量分类，多头注意机制，一维卷积网络
不懂流量，怎么赚钱？流量的分类和特点数字游民白一喵
任何涉及互联网工具的商业活动，都逃不开谈及：流量、产品、转化。不论是独立创业、还是自己单干；不论是兼职赚点零花钱、还是想加大投入赚第一桶金，都要先理解流量的分类和特点，再来谈怎么玩、怎么赚。只讲大框架，不讲小细节。想要知道「我到哪里去找便宜流量」的，可以忽略此文了。话题大纲：1.流量的分类2.几种量级较大的流量特点3.如何选择适合自己产品的流量渠道4.如何获取流量1.流量分类从渠道上看，全球超过9
基于黑产博弈的流量识别与反作弊识别方法 GEETEST极验
导读：随着流量由量向质的转变，业务场景的反作弊攻防逐渐白热化。为了应对黑产在客户端环境伪造,设备指纹篡改等客户端反侦察博弈日益严峻的复杂形势，极验总结了多年的对抗经验,认为“语义”是请求流程是打击黑产及其自动化工具的最佳实践。我们将这个理念融入了验证码,对业务场景的流量分而治之，制定分类和处理策略，取得了很好的成果。今天我将结合多年的实践经验，分享如何通过验证码对流量分类识别以及如何进行反作弊的方
学习被动引流后记都九九
被动引流学习心得摘录——1，通过被动引流打造了精准定位高粘度人设号，定位清晰是引流成功与否的关键。2，微信个人号矩阵搭建，流量分类。3，诱饵的设计，有至少八种方法。4，优质流量的入口和技巧，掌握后可以节省很多时间和不必要的摸索。5，如果批量操作可以按照粉丝添加的标准化流程、批量化sop操作。按此操作，图片发自App图片发自App前后对比如图——
2022-08-29 深度链夏天
增量打法就是确保销量在每天的2-3小时（某一时间段中）逐步递增，获得权重赋值，提高店铺关键词排名。根据流量、转化率的递增，把握递增和递增的倍数达到每天的销量之后，立马关闭广告。增量打法的底层逻辑：1.店铺关键词排名上首页前提是商品要有自然排名位原理：广告点击通过率CTR，加购率，转化率，好评率要到达一定的效果才能让广告推进2.突破关联流量流量分类：竞品页面指在同类型产品下我们店铺的产品在竞争品的下
直播预告 | TSN赋能新一代智能网联汽车（下）怿星科技汽车
在智能网联汽车内，车载以太网具有大带宽、传输速度快的优势可以作为下一代E/E架构的骨干网。随着车载领域智能化、网联化的深入发展，车内ECU数量急剧增加，大量车载传感器的海量数据面临高带宽需求和数据融合时的时间同步问题；而面对复杂多样的数据流，如何进行流量分类、低延迟传输，关键型数据的冗余可靠传输成为了一大难题；同时远程通信、端口暴露也带来了不少安全问题……TSN作为传统以太网的扩展，可以实现节点之
短视频矩阵系统，抖音矩阵系统，抖音获客系统源码。look @@DWKJ16@@ 短视频矩阵系统抖音SEO系统源码抖音seo 大数据
抖音蓝V生态体系非常复杂，不同量级、不同性质、不同营销目的的蓝V开设账号矩阵的初衷也不相同。但总体而言开设账号矩阵的目的分为两类：扩大覆盖和增加营收。也已经有很多蓝V在抖音尝试账号矩阵的运营，但总体而言，抖音蓝V账号矩阵搭建与运营技巧上还有很大的增长空间。“账号矩阵”是一种账号运营的高阶玩法，指一个运营主体开设或联动多个账号之间引流，诱导流量分类，转化精准流量，以账号组的形式实现营销效果最大化。虽
千川上线带来的流量玩法变化 9835215bba85
千川流量分类的方法是按照行为风格划分，具体分为人气（喜欢进出直播间）、互动、涨粉（喜欢关注人）、点击小黄车和成单（有下单行为）。相对于feed，现在千川更加针对直播间进行流量重新归类。现在流量的不确定性也会越来越高，现在是流量选择产品。现在进直播间可能这个人本来就没有购物预算和欲望的，但看了直播以后产生了兴趣，产生了需求，也就是我们讲的兴趣电商。接下来单品打爆将成为直播间主流玩法，因为系统学习之后
加密流量分类-论文12：Seeing Traffic Paths: Encrypted Traffic Classification With Path Signature Features 烟玉蓝田加密流量分类分类算法
加密流量分类-论文12：SeeingTrafficPaths:EncryptedTrafficClassificationWithPathSignatureFeatures0、摘要1、模型方法1.1路径签名定义与科普1.1.1科普1.1.2路径签名的一些性质1.2ETC-PS整体预览1.3流量路径构造1.3.1客户端与服务器的双向交互1.3.2网络流量路径构建1.4路径转换1.4.1路径分解变换1
基于卷积和递归神经网络的物联网流量分类器袁赛因不花流量分类卷积神经网络递归神经网络 RNN 流量分类深度学习
写在前面：本文翻译供个人研究学习之用，不保证严谨与准确github链接：https://github.com/WithHades/network_traffic_classification_paper本文原文：Lopez-Martin,M.,Carro,B.,Sanchez-Esguevillas,A.,&Lloret,J.(2017).NetworkTrafficClassifierwithC
网络异常流量分析系统设计一只揪° 信息安全网络聚类机器学习
为什么要监测分析异常流量？网络管理人员都希望在网络性能突然下降的时候找到“真凶”所在，并迅速解决问题。利用网络异常流量监测的方法，可以非常直观地看到网络流量是否有突然增长或者突然下降的现象，并进一步分析是那些用户产生了最多的流量、使用了那些应用以至于网络运转出现性能问题。并根据最终分析的结果，网络管理人员可快速解决掉网络异常问题，保证网络的正常运行。现有的网络异常流量监测方案基于网络流量分类基于端
攻防对抗中的加密恶意流量分析技术米朵儿技术屋网络通信安全及科学技术专栏 http 网络网络协议
摘要：随着网络的不断发展，安全需求的不断提升，加密技术成为保障流量安全的首选，但同时也带来了加密恶意流量的激增，面对复杂多变的网络环境，如何在不解密条件下快速识别其中的恶意流量对提升网络安全防护能力具有重要的意义。以恶意流量分类为研究基础，梳理目前比较流行的加密恶意流量分析识别技术，聚焦基于单维特征和多维特征的流量识别方法，探讨前沿技术在加密恶意流量分析领域的应用研究，为后续研究指出了方向。内容目
基于KMeans聚类算法的网络流量分类预测 Python极客之家 Python 毕设精品实战案例数据挖掘数据分析 python 聚类
温馨提示：文末有CSDN平台官方提供的学长Wechat/QQ名片:)1.项目简介网络流量分类或网络流量异常检测，采用基于聚类的机器学习算法，实现异常检测与分类，即划分为正常流量和异常流量。数据集来源自KDDCUP，该数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。测试数据和训练数据有着不同的概率分布,测试数据包含了一些未出现在训练数据
文献笔记01 -- 综述基于深度学习的入侵检测模型综述_张昊 tsl115 论文笔记深度学习计算机视觉人工智能
关于论文的笔记数据预处理方法主流的深度学习ids模型卷积神经网络概述由输入层，卷积层，池化层，完全连接层和输出层组成（其中卷积层和池化层最重要）效果具有良好的泛化能力，适用多种分类任务。运用于ids构建模型1.对数据集进行处理，将灰度图输入卷积神经网络中进行训练，将流量分类问题转换为图片分类问题。2.通过卷积神经网络来进行特征提取，获取到数据中具有影响力（权值比重大的特征类别）的特征，并且由于其权
加密流量分类torch实践1：1D-CNN模型训练与测试烟玉蓝田加密流量分类分类 cnn 深度学习
模型：model.py论文参数：importtorch.nnasnnimporttorchimporttorch.nn.functionalasFclassOneCNNC(nn.Module):def__init__(self,label_num):super(OneCNNC,self).__init__()self.layer_1=nn.Sequential(#输入784*1nn.Conv2d(
每日论文：《CENTIME: A Direct Comprehensive Traffic Features Extraction for Encrypted Traffic Classificati 爱学习的大白菜流量分类论文流量分类
每日论文：《CENTIME:ADirectComprehensiveTrafficFeaturesExtractionforEncryptedTrafficClassification》翻译：《CENTIME:一种用于加密流量分类的直接全面的流量特征提取方式》Introduction（引入）作者先引入两种加密流量分类常用的方法：基于统计的方法基于原始流量的方法缺点性能取决于选择的特征向量分类器输入
关于深度学习的网络流量分类论文整理（二） C_GH 流量分类神经网络深度学习
Paper：End-to-endEncryptedTrafficClassificationwithOne-dimensionalConvolutionNeuralNetworks论文：基于一维CNN的端到端的加密流置分类方法论文下载：https://ieeexplore.ieee.org/document/8004872代码下载：https://github.com/echowei/DeepTr
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他