_陈陆亮

【初学】C# 爬虫小实战-批量导出学院新闻信息

【初学】爬虫小实战-批量导出学院新闻信息

中秋过后，闲来无事，忽然间对大数据的数据挖掘感兴趣，然后就开始研究研究网络爬虫的原理，经过一晚上的折腾，勉强爬了学院的新闻列表，程序还有很大的改进空间，特发此文，让学爬虫的同学借鉴和交流，大家共同进步(●’◡’●)

源码传送门地址:点我传送

上效果图:

主要实现方法：

///

///获取URL网站源码

///

///url">

///

private string GetHttpWebRequest(string url)

{

HttpWebResponse result;

string strHTML = string.Empty;

try

{

Uri uri =newUri(url);

WebRequest webReq =WebRequest.Create(uri);

WebResponse webRes =webReq.GetResponse();

HttpWebRequest myReq = (HttpWebRequest)webReq;

myReq.UserAgent = "User-Agent:Mozilla/4.0(compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";

myReq.Accept = "*/*";

myReq.KeepAlive = true;

myReq.Headers.Add("Accept-Language","zh-cn,en-us;q=0.5");

result = (HttpWebResponse)myReq.GetResponse();

Stream receviceStream =result.GetResponseStream();

StreamReader readerOfStream =newStreamReader(receviceStream,System.Text.Encoding.GetEncoding("utf-8"));

strHTML =readerOfStream.ReadToEnd();

readerOfStream.Close();

receviceStream.Close();

result.Close();

}

catch

{

try {

Uri uri =newUri(url);

WebRequest webReq =WebRequest.Create(uri);

HttpWebRequest myReq = (HttpWebRequest)webReq;

myReq.UserAgent = "User-Agent:Mozilla/4.0(compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";

myReq.Accept = "*/*";

myReq.KeepAlive = true;

myReq.Headers.Add("Accept-Language","zh-cn,en-us;q=0.5");

//result =(HttpWebResponse)myReq.GetResponse();

try

{

result = (HttpWebResponse)myReq.GetResponse();

}

catch (WebException ex)

{

result = (HttpWebResponse)ex.Response;

}

Stream receviceStream =result.GetResponseStream();

StreamReader readerOfStream =newStreamReader(receviceStream,System.Text.Encoding.GetEncoding("gb2312"));

strHTML =readerOfStream.ReadToEnd();

readerOfStream.Close();

receviceStream.Close();

result.Close();

}

catch

{

}

return strHTML;

}

///

///提取HTML代码中的网址

///

///htmlCode">

///

private static List<string> GetHyperLinks(string htmlCode,string url)

{

ArrayList al =newArrayList();

bool IsGenxin = false;

StringBuilder weburlSB =newStringBuilder();//SQL

StringBuilder linkSb =newStringBuilder();//展示数据

List<string> Weburllistzx =newList<string>();//新增

List<string> Weburllist =newList<string>();//旧的

string ProductionContent =htmlCode;

Regex reg =newRegex(@"http(s)?://([\w-]+\.)+[\w-]+/?");

string wangzhanyuming =reg.Match(url, 0).Value;

MatchCollection mc =Regex.Matches(ProductionContent.Replace("href=\"/","href=\"" +wangzhanyuming).Replace("href='/","href='" +wangzhanyuming).Replace("href=/","href=" +wangzhanyuming).Replace("href=\"./","href=\"" + wangzhanyuming), @"<[aA][^>]*href=[^>]*>", RegexOptions.Singleline);

int Index = 1;

foreach (Match min mc)

{

MatchCollection mc1 =Regex.Matches(m.Value,@"[a-zA-z]+://[^\s]*", RegexOptions.Singleline);

if (mc1.Count > 0)

{

foreach (Match m1in mc1)

{

string linkurlstr =string.Empty;

linkurlstr =m1.Value.Replace("\"","").Replace("'","").Replace(">","").Replace(";","");

weburlSB.Append("$-$");

weburlSB.Append(linkurlstr);

weburlSB.Append("$_$");

if(!Weburllist.Contains(linkurlstr) &&!Weburllistzx.Contains(linkurlstr))

{

IsGenxin = true;

Weburllistzx.Add(linkurlstr);

linkSb.AppendFormat("{0}
", linkurlstr);

}

else

{

if (m.Value.IndexOf("javascript") == -1)

{

string amstr =string.Empty;

stringwangzhanxiangduilujin =string.Empty;

wangzhanxiangduilujin =url.Substring(0, url.LastIndexOf("/") + 1);

amstr =m.Value.Replace("href=\"","href=\"" +wangzhanxiangduilujin).Replace("href='","href='" +wangzhanxiangduilujin);

MatchCollection mc11 =Regex.Matches(amstr,@"[a-zA-z]+://[^\s]*", RegexOptions.Singleline);

foreach (Match m1in mc11)

{

string linkurlstr =string.Empty;

linkurlstr =m1.Value.Replace("\"","").Replace("'","").Replace(">","").Replace(";","");

weburlSB.Append("$-$");

weburlSB.Append(linkurlstr);

weburlSB.Append("$_$");

if(!Weburllist.Contains(linkurlstr) &&!Weburllistzx.Contains(linkurlstr))

{

IsGenxin = true;

Weburllistzx.Add(linkurlstr);

linkSb.AppendFormat("{0}
", linkurlstr);

}

Index++;

}

return Weburllistzx;

}

///

/// //导出到txt文件

///

///Context">

///fileName">

public static void WriteTxt(string Context,string fileName)

{

if (!File.Exists(@"C:\Users\chenluliang\Desktop\爬虫资料\"+ fileName +".txt"))

{

FileStream fs1 =newFileStream(@"C:\Users\chenluliang\Desktop\爬虫资料\"+ fileName +".txt",FileMode.Create, FileAccess.Write);//创建写入文件

StreamWriter sw =newStreamWriter(fs1);

sw.WriteLine(Context);//开始写入值

sw.Close();

fs1.Close();

}

///

/// //把网址写入xml文件

///

///strURL">

///alHyperLinks">

public static void WriteToXml(string strURL,List<string> alHyperLinks)

{

Program o =newProgram();

XmlTextWriter writer =newXmlTextWriter(@"D:\HyperLinks.xml",Encoding.UTF8);

writer.Formatting = Formatting.Indented;

writer.WriteStartDocument(false);

writer.WriteDocType("HyperLinks",null,"urls.dtd",null);

writer.WriteComment("提取自" + strURL +"的超链接");

writer.WriteStartElement("HyperLinks");

writer.WriteStartElement("HyperLinks",null);

writer.WriteAttributeString("DateTime",DateTime.Now.ToString());

foreach (string strin alHyperLinks)

{

string title =GetDomain(str);

string body = str;

stringStrContent=GetContent(o.GetHttpWebRequest(str));

if (StrContent!="") {

string strTitle=GetTitle(o.GetHttpWebRequest(str));

if (strTitle !="")

{

try {WriteTxt(StrContent, strTitle); }catch {

Console.WriteLine("写入文件失败！");

}

Console.WriteLine("标题:" + strTitle);

Console.WriteLine("内容:" + StrContent);

Number++;

Console.WriteLine("链接来自:" + body +"");

Console.WriteLine("已经爬了，第" + Number +"条数据");

Console.WriteLine("--------------------------------------------------------------------------" +"\n");

}

writer.WriteElementString(title, null, body);

}

writer.WriteEndElement();

writer.Flush();

writer.Close();

}

///

///获取网址的域名后缀

///

///strURL">

///

public static string GetDomain(string strURL)

{

string retVal;

string strRegex = @"(\.com/|\.net/|\.cn/|\.org/|\.gov/)";

Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);

Match m =r.Match(strURL);

retVal = m.ToString();

strRegex = @"\.|/$";

retVal = Regex.Replace(retVal,strRegex,"").ToString();

if (retVal == "")

retVal = "other";

return retVal;

}

///

///获取标题

///

///html">

///

public static string GetTitle(string html)

{

string titleFilter = @"

[\s\S]*?

string h1Filter = @".*?";

string clearFilter = @"<.*?>";

string title = "";

Match match =Regex.Match(html,titleFilter,RegexOptions.IgnoreCase);

if (match.Success)

{

title = Regex.Replace(match.Groups[0].Value,clearFilter,"");

}

// 正文的标题一般在h1中，比title中的标题更干净

match = Regex.Match(html,h1Filter,RegexOptions.IgnoreCase);

if (match.Success)

{

string h1 = Regex.Replace(match.Groups[0].Value,clearFilter, "");

if (!String.IsNullOrEmpty(h1)&& title.StartsWith(h1))

{

title = h1;

}

return title;

}

///

///获取内容

///

///html">

///

public static string GetContent(string html)

{

string cukc = "";

string titleFilter = @"

[\s\S]*?

string h1Filter = @".*?";

string clearFilter = @"<.*?>";

string Ctitle = "";

Match match=null;

while (true)

{

try

{

html = Regex.Replace(html," ","");

match = Regex.Match(html,titleFilter,RegexOptions.IgnoreCase);

if (match.Success)

{

Ctitle = Regex.Replace(match.Groups[0].Value,clearFilter, "");

}

// 正文的标题一般在h1中，比title中的标题更干净

match = Regex.Match(html,h1Filter,RegexOptions.IgnoreCase);

if (match.Success)

{

string h1 =Regex.Replace(match.Groups[0].Value,clearFilter,"");

cukc += h1;

}

html =html.Replace(match.ToString(), "");//替换字符串，也可以是一个字符，但是需要用双

}

catch {

// Console.WriteLine("正文:"+ cukc);

// Console.WriteLine("--------------------------------------------------------------------------");

break;

}

return cukc;

}

你可能感兴趣的:(项目知识点)

听课笔记01 爱小黄笔记
b站黑马程序员java零基础视频教学基础知识和编程思想编程思想比基础知识更加重要。java基础和java进阶比较重要java面向对象java常见api常见面试题。课程案例分析综合项目知识点开发使用。学生管理系统代码规范，阿里巴巴编码规范。拔高的内容。虚拟机相关知识数据结构高级知识经验和心得老师讲解。真的写代码。复杂的案例，需要分析。学习像听故事一样简单思考的东西图形化，图表化。数据分析。将所听的内
Docker部署前端项目 ^Poppy 运维 docker
目录前置工作1、需要准备的东西2、连接云服务器安装Docker环境1、安装Docker的依赖库。2、添加DockerCE的软件源信息。3、安装DockerCE。4、启动Docker服务。准备Dockerfile并部署项目（构建新的业务镜像）1、准备nginx.conf.template、Dockerfile、dist（前端项目build后的包）2、部署项目知识点（需要的可查阅）容器命令（需要时可查
Drf框架Django（Elasticsearch，serializers）离开你，我才发现 web架构 #web架构 Django elasticsearch django
目录1.商业模式介绍2项目知识点商业模式介绍1.B2B–企业对企业B2B平台是电子商务的一种模式，是英文Business-to-Business的缩写，即商业对商业，或者说是企业间的电子商务，即企业与企业之间通过互联网进行产品、服务及信息的交换。它将企业内部网，通过B2B网站与客户紧密结合起来，通过网络的快速反应，为客户提供更好的服务，从而促进企业的业务发展案例阿里巴巴，2.C2C–个人对个人通过
项目知识点总结-住房图片信息添加-Excel导出喵俺第一专栏 #waiyou888880 windows
（1）住房信息添加Controller：@RequestMapping("/add")publicStringadd(Homehome,Modelmodel)throwsIOException{StringsqlPath=null;//定义文件保存的本地路径StringlocalPath="D:\\AnZhuang\\Java项目\\选题\\Xin-XiangMu\\Hotel_Manage-ma
爬虫进阶-反爬破解8（反爬的实战练习：爬虫文件的解析和数据的抓取+反爬措施的分析和突破+Scrapy接入Cookie池管理系统+分布式爬虫的架设）有洁癖的懒羊羊爬虫爬虫
目录一、爬虫文件的解析和数据的抓取（一）项目的知识点（二）实践操作：新建项目抓取数据（三）总结二、反爬措施的分析和突破（一）项目知识点补充（二）实践操作：Scrapy破解数据加密操作（三）总结三、Scrapy接入Cookie池管理系统（一）项目知识点补充（二）环境介绍（三）实践操作：Scrapy+Cookie池管理系统（四）总结四、分布式爬虫的架设（一）项目知识点补充（二）环境介绍（三）实践操作：
项目知识点总结-过滤器-MD5注册-邮箱登录喵俺第一专栏 #waiyou888880 hive hadoop 数据仓库
（1）过滤器使用过滤器验证用户是否登录/***@Title:NoLoginFilter.java*@Packagecom.qfedu.web.filter*@Description:TODO(用一句话描述该文件做什么)*@authorFeri*@date2018年5月28日*@versionV1.0*/packagecom.gdsdxy.filter;importjavax.servlet.*;i
Qt QTableWidget项目知识点小结 cpp_learners Qt qt table
前言最近在研究表格时，找不到什么好的例子来研究，索性模仿一下公司开发的软件里的表格案例，做的一个小项目。效果：其中包括功能：查找按钮：查找Reference列，符合条件的将其显示出来；不符合条件将其隐藏；取消按钮：清空输入框文本，显示所有表格项；插入行按钮：在选中行的下方进行插入一行；删除行按钮：将选中的表格项进行删除；首行插入按钮：在首行插入一行记录；右键菜单跳过点：在SK项打勾✔；右键菜单取消
将web前端分成3个阶段学习，你会发现学习前端开发真的很简单 web前端学习指南
第一阶段：HTML网页开发通过学习HTML的基本知识点，结合案例演示，实施实战项目，制作PC网页和手机响应页面。了解企业网页的开发过程、代码编写标准、网站性能优化、浏览器各种版本的兼容性等。实战项目主流电子商务平台前端项目知识点HTML标签，HTML5新标签，CSS样式，CSS3样式，媒体查询，等等适合人群一个想学习前端但又不知道如何开始的学生。基础薄弱，缺乏对大学生的系统研究、人员迁移等。第二阶
【苍穹外卖 | 项目日记】第一天我是一盘牛肉【苍穹外卖】java 开发语言
前言：我打算用16天的时间写完黑马程序员的苍穹外卖项目，为了督促自己每天坚持写以及记录项目知识点，所以用这种项目日记的方式鞭策自己目录前言：今日完结任务：今日收获：1.阅读代码框架：2.新增员工接口：3.分页查询接口：4.员工状态修改接口：杂项知识点：总结：今日完结任务：阅读了整个项目框架代码实现了新增员工接口实现了分页查询员工接口实现了员工状态修改接口实现了编辑员工接口实现了根据id查询员工接口
vite+ts项目知识点笔记微芒不朽
导出类定义exportconstprimaryColor='#0960bd';exportconstdarkMode='light';//使用exportfunctiongetThemeColors(color?:string){consttc=color||primaryColor;constlightColors=generateAntColors(tc);constprimary=light
从零开始实现C++ TinyWebServer（九）---- 项目知识点总结 JehanRio 从零开始实现C++TinyWebServer c++linux 后端
文章目录前言项目介绍为什么要做这样一个项目？项目背景项目描述项目功能项目流程项目重难点项目效果解决方案个人收获线程池线程的同步机制有哪些？线程池中的工作线程是一直等待的吗？如果同时1000个客户端进行访问请求，线程数不多，怎么能及时响应处理每一个呢？如果一个客户请求需要占用线程很久的时间，会不会影响接下来的客户请求呢，有什么好的策略呢?定时器为什么手动实现小根堆？常用的定时器结构和它们的差异？日志
vue3项目知识点 Rowrey vue.js
项目代码:https://gitee.com/rowrey/vue3-e-commerce-website.gitreactiveref响应式1,computedcomputed(item=>item>2)2,watch监听immediate立即出发回调deep深度监听（慎用）watch(state,()=>{console.log('数据变化了')},{deep:true,immediate:t
C++学习笔记--项目知识点集合 Runjavago c++学习笔记
一、同步IO、异步IO、阻塞IO、非阻塞IO首先来看看两种I/O的定义：同步I/O和异步I/O同步（阻塞）I/O：在一个线程中，CPU执行代码的速度极快，然而，一旦遇到IO操作，如读写文件、发送网络数据时，就需要等待IO操作完成，才能继续进行下一步操作。这种情况称为同步IO。异步（非阻塞）I/O：当代码需要执行一个耗时的IO操作时，它只发出IO指令，并不等待IO结果，然后就去执行其他代码了。一段时
项目知识点总结-分页（三）喵俺第一专栏 #waiyou888880 java 数据库服务器
后端分页查询接口：ControllerService：Mapper：//分页搜索会议的方法ListgetAllSearchMeeting(@Param("sm")SearchMeetingsearchMeeting,@Param("page")Integerpage,@Param("pageSize")IntegerpageSize);sql：会议详情接口：Service：Mapper接口：sql
iOS练手项目知识点汇总 study_& ios cocoa macos
基础理解篇Objective-C是一种面向对象的编程语言，它支持元编程。元编程是指编写程序来生成或操纵其他程序的技术。Objective-C中，元编程可以使用Objective-C的动态特性来实现。例如可以使用Objective-C的运行时函数来动态地创建类、添加属性和方法等等。#import@interfaceMyClass:NSObject@property(nonatomic,strong)
项目知识点记录项目題供诗 #waiyou888880 java 开发语言
1.使用druid连接池使用properties配置文件：driverClassName=com.mysql.cj.jdbc.Driverurl=jdbc:mysql://localhost:3306/book?useSSL=true&setUnicode=true&charsetEncoding=UTF-8&serverTimezone=GMT%2B8username=rootpassword=
基于JavaSE的手机库存管理系统 AlluzeYu JavaSE java
1、项目背景基于JavaSE完成如下需求：功能需求：1、查询库存量2、可以修改库存中不同品牌手机的个数3、退出系统实现步骤：1、把List当做库房2、把手机存放在库房中3、使用封装的方法区操作仓库中的手机2、项目知识点面向对象集合循环流程控制语句方法3、代码//模板类publicclassPhone{//属性Stringbrand;//品牌doublesize;//尺寸intprice;//价格i
2018-11-20本次项目知识点烟雨平生花飞舞
1、设置分割线宽度，颜色：//和tableView等宽，也可自定义UIEdgeInsetsMake(0,0,0,0)self.tableView.separatorInset=UIEdgeInsetsZero;self.tableView.separatorColor=[UIColorredColor];2、
【2 beego学习 - 项目导入与项目知识点】努力修福报 beego 学习
0项目导入1在英文路径下新建一个同名的项目,拷贝其他数据到这个文件beenew同名项目名cd同名项目名gomodtidygoget-u-vgithub.com/astaxie/beegogoget同名项目名/models2拷贝部分的项目文件到新目录beerun运行的其他错误,按照提示安装文件1后端获取前端传递的数据post与get前端get可以使用href前端post使用表单get和参数删除pos
传智健康项目总结碳烤小肥羊。。。传智健康项目后端 Java Spring SpringMvc Mybatis
耗时一个半月终于把传智健康项目跟着做完了，下面是对项目的一点心得体会。项目知识点总结Maven中parent父工程聚合聚合模块(父工程)作用：父工程是一个pom工程，通常只是用来帮助其子模块构建的工具，本身并没有实质的内容。具体每个工程代码的编写还是在生成的工程中去写。所有的子模块都继承于父模块，父模块用来做整个项目的版本控制，也就是项目中所有要使用到的jar包的版本都集中由父工程管理。这样你
（仿）美团微信小程序(适合新手) 阿甘呀
前些日子，由于公司项目所需，需要用到微信小程序开发，学习之余，模仿者美团小程序界面，花了一下午时间，照这轮子造了个首页出来，此Demo加深了我对flex布局的认识，新手也可以拿来参考参考，大神级别的就略过吧。我发现，当你熟悉了flex布局后，写什么样式都是信手拈来，不过就是一些模块的堆积，但是此项目没有将模块组件化，以致后期代码复用性差以及按需加载，后期有时间会改进。项目知识点涉及到：flex页面
iOS原生项目与flutter混编木子雨廷t
1、项目相关截图项目相关截图2、项目知识点梳理图项目知识点梳理图Dio3.0.10:Dio是一个强大的DartHttp请求库，支持RestfulAPI、FormData、拦截器、请求取消等操作。另外Dio2.0到Dio3.0有些改变.具体用法请点击连接.Swiper:Swiper滑动插件的使用，使用Swiper插件图片的切换效果。很强大的一个插件,支持多种布局和效果,使用案例请点击.屏幕适配：手机
SSM项目知识点随心者随心行
在写实体类的时候要用引用类型，而不用基本数据类型。因为用基本类型会赋值默认值。而引用类型不会数据库中DateTime时间范围大于TimeStamp。所以用dateTime.TimeStamp,优势在于会自适应目前机器所在的时区。Mysql主要分为两种引擎。一种是InnoDB,一种是MYISAM。MYISAMInnoDB支持数据行锁定，MyISAM不支持行锁定，只支持锁定整个表。MyISAM不支持事
自学Vue之路——Vue项目知识点必备皮糖小王子 Vue框架学习 vue.js javascript 前端
今日内容概要vue项目目录介绍es6的导入导出语法vue项目开发规范vue项目集成axios,vue项目前后端打通props配置项混入插件scoped样式localStorage和sessionStorage集成elementui1vue项目目录介绍myfirstvue#项目名字node_modules#文件夹，内部有很多当前项目依赖的模块，可以删除，npminstallpublic#文件夹-fa
【数据挖掘】天池挑战赛新闻推荐 Alex_SCY 数据挖掘数据挖掘人工智能推荐系统
比赛网址：https://tianchi.aliyun.com/competition/entrance/531842/introduction项目源码：Github一、项目知识点数据预处理；数据可视化；特征工程；模型选择；实验结果的评价；二、实验过程一、比赛任务分析1．赛题背景赛题以新闻APP中的新闻推荐为背景，要求选手根据用户历史浏览点击新闻文章的数据信息预测用户未来点击行为，即用户的最后一次
FOC项目知识点总结一 | 概念扫盲——从有刷直流电机到PMSM和BLDC Wilson Huang（三点羊羽） FOC相关 FOC 电机 PMSM BLDC 控制
1有刷直流电机直流电机采用机械换向器，使得驱动方法简单，其模型示意图如下图所示：电机主要由永磁材料制造的定子、绕有线圈绕组的转子（电枢）、换向器和电刷等构成。只要在电刷的A和B两端通入一定的直流电流，电机的换向器就会自动改变电机转子的磁场方向，这样，直流电机的转子就会持续运转下去。有刷直流电机缺点：结构相对复杂，增加了制造成本；容易被环境（如灰尘等）影响，降低了工作的可靠性；换向时会产生火花，限制
瑞吉外卖（个人记录）十岁卖切糕、 spring boot mybatis
本文为个人学习黑马《瑞吉外卖》项目后进行的项目总结，更偏向于对自己编写文本能力的锻炼以及对项目知识点的简短记录。因为个人能力问题，其中可行性分析和测试部分只进行了小标题的陈列，并没有进行编辑。对《瑞吉外卖》项目感兴趣的朋友也可以浏览本文后再去学习，可以对该项目架构有大体感知，同时黑马《瑞吉外卖》非常适合框架学习阶段的朋友，大力推荐本项目。个人完成后项目源码上传至gitee，有兴趣者可自行参考。gi
博客项目知识点的总结和拓展人间天 java
整体架构后台目录：本项目后台是由SpringBoot框架为基础进行开发的一款Java项目。通过上述目录图，大致能分为三层：控制层：获取前端来的请求。服务层：对控制层的一些请求进行相对应的逻辑处理。DAO层：对数据库数据的增删改查。当然除了大致三层还有一些工具类、配置、缓存和aop等技术的加持。数据表的分析article表：DROPTABLEIFEXISTS`article`;CREATETABLE
秒杀项目知识点总结 Rookie1012 秒杀项目 java spring redis 数据库
springboot秒杀项目总结一、秒杀项目要点归纳项目亮点：亮点具体展开：二、秒杀项目进阶总流程1、相关Linux命令（1）代码部署到服务器（2）查看服务器的性能（3）查看进程命令（4）配置redis命令2、redis用法（1）分布式session实现：登录信息缓存（2）商品详情页缓存3、静态CDN4、交易优化技术（重点！！！）一、交易中缓存库存二、交易验证优化centos7下载安装rocket
SpringBoot构建电商基础秒杀项目知识点总结(第4-6章) PSJ_14 SpringBoot项目 spring boot 后端 java
文章目录4-1商品模型模型--商品创建011.模型设计4-2商品模型模型--商品创建024-4商品模型模型--商品列表4-5商品模型模型--商品列表页面4-6商品模型模型--商品详情页面5-2交易模型管理--交易下单015-3交易模型管理--交易下单021.生成序列化订单号6-4秒杀模型管理--活动模型与商品模型结合034-1商品模型模型–商品创建011.模型设计产品经理给到前端展示界面,得到要展
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro