gavid0124

网络爬虫讲解及java代码实现

网络蜘蛛即Web Spider，是一个很形象的名字。把互联网比喻成一个蜘蛛网，那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页，从网站某一个页面（通常是首页）开始，读取网页的内容，找到在网页中的其它链接地址，然后通过这些链接地址寻找下一个网页，这样一直循环下去，直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站，那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。

　　对于搜索引擎来说，要抓取互联网上所有的网页几乎是不可能的，从目前公布的数据来看，容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。这其中的原因一方面是抓取技术的瓶颈，无法遍历所有的网页，有许多网页无法从其它网页的链接中找到；另一个原因是存储技术和处理技术的问题，如果按照每个页面的平均大小为20K计算（包含图片），100亿网页的容量是100×2000G字节，即使能够存储，下载也存在问题（按照一台机器每秒下载 20K计算，需要340台机器不停的下载一年时间，才能把所有网页下载完毕）。同时，由于数据量太大，在提供搜索时也会有效率方面的影响。因此，许多搜索引擎的网络蜘蛛只是抓取那些重要的网页，而在抓取的时候评价重要性主要的依据是某个网页的链接深度。

　　在抓取网页的时候，网络蜘蛛一般有两种策略：广度优先和深度优先。

广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页，然后再选择其中的一个链接网页，继续抓取在此网页中链接的所有网页。这是最常用的方式，因为这个方法可以让网络蜘蛛并行处理，提高其抓取速度。深度优先是指网络蜘蛛会从起始页开始，一个链接一个链接跟踪下去，处理完这条线路之后再转入下一个起始页，继续跟踪链接。这个方法有个优点是网络蜘蛛在设计的时候比较容易。两种策略的区别，下图的说明会更加明确。

　　由于不可能抓取所有的网页，有些网络蜘蛛对一些不太重要的网站，设置了访问的层数。例如，在上图中，A为起始网页，属于0层，B、C、D、 E、F属于第1层，G、H属于第2层， I属于第3层。如果网络蜘蛛设置的访问层数为2的话，网页I是不会被访问到的。这也让有些网站上一部分网页能够在搜索引擎上搜索到，另外一部分不能被搜索到。对于网站设计者来说，扁平化的网站结构设计有助于搜索引擎抓取其更多的网页。

　　网络蜘蛛在访问网站网页的时候，经常会遇到加密数据和网页权限的问题，有些网页是需要会员权限才能访问。当然，网站的所有者可以通过协议让网络蜘蛛不去抓取（下小节会介绍），但对于一些出售报告的网站，他们希望搜索引擎能搜索到他们的报告，但又不能完全**的让搜索者查看，这样就需要给网络蜘蛛提供相应的用户名和密码。网络蜘蛛可以通过所给的权限对这些网页进行网页抓取，从而提供搜索。而当搜索者点击查看该网页的时候，同样需要搜索者提供相应的权限验证。

　网站与网络蜘蛛

　　网络蜘蛛需要抓取网页，不同于一般的访问，如果控制不好，则会引起网站服务器负担过重。去年4月，淘宝 http://www.taobao.com）就因为雅虎搜索引擎的网络蜘蛛抓取其数据引起淘宝网服务器的不稳定。网站是否就无法和网络蜘蛛交流呢？其实不然，有多种方法可以让网站和网络蜘蛛进行交流。一方面让网站管理员了解网络蜘蛛都来自哪儿，做了些什么，另一方面也告诉网络蜘蛛哪些网页不应该抓取，哪些网页应该更新。

　　每个网络蜘蛛都有自己的名字，在抓取网页的时候，都会向网站标明自己的身份。网络蜘蛛在抓取网页的时候会发送一个请求，这个请求中就有一个字段为User－agent，用于标识此网络蜘蛛的身份。例如Google网络蜘蛛的标识为GoogleBot，Baidu网络蜘蛛的标识为BaiDuSpider， Yahoo网络蜘蛛的标识为Inktomi Slurp。如果在网站上有访问日志记录，网站管理员就能知道，哪些搜索引擎的网络蜘蛛过来过，什么时候过来的，以及读了多少数据等等。如果网站管理员发现某个蜘蛛有问题，就通过其标识来和其所有者联系。下面是博客中http://www.blogchina.com）2004年5月15日的搜索引擎访问日志：

　　网络蜘蛛进入一个网站，一般会访问一个特殊的文本文件Robots.txt，这个文件一般放在网站服务器的根目录下，http://www.blogchina.com/robots.txt。网站管理员可以通过robots.txt来定义哪些目录网络蜘蛛不能访问，或者哪些目录对于某些特定的网络蜘蛛不能访问。例如有些网站的可执行文件目录和临时文件目录不希望被搜索引擎搜索到，那么网站管理员就可以把这些目录定义为拒绝访问目录。Robots.txt语法很简单，例如如果对目录没有任何限制，可以用以下两行来描述：
　　User-agent: *
　　Disallow:

　　当然，Robots.txt只是一个协议，如果网络蜘蛛的设计者不遵循这个协议，网站管理员也无法阻止网络蜘蛛对于某些页面的访问，但一般的网络蜘蛛都会遵循这些协议，而且网站管理员还可以通过其它方式来拒绝网络蜘蛛对某些网页的抓取。

　　网络蜘蛛在下载网页的时候，会去识别网页的HTML代码，在其代码的部分，会有META标识。通过这些标识，可以告诉网络蜘蛛本网页是否需要被抓取，还可以告诉网络蜘蛛本网页中的链接是否需要被继续跟踪。例如：表示本网页不需要被抓取，但是网页内的链接需要被跟踪。

　　现在一般的网站都希望搜索引擎能更全面的抓取自己网站的网页，因为这样可以让更多的访问者能通过搜索引擎找到此网站。为了让本网站的网页更全面被抓取到，网站管理员可以建立一个网站地图，即SiteMap。许多网络蜘蛛会把sitemap.htm文件作为一个网站网页爬取的入口，网站管理员可以把网站内部所有网页的链接放在这个文件里面，那么网络蜘蛛可以很方便的把整个网站抓取下来，避免遗漏某些网页，也会减小对网站服务器的负担。

　　内容提取

　　搜索引擎建立网页索引，处理的对象是文本文件。对于网络蜘蛛来说，抓取下来网页包括各种格式，包括html、图片、doc、pdf、多媒体、动态网页及其它格式等。这些文件抓取下来后，需要把这些文件中的文本信息提取出来。准确提取这些文档的信息，一方面对搜索引擎的搜索准确性有重要作用，另一方面对于网络蜘蛛正确跟踪其它链接有一定影响。

　　对于doc、pdf等文档，这种由专业厂商提供的软件生成的文档，厂商都会提供相应的文本提取接口。网络蜘蛛只需要调用这些插件的接口，就可以轻松的提取文档中的文本信息和文件其它相关的信息。

　　HTML等文档不一样，HTML有一套自己的语法，通过不同的命令标识符来表示不同的字体、颜色、位置等版式，如：、、等，提取文本信息时需要把这些标识符都过滤掉。过滤标识符并非难事，因为这些标识符都有一定的规则，只要按照不同的标识符取得相应的信息即可。但在识别这些信息的时候，需要同步记录许多版式信息，例如文字的字体大小、是否是标题、是否是加粗显示、是否是页面的关键词等，这些信息有助于计算单词在网页中的重要程度。同时，对于 HTML网页来说，除了标题和正文以外，会有许多广告链接以及公共的频道链接，这些链接和文本正文一点关系也没有，在提取网页内容的时候，也需要过滤这些无用的链接。例如某个网站有“产品介绍”频道，因为导航条在网站内每个网页都有，若不过滤导航条链接，在搜索“产品介绍”的时候，则网站内每个网页都会搜索到，无疑会带来大量垃圾信息。过滤这些无效链接需要统计大量的网页结构规律，抽取一些共性，统一过滤；对于一些重要而结果特殊的网站，还需要个别处理。这就需要网络蜘蛛的设计有一定的扩展性。

　　对于多媒体、图片等文件，一般是通过链接的锚文本（即，链接文本）和相关的文件注释来判断这些文件的内容。例如有一个链接文字为“张曼玉照片 ”，其链接指向一张bmp格式的图片，那么网络蜘蛛就知道这张图片的内容是“张曼玉的照片”。这样，在搜索“张曼玉”和“照片”的时候都能让搜索引擎找到这张图片。另外，许多多媒体文件中有文件属性，考虑这些属性也可以更好的了解文件的内容。

　　动态网页一直是网络蜘蛛面临的难题。所谓动态网页，是相对于静态网页而言，是由程序自动生成的页面，这样的好处是可以快速统一更改网页风格，也可以减少网页所占服务器的空间，但同样给网络蜘蛛的抓取带来一些麻烦。由于开发语言不断的增多，动态网页的类型也越来越多，如：asp、jsp、php 等。这些类型的网页对于网络蜘蛛来说，可能还稍微容易一些。网络蜘蛛比较难于处理的是一些脚本语言（如VBScript和javascript）生成的网页，如果要完善的处理好这些网页，网络蜘蛛需要有自己的脚本解释程序。对于许多数据是放在数据库的网站，需要通过本网站的数据库搜索才能获得信息，这些给网络蜘蛛的抓取带来很大的困难。对于这类网站，如果网站设计者希望这些数据能被搜索引擎搜索，则需要提供一种可以遍历整个数据库内容的方法。

　　对于网页内容的提取，一直是网络蜘蛛中重要的技术。整个系统一般采用插件的形式，通过一个插件管理服务程序，遇到不同格式的网页采用不同的插件处理。这种方式的好处在于扩充性好，以后每发现一种新的类型，就可以把其处理方式做成一个插件补充到插件管理服务程序之中。

　　更新周期

　　由于网站的内容经常在变化，因此网络蜘蛛也需不断的更新其抓取网页的内容，这就需要网络蜘蛛按照一定的周期去扫描网站，查看哪些页面是需要更新的页面，哪些页面是新增页面，哪些页面是已经过期的死链接。

　　搜索引擎的更新周期对搜索引擎搜索的查全率有很大影响。如果更新周期太长，则总会有一部分新生成的网页搜索不到；周期过短，技术实现会有一定难度，而且会对带宽、服务器的资源都有浪费。搜索引擎的网络蜘蛛并不是所有的网站都采用同一个周期进行更新，对于一些重要的更新量大的网站，更新的周期短，如有些新闻网站，几个小时就更新一次；相反对于一些不重要的网站，更新的周期就长，可能一两个月才更新一次。

　　一般来说，网络蜘蛛在更新网站内容的时候，不用把网站网页重新抓取一遍，对于大部分的网页，只需要判断网页的属性（主要是日期），把得到的属性和上次抓取的属性相比较，如果一样则不用更新。

Spider的实现细节

a. URL 的组织和管理考虑到系统自身的资源和时间有限，Spider程序应尽可能的对链接进行筛选，以保证获取信息的质量和效率。Spider程序对新URL 的选择往往与搜索引擎的类型、目标集合、能够处理信息的类型、资源的限制和是否支持Robots限制协议有关。

概括为以下几点:

访问过的和重复的URL排除

文件类型必须被系统处理，不能处理的URL排除

不在目标集合中的排除，被Rohots.txt限制的排除

URL排序也是减轻系统负担的重要手段之一。这就要求计算URL的重要性，如果评估新URI的重要性较高，则会冲掉旧的URL。无论任何情况下，对 Spider而言，首先访问目标集合中的重要站点都是意义和重要的。但是一个页面的重要性的准确评估只能在分析其内容之后进行。可以根据一个页面链接数量的多少来评估此页面是否重要;或者对URL 地址进行解析其中的内容例如以".com", ".edu"，".cn"就较为重要一些，或者可以根据页而标题与当前的热点问题是否相近或相关来评定其页面的重要性。决定网站或页面的重要性的因素很多，也根据各个搜索引擎的侧重点不同而各异，最终的评估方法都依赖于该搜索引擎对于资源获取的要求来决定。影响Spider速度的一种重要因素是DNS查询，为此每个 Spider都要维护一个自己的DNS缓冲。这样每个链接都处于不同的状态，包括:DNS 查询、连接到主机、发送请求、得到响应。这些因素综合起来使得Spider变成一个非常复杂的系统。

b. Spider的遍历规则：页面的遍历主要有两种方式:深度遍历和广度遍历。深度遍历算法可以获得的信息较为集中，信息比较完整，但覆盖面就比较有限，广度遍历算法则刚好相反。

c. Spider实现中的主要问题：虽然Spider的功能很强，但也存在不少的问题:

(1)如果一组URL地址没有被组外URL所链接到，那么Spider就找不到它们。由于spider不能更新过快(因为网络带宽是有限的，更新过快就会影响其他用户的正常使用)，难免有不能及时加入的新网站或新页面。

(2)spider程序在遍历Web时也存在危险，很可能遇到一个环链接而陷入死循环中。简单的避免方法就是忽略已访问过的URL,或限制网站的遍历深度。

(3) Spider程序时大型搜索引擎中很脆弱的部分，因为它与很多的Web报务器、不同的域名服务器打交道，而这些服务完全在系统的控制之外。由于网络上包含了大量的垃圾信息，Spider很可能会收取这些垃圾信息。一个页面出现问题也很可能引起Spider程序中止、崩溃或其他不可预料的行为。因此访问 Internet的Spider程序应该设计得非常强壮，充分考虑各种可能遇到的情况，让Spider在遇到各种情况时可以采取相应的处理行为，而不至于获得一些垃圾信息或者直接就对程序本身造成危害。

Spider构架

发现、搜集网页信息需要有高性能的“网络蜘蛛”程序〔Spider〕去自动地在互联网中搜索信息。一个典型的网络蜘蛛工作的方式:查看一个页面，并从中找到相关信息，然后它再从该页面的所有链接中出发，继续寻找相关的信息，以此类推。网络蜘蛛在搜索引擎整体结构中的位置如下图所示: 初始化时，网络蜘蛛一般指向一个URL ( Uniform ResourceLocator)池。在遍历Internet的过程中，按照深度优先或广度优先或其他启发式算法从URL池中取出若干URL进行处理，同时将未访问的 URL放入URL池中，这样处理直到URL池空为止。对Web文档的索引则根据文档的标题、首段落甚至整个页面内容进行，这取决于搜索服务的数据收集策略。

网络蜘蛛在漫游的过程中，根据页面的标题、头、链接等生成摘要放在索引数据库中。如果是全文搜索，还需要将整个页面的内容保存到本地数据库。网络蜘蛛为实现其快速地浏览整个互联网，通常在技术上采用抢先式多线程技术实现在网上搜索信息。通过抢先式多线程的使用，你能索引一个基于URL链接的 Web页面，启动一个新的线程跟随每个新的URL链接，索引一个新的URL起点。当然在服务器上所开的线程也不能无限膨胀，需要在服务器的正常运转和快速收集网页之间找一个平衡点。

在整个搜索引擎工作过程中，整个蜘蛛的数据入口是URL地址，数据出口是Web页仓库。Spider程序发现URL链接以后，经过Stor处理模块，将我们所需要的网页数据存储在Web页仓库中，为以后的形成网页快照、网页分析提供基础数据。在Spider程序工作的过程中，发现新的链接，对该链接进行分析，形成新的搜索地址，作为下一次Spider程序的数据输入。这个过程的实现就是Spider程序的队列管理。

Spider程序的工作过程，简单来讲，就是不断发现新的链接，并对该链接对应的页面分析存储的工程。如下图所示，

一、索引器：索引器的功能是理解搜索器所搜集的信息，从中抽取出索引项，用于表示文档以及生成文档库的索引表。索引项有客观索引项和内容索引项两种: 客观项：与文档的语意内容无关，如作者名、URL、更新时间、编码、长度、链接流行度(Link Popularity)等等; 内容索引项：是用来反映文档内容的，如关键词及其权重、短语、词、字等等。内容索引项可以分为单索引项和多索引项(或称短语索引项)两种。单索引项对于英文来讲是英语单词，比较容易提取，因为单词之间有天然的分隔符(空格);对于中文等连续书写的语言，必须采用多索引项，进行词语的切分。索引器可以使用集中式索引算法或分布式索引算法。当数据量很大时，必须实现实时索引(Real-time Indexing),否则不能够跟上信息量急剧增加的速度。索引算法对索引器的性能(如大规模峰值查询时的响应速度)有很大的影响。一个搜索引擎的有效性在很大程度取决于索引的质量。由于汉文字符多，处理复杂，中文词的处理不容易。索引器中的中文分词技术：一个分词系统=分词程序+分词词典(1)最大匹配法MM (2)反向最大匹配法RMM (1)最佳匹配法OM (1)双向扫描法[百度的分词就采用了双向扫描法] 系统关键是：分词精度和分词速度

二、建立索引的方法：为了加快检索速度，搜索引擎要对Snider程序搜集到的信,建立倒排索引。（1）全文索引和部分索引有些搜索引擎对于信息库中的页面建立全文索引，有些只建立摘要部分索引或者每个段落前面部分的索引。还有些搜索引擎在建立索引时，要同时考虑超文本的不同标记所表示的含义，如粗体、大字体显示的东西往往比较重要。有些搜索引擎还在建立索引的过程中收集页面中的超链接。这些超链接反映了收集到的信息之间的空间结构。利用这些结果信息可以提高页面相关度判别时的准确度。（2）是否过滤无用词由于网页中存在这许多无用(无实际意义)单词，例如“啊”、“的”等。这此词往往不能明确表达该网页信息，所以有些搜索引擎保存一个无用词汇表，在建立索引时将不对这些词汇建立索引。（3）是否使用Meta标记中的信息网页中的Meta标记用来标注一些非常显示性的信息。有些网页将页面的关键词等信息放在其中。便于在建立索引的过程中提高这些词汇的相关度。（4）是否对图像标记中的替换文本(ALT text)或页面中的注解建立索引由于现有的搜索引擎对图像的检索技术还不太成熟，大多数搜索引擎不支持图像的检索。在超文木的结构页面中，图像标记中往往存放着图像的替换信息。这些信息说明了该图像对应的图像的基本信息。（5）是否支持词干提取技术

三、建立索引的过程：分析过程对文档进行索引并存储到存储桶中排序过程

Spider处理流程

当一个URL被加入到等待队列中时Spider程序就会开始运行。只要等待队列中有一个网页或Spider程序正在处理一个网页，Spider程序就会继续它的工作。当等待队列为空并且当前没有处理任何网页，Spider程序就会停止它的工作。

Spider程序实现初探

Spider 程序是从网上下载Web页面再对其进行处理，为了提高效率，很显然要采用多线程的方法，几个Spider线程同时并行工作，访问不同的链接。构造 Spider程序有两种方式。第一种是将它设计为递归程序，第二种是将它编写成非递归的程序。递归是在一个方法中调用它本身的程序设计技术。当需要重复做同样的基本仟务或在处理先前任务时可展现将来的任务信息时，递归是相当实用的。例如下面的代码:

void RecursiveSpider(String url) {

download URL……

parse URL……

while found each URL

call RecursiveSpider(found URL) ……

process the page just downloaded……

} 这段代码查看单独的一个Web页的任务放在一个RecursiveSpider方法中。在此，调用RecursiveSipder方法来访问URL。当它发现链接时，该方法调用它自己。递归方法在访问很少的网页时，可以使用。因为当一个递归程序运行时要把每次递归压入堆栈(堆栈是个程序结构，每次调用一个方法时，将返回地址存入其中)。如果递归程序要运行很多次，堆栈会变得非常大，它可能会耗尽整个堆栈内存而导致程序中止。递归还有个问题是多线程和递归是不兼容的，因为在这一过程中每一个线程都是自己的堆栈。当一个方法调用它自身时，它们需要使用同一个堆栈。这就是说递归的Spider程序不能使用多线程。非递归程序不调用自身，而是采用队列的方法。队列就是排队，要得到程序的处理就必须在队列中排队等待。我们在构造造Spider时就采用该方式。使用非递归的方法时，给定Spider程序一个要访问的页面，它会将其加入到要访问的站点的队列中去。当Spider发现新的链接时，也会将它们加入到该队列中。 Spider程序会顺序处理队列中的每一个网页。实际在Spider程序中使用了四个队列;在Spider程序的构造过程中，有两种方法用于访问队列的管理。一种方法就是基于内存的队列管理。

第二种方法就是基于SQL的队列管理。基于SQL的队列和基于内存的队列都是有效的，在校园网上做实验的结果表明，在系统运行过程中间，如果 Spider 的访问任务随着网页数量增加，基于内存的Spider程序效率会下降。因而，选择基于SQL的队列管理方案来构造本Spider程序。

等待队列: 在这个队列中，URL等待被Spider程序处理。新发现的URL被加入到该处理队列:当Spider开始处理URL时，它们被传送到这一队列。当一个 URL被处理后它被移送到错误队列或完成队列: 错误队列: 如果下载某一页面时出现错误，它的URL将被加入该队列。该队列的URL不会再移动到其他队列。被列入该队列的URL将不再会被Spider程序处理。

完成队列: 如果页面的下载没有出现任何错误，则该页面将会被加入完成队列。加入该队列的URL不会再移动到其他队列。同一时刻一个URL只能在一个队列中。其实通俗的讲就是该URL处于什么状态，URL 状态的变化过程就是程序处理URL的过程。下图说明的一个URL状态的变化过程。 Spider程序会遇到三种连接：内部连接外部连接其他连接,一个示例Spider类：

Java代码

import java.awt.*; 

 import java.net.*; 
 import java.io.*; 
 import java.lang.*; 
 import java.util.*; 


 class node{ 
 private Object data; 
 private node next; 
 private node prev; 
 public node(Object o){ 
 data = o; 
 prev = next = null; 
 } 
 public String toString(){ 
 if(next!=null)return data.toString() + "\n"+ next.toString(); 
 return data.toString(); 
 } 
 public node getNext(){return next;} 
 public void setNext(node n){next = n;} 
 public node getPrev(){return prev;} 
 public void setPrev(node n){prev = n;} 
 public Object getData(){return data;} 
 } 

 class linkedlist{ 
 node head; 
 node tail; 
 public linkedlist(){ 
 tail = head = null; 
 } 
 public String toString(){ 
 if(head==null)return "Empty list"; 
 return head.toString(); 
 } 
 public void insert(Object o){ 
 if(tail==null){ 
head = tail = new node(o); 
 }else{ 
 node nn = new node(o); 
 tail.setNext(nn); 
 tail=nn; 
 } 
 } 
 public boolean contains(Object o){ 
 for(node n = head;n!=null;n=n.getNext()){ 
 if(o.equals(n.getData()))return true; 
 } 
 return false; 
 } 
 public Object pop(){ 
if(head==null)return null; 
 Object ret = head.getData(); 
 head = head.getNext(); 
 if(head==null)tail = null; 
 return ret; 
 } 
 public boolean isEmpty(){ 
 return head==null; 
 } 
 } 


 class list{ 
 protected node tail; 
 protected node ptr; 
 private boolean stop; 
 public list(){ 
 ptr=tail=null; 
 stop=false; 
 } 
 public boolean isEmpty(){return tail==null;} 
 public void reset(){ 
 stop=false; 
 ptr=tail; 
 } 
 public String toString(){ 
 if(tail==null)return "Empty list"; 
 String ret=""; 
 for(node n =tail.getNext();n!=tail;n=n.getNext())ret+=n.getData().toString()+"\n";
 ret+=tail.getData().toString(); 
 return ret; 
 } 
 public Object get(){ 
 if(ptr==null)return null; 
 ptr = ptr.getNext(); 
 if(ptr==tail.getNext()){ 
 if(stop)return null; 
 stop=true; 
 return tail.getNext().getData(); 
 } 
 return ptr.getData(); 
 } 
 public void insert(Object o, boolean attail){ 
 node nn = new node(o); 
 if(tail==null){ 
nn.setNext(nn); 
    nn.setPrev(nn); 
    ptr=tail=nn; 
    return; 
 } 
 if(attail){ 
 tail.getNext().setPrev(nn); 
    nn.setNext(tail.getNext()); 
    tail.setNext(nn); 
    nn.setPrev(tail); 
    tail=nn; 
 }else{ 
    nn.setNext(tail.getNext()); 
    nn.setPrev(tail); 
    tail.setNext(nn); 
    nn.getNext().setPrev(nn); 
 } 
 } 
public void insert(Object o){} 
 } 
    
 class stack extends list{ 
 public stack(){super();} 
 public void insert(Object o){insert(o, false);} 
 } 
 class queue extends list{ 
 public queue(){super();} 
 public void insert(Object o){insert(o, true);} 
 public String peek(){ 
    if(tail==null)return ""; 
    return tail.getNext().getData().toString(); 
 } 
 public Object pop(){ 
 if(tail==null)return null; 
 Object ret = tail.getNext().getData(); 
 if(tail.getNext()==tail){ 
    tail=ptr=null; 
 }else{ 
    if(tail.getNext()==ptr)ptr=ptr.getNext(); 
    tail.setNext(tail.getNext().getNext()); 
 } 
 return ret; 
 } 
 } 
    
    
 class hashtable{ 
    private Vector table; 
    private int size; 
    public hashtable(){ 
 size = 991; 
 table = new Vector(); 
 for(int i=0;i", loc); 
 if(loc==-1){ 
      errors.insert("malformed frame at"+site.toString()); 
      loc = beg; 
 } 
 else{ 
      try{ 
    parseFrame(site, source.substring(beg, loc)); 
      } 
      catch(Exception e){ 
    errors.insert("while parsing "+site.toString()+",error parsing frame: "+e.toString());
      } 
 } 
    } 
    
    //found "", loc); 
 if(loc==-1){ 
      errors.insert("malformed linked at"+site.toString()); 
      loc = beg; 
 } 
 else{ 
      try{ 
    parseLink(site, source.substring(beg, loc)); 
      } 
      catch(Exception e){ 
    errors.insert("while parsing "+site.toString()+",error parsing link: "+e.toString());
      } 
 } 
    } 
 } 
    } 
      
    /* 
    * parses a frame 
    */ 
    private void parseFrame(URL at_page, String s) throws Exception{ 
 int beg=s.indexOf("src"); 
 if(beg==-1)beg=s.indexOf("SRC"); 
 if(beg==-1)return;//doesn't have a src, ignore 
 beg = s.indexOf("=", beg); 
 if(beg==-1)throw new Exception("while parsing"+at_page.toString()+", bad frame, missing \'=\' after src:"+s);
 int start = beg; 
 for(;beg=end){//missing quotes... just take the first token after"src=" 
    for(beg=start+1;beg=end){ 
    errors.insert("while parsing "+at_page.toString()+",bad frame: "+s); 
    return; 
 } 
    
 String linkto=s.substring(beg,end); 
 if(linkto.startsWith("mailto:")||linkto.startsWith("Mailto:"))return;
 if(linkto.startsWith("javascript:")||linkto.startsWith("Javascript:"))return;
 if(linkto.startsWith("news:")||linkto.startsWith("Javascript:"))return;
 try{ 
    addSite(new URL(at_page, linkto)); 
    return; 
 }catch(Exception e1){} 
 try{ 
    addSite(new URL(linkto)); 
    return; 
 }catch(Exception e2){} 
 try{ 
    URL cp = new URL(at_page.toString()+"/index.html"); 
    System.out.println("attemping to use "+cp); 
    addSite(new URL(cp, linkto)); 
    return; 
 }catch(Exception e3){} 
 errors.insert("while parsing "+at_page.toString()+", bad frame:"+linkto+", formed from: "+s);
    } 
    
    /* 
    * given a link at a URL, will parse it and add it to the list ofsites to do 
    */ 
    private void parseLink(URL at_page, String s) throws Exception{ 
 //System.out.println("parsing link "+s); 
 int beg=s.indexOf("href"); 
 if(beg==-1)beg=s.indexOf("HREF"); 
 if(beg==-1)return;//doesn't have a href, must be an anchor 
 beg = s.indexOf("=", beg); 
 if(beg==-1)throw new Exception("while parsing"+at_page.toString()+", bad link, missing \'=\' after href:"+s);
 int start = beg; 
 for(;beg=end){//missing quotes... just take the first token after"href=" 
    for(beg=start+1;beg=end){ 
    errors.insert("while parsing"+at_page.toString()+", bad href: "+s); 
    return; 
 } 
    
 String linkto=s.substring(beg,end); 
 if(linkto.startsWith("mailto:")||linkto.startsWith("Mailto:"))return;
 if(linkto.startsWith("javascript:")||linkto.startsWith("Javascript:"))return;
 if(linkto.startsWith("news:")||linkto.startsWith("Javascript:"))return;
    
 try{ 
    addSite(new URL(at_page, linkto)); 
    return; 
 }catch(Exception e1){} 
 try{ 
    addSite(new URL(linkto)); 
    return; 
 }catch(Exception e2){} 
 try{ 
    addSite(new URL(newURL(at_page.toString()+"/index.html"), linkto)); 
    return; 
 }catch(Exception e3){} 
 errors.insert("while parsing "+at_page.toString()+", bad link:"+linkto+", formed from: "+s);
    } 
    
    /* 
    * gets the title of a web page with content s 
    */ 
    private String getTitle(String s){ 
 try{ 
    int beg=s.indexOf(""); 
    if(beg==-1)beg=s.indexOf("<TITLE>"); 
    int end=s.indexOf(""); 
    if(end==-1)end=s.indexOf(""); 
    return s.substring(beg,end); 
 } 
 catch(Exception e){return "";} 
    } 
    
    /* 
    * gets the text of a web page, times out after 10s 
    */ 
    private String getText(URL site) throws Exception 
    { 
 urlReader u = new urlReader(site); 
 Thread t = new Thread(u); 
 t.setDaemon(true); 
 t.start(); 
 t.join(TIMEOUT); 
 String ret = u.poll(); 
 if(ret==null){ 
 throw new Exception("connection timed out"); 
 }else if(ret.equals("Not html")){ 
 throw new Exception("Not an HTML document"); 
 } 
 return ret; 
    } 
    
    /* 
    * returns how many sites have been visited so far 
    */ 
    public int Visited(){return visitedsites;} 
 } 
    
 class urlReader implements Runnable{ 
    URL site; 
    String s; 
    public urlReader(URL u){ 
 site = u; 
 s=null; 
    } 
    public void run(){ 
 try{ 
    String ret=new String(); 
    URLConnection u = site.openConnection(); 
    String type = u.getContentType(); 
    if(type.indexOf("text")==-1 &&   
      type.indexOf("txt")==-1&&   
      type.indexOf("HTM")==-1&&   
      type.indexOf("htm")==-1){ 
 //System.err.println("bad content type "+type+" at site"+site); 
 System.out.println("bad content type "+type+" at site"+site); 
 ret = "Not html"; 
 return; 
    } 
    InputStream in = u.getInputStream(); 
    BufferedInputStream bufIn = new BufferedInputStream(in); 
    int data; 
    while(true){ 
 data = bufIn.read(); 
 // Check for EOF 
 if (data == -1) break; 
 else ret+= ( (char) data); 
    } 
    s = ret; 
 }catch(Exception e){s=null;} 
    } 
    public String poll(){return s;} 
 } 
    
 public class spidergui extends Frame{ 
    
 private spider s; 
 private Color txtColor; 
 private Color errColor; 
private Color topColor; 
 private Color numColor; 
 private Color curColor; 
    
 public spidergui(spider spi, String title){ 
 super(title); 
 curColor = new Color(40, 40, 200); 
 txtColor = new Color(0, 0, 0); 
 errColor = new Color(255, 0, 0); 
 topColor = new Color(40, 40, 100); 
 numColor = new Color(50, 150, 50); 
 s=spi; 
 setBounds(0, 0, 800, 600); 
 show(); 
 toFront(); 
 repaint(); 
 } 
 public void endShow(){ 
 System.out.println(s); 
 hide(); 
 dispose(); 
 } 
 public void paint(Graphics g){ 
 super.paint(g); 
 s.todo.reset(); 
 s.done.reset(); 
 s.errors.reset(); 
 s.omittions.reset(); 
 String txt; 
 Object o; 
 g.setColor(curColor); 
 g.setFont(new Font("arial", Font.PLAIN, 18)); 
 String cur = s.getCurrent(); 
 if(cur.length()>80)g.drawString( 
    cur.substring(0, 40)+ 
    " . . . "+ 
    cur.substring(cur.length()-30, cur.length()), 
 50, 50); 
 else g.drawString(cur, 50, 50); 
    
 g.setColor(numColor); 
 g.setFont(new Font("arial", Font.BOLD, 24)); 
 g.drawString(Integer.toString(s.Visited()), 350, 80); 
    
 g.setFont(new Font("arial", Font.PLAIN, 14)); 
 g.setColor(topColor); 
 g.drawString("To Do:", 100, 80); 
 g.drawString("Completed:", 500, 80); 
 g.drawString("Ignored:", 500, 250); 
 g.drawString("Errors:", 100, 420); 
    
 g.setColor(txtColor); 
 g.setFont(new Font("arial", Font.PLAIN, 12)); 
 for(int i=0;i<23 && (o=s.todo.get())!=null;i++){ 
txt = Integer.toString(i+1) + ": "+o.toString(); 
 if(txt.length()>65)g.drawString( 
    txt.substring(0, 38) + 
    " . . . " + 
    txt.substring(txt.length()-18, txt.length()), 
 20, 100+13*i); 
 else g.drawString(txt, 20, 100+13*i); 
 } 
 for(int i=0;i<10 && (o=s.done.get())!=null;i++){ 
 txt = Integer.toString(i+1) + ": "+o.toString(); 
 if(txt.length()>60)g.drawString(txt.substring(0, 57)+"...", 400,100+13*i); 
 else g.drawString(txt, 400, 100+13*i); 
 } 
 for(int i=0;i<10 && (o=s.omittions.get())!=null;i++){ 
 txt = Integer.toString(i+1) + ": "+o.toString(); 
 if(txt.length()>60)g.drawString(txt.substring(0, 57)+"...", 400,270+13*i); 
 else g.drawString(txt, 400, 270+13*i); 
 } 
 g.setColor(errColor); 
 for(int i=0;i<10 && (o=s.errors.get())!=null;i++){ 
 txt = Integer.toString(i+1) + ": "+o.toString(); 
 g.drawString(txt, 20, 440+13*i); 
 } 
    
 } 
 public void run(){ 
 repaint(); 
 while(s.hasMore()){ 
 repaint(); 
 s.doNextSite(); 
 } 
 repaint(); 
 } 
    
 public static void main(String []args){ 
 int max = 5; 
 String site=""; 
 String base=""; 
 int time=0; 
 for(int i=0;i switch to set, or-help for more info."); 
    System.exit(1); 
 } 
    
 spider spi=new spider(site, max, base); 
    
 if(time>0)spi.setTimer(time); 
    
 spidergui s = new spidergui(spi, "Spider: "+site); 
 s.run(); 
 System.out.println(spi); 
 } 
 }

另一个实现：

这是一个web搜索的基本程序，从命令行输入搜索条件（起始的URL、处理url的最大数、要搜索的字符串),
它就会逐个对Internet上的URL进行实时搜索,查找并输出匹配搜索条件的页面。这个程序的原型来自《java编程艺术》，
为了更好的分析，站长去掉了其中的GUI部分，并稍作修改以适用jdk1.5。以这个程序为基础，可以写出在互联网上搜索
诸如图像、邮件、网页下载之类的“爬虫”。
先请看程序运行的过程：

D:\java>javac SearchCrawler.java（编译）

D:\java>java SearchCrawler http://127.0.0.1:8080/zz3zcwbwebhome/index.jsp20 java

Start searching...
result:
searchString=java
http://127.0.0.1:8080/zz3zcwbwebhome/index.jsp
http://127.0.0.1:8080/zz3zcwbwebhome/reply.jsp
http://127.0.0.1:8080/zz3zcwbwebhome/learn.jsp
http://127.0.0.1:8080/zz3zcwbwebhome/download.jsp
http://127.0.0.1:8080/zz3zcwbwebhome/article.jsp
http://127.0.0.1:8080/zz3zcwbwebhome/myexample/jlGUIOverview.htm
http://127.0.0.1:8080/zz3zcwbwebhome/myexample/Proxooldoc/index.html
http://127.0.0.1:8080/zz3zcwbwebhome/view.jsp?id=301
http://127.0.0.1:8080/zz3zcwbwebhome/view.jsp?id=297
http://127.0.0.1:8080/zz3zcwbwebhome/view.jsp?id=291
http://127.0.0.1:8080/zz3zcwbwebhome/view.jsp?id=286
http://127.0.0.1:8080/zz3zcwbwebhome/view.jsp?id=285
http://127.0.0.1:8080/zz3zcwbwebhome/view.jsp?id=284
http://127.0.0.1:8080/zz3zcwbwebhome/view.jsp?id=276
http://127.0.0.1:8080/zz3zcwbwebhome/view.jsp?id=272

又如：
D:\java>java SearchCrawler http://www.sina.com20 java
Start searching...
result:
searchString=java
http://sina.com
http://redirect.sina.com/WWW/sinaCN/www.sina.com.cnclass=a2
http://redirect.sina.com/WWW/sinaCN/www.sina.com.cnclass=a8
http://redirect.sina.com/WWW/sinaHK/www.sina.com.hkclass=a2
http://redirect.sina.com/WWW/sinaTW/www.sina.com.twclass=a8
http://redirect.sina.com/WWW/sinaUS/home.sina.comclass=a8
http://redirect.sina.com/WWW/smsCN/sms.sina.com.cn/class=a2
http://redirect.sina.com/WWW/smsCN/sms.sina.com.cn/class=a3
http://redirect.sina.com/WWW/sinaNet/www.sina.net/class=a3

D:\java>
下面是这个程序的源码
Java代码

import java.util.*; 
 import java.net.*; 
 import java.io.*; 
 import java.util.regex.*; 

 // 搜索Web爬行者 
public class SearchCrawler implements Runnable{ 
    
 /* disallowListCache缓存robot不允许搜索的URL。 Robot协议在Web站点的根目录下设置一个robots.txt文件, 
 *规定站点上的哪些页面是限制搜索的。 搜索程序应该在搜索过程中跳过这些区域,下面是robots.txt的一个例子: 
 # robots.txt for http://somehost.com/ 
    User-agent: * 
    Disallow: /cgi-bin/ 
    Disallow: /registration # /Disallow robots on registration page 
    Disallow: /login 
 */ 


 private HashMap< String,ArrayList< String>> disallowListCache = newHashMap< String,ArrayList< String>>();  
 ArrayList< String> errorList= new ArrayList< String>();//错误信息   
ArrayList< String> result=new ArrayList< String>(); //搜索到的结果   
String startUrl;//开始搜索的起点 
int maxUrl;//最大处理的url数 
String searchString;//要搜索的字符串(英文) 
boolean caseSensitive=false;//是否区分大小写 
boolean limitHost=false;//是否在限制的主机内搜索 
    
public SearchCrawler(String startUrl,int maxUrl,String searchString){ 
   this.startUrl=startUrl; 
    this.maxUrl=maxUrl; 
    this.searchString=searchString; 
 } 

    public ArrayList< String> getResult(){ 
        return result; 
    } 

 public void run(){//启动搜索线程 
        
        crawl(startUrl,maxUrl,searchString,limitHost,caseSensitive); 
 } 
      

     //检测URL格式 
private URL verifyUrl(String url) { 
     // 只处理HTTP URLs. 
     if (!url.toLowerCase().startsWith("http://")) 
       return null; 

     URL verifiedUrl = null; 
     try { 
       verifiedUrl = new URL(url); 
     } catch (Exception e) { 
       return null; 
     } 

     return verifiedUrl; 
 } 

 // 检测robot是否允许访问给出的URL. 
 private boolean isRobotAllowed(URL urlToCheck) {   
     String host = urlToCheck.getHost().toLowerCase();//获取给出RUL的主机   
     //System.out.println("主机="+host);

     // 获取主机不允许搜索的URL缓存   
     ArrayList< String> disallowList=disallowListCache.get(host);   

     // 如果还没有缓存,下载并缓存。   
     if (disallowList == null) {   
       disallowList = new ArrayList();   
       try {   
         URL robotsFileUrl =newURL("http://" + host + "/robots.txt");   
         BufferedReader reader =newBufferedReader(new InputStreamReader(robotsFileUrl.openStream()));  

         // 读robot文件，创建不允许访问的路径列表。   
         String line;   
         while ((line = reader.readLine()) !=null) {   
           if(line.indexOf("Disallow:") == 0) {//是否包含"Disallow:"  
             StringdisallowPath =line.substring("Disallow:".length());//获取不允许访问路径  

             // 检查是否有注释。   
             intcommentIndex = disallowPath.indexOf("#");   
             if(commentIndex != - 1) {   
              disallowPath =disallowPath.substring(0, commentIndex);//去掉注释   
            }   
               
             disallowPath= disallowPath.trim();   
            disallowList.add(disallowPath);   
            }   
          }   

         // 缓存此主机不允许访问的路径。   
         disallowListCache.put(host,disallowList);   
       } catch (Exception e) {   
              return true; //web站点根目录下没有robots.txt文件,返回真 
      }   
     }   

        
      String file = urlToCheck.getFile();   
      //System.out.println("文件getFile()="+file);
      for (int i = 0; i < disallowList.size(); i++){   
        String disallow =disallowList.get(i);   
        if (file.startsWith(disallow)){   
          return false;   
        }   
      }   
    
      return true;   
    }   
    
    
    
     
    private String downloadPage(URL pageUrl) { 
       try { 
          // Open connection to URL forreading. 
          BufferedReader reader = 
            newBufferedReader(new InputStreamReader(pageUrl.openStream())); 
    
          // Read page into buffer. 
          String line; 
          StringBuffer pageBuffer = newStringBuffer(); 
          while ((line =reader.readLine()) != null) { 
           pageBuffer.append(line); 
          } 
            
          return pageBuffer.toString(); 
       } catch (Exception e) { 
       } 
    
       return null; 
    } 
    
    // 从URL中去掉"www"
    private String removeWwwFromUrl(String url) { 
      int index = url.indexOf("://www."); 
     if (index != -1) { 
        return url.substring(0, index + 3) + 
          url.substring(index + 7); 
      } 
    
      return (url); 
    } 
    
    // 解析页面并找出链接 
   private ArrayList< String> retrieveLinks(URL pageUrl, StringpageContents, HashSet crawledList,
      boolean limitHost) 
    { 
      // 用正则表达式编译链接的匹配模式。 
Pattern p=    Pattern.compile("]",Pattern.CASE_INSENSITIVE);
      Matcher m = p.matcher(pageContents); 
    
        
      ArrayList< String> linkList = new ArrayList(); 
      while (m.find()) { 
        String link = m.group(1).trim(); 
          
        if (link.length() < 1) { 
          continue; 
        } 
    
        // 跳过链到本页面内链接。 
       if (link.charAt(0) == '#') { 
          continue; 
        } 
    
          
        if (link.indexOf("mailto:") !=-1) { 
          continue; 
        } 
         
        if(link.toLowerCase().indexOf("javascript") != -1) { 
          continue; 
        } 
    
        if (link.indexOf("://") == -1){ 
          if (link.charAt(0) == '/') {//处理绝对地    
            link ="http://" + pageUrl.getHost()+":"+pageUrl.getPort()+ link; 
          } else{           
            String file =pageUrl.getFile(); 
            if(file.indexOf('/') == -1) {//处理相对地址 
             link ="http://" + pageUrl.getHost()+":"+pageUrl.getPort() +"/" + link;
            } else { 
              Stringpath =file.substring(0, file.lastIndexOf('/') + 1); 
              link ="http://" + pageUrl.getHost() +":"+pageUrl.getPort()+ path+ link;
            } 
          } 
        } 
    
        int index = link.indexOf('#'); 
        if (index != -1) { 
          link = link.substring(0,index); 
        } 
    
        link = removeWwwFromUrl(link); 
    
        URL verifiedLink = verifyUrl(link); 
        if (verifiedLink == null) { 
          continue; 
        } 
    
        /* 如果限定主机，排除那些不合条件的URL*/ 
       if (limitHost && 
           !pageUrl.getHost().toLowerCase().equals( 
             verifiedLink.getHost().toLowerCase())) 
        { 
          continue; 
        } 
    
        // 跳过那些已经处理的链接. 
        if (crawledList.contains(link)) { 
          continue; 
        } 
    
         linkList.add(link); 
      } 
    
     return (linkList); 
    } 
    
 // 搜索下载Web页面的内容，判断在该页面内有没有指定的搜索字符串 
   
    private boolean searchStringMatches(String pageContents, StringsearchString, boolean caseSensitive){
         String searchContents =pageContents;   
         if (!caseSensitive) {//如果不区分大小写 
           searchContents =pageContents.toLowerCase(); 
         } 
    
        
      Pattern p = Pattern.compile("[\\s]+"); 
      String[] terms = p.split(searchString); 
      for (int i = 0; i < terms.length; i++) { 
        if (caseSensitive) { 
          if(searchContents.indexOf(terms[i]) == -1) { 
            return false; 
          } 
        } else { 
          if(searchContents.indexOf(terms[i].toLowerCase()) == -1) { 
            return false; 
          } 
        }     } 
    
      return true; 
    } 
    
      
    //执行实际的搜索操作 
   public ArrayList< String> crawl(String startUrl, intmaxUrls, String searchString,boolean limithost,boolean caseSensitive )
    {   
        
     System.out.println("searchString="+searchString); 
      HashSet< String> crawledList = new HashSet(); 
      LinkedHashSet< String> toCrawlList = newLinkedHashSet< String>(); 
    
       if (maxUrls < 1) { 
          errorList.add("InvalidMax URLs value."); 
         System.out.println("Invalid Max URLs value."); 
        } 
      
        
      if (searchString.length() < 1) { 
        errorList.add("Missing SearchString."); 
        System.out.println("Missing searchString"); 
      } 
    
        
      if (errorList.size() > 0) { 
        System.out.println("err!!!"); 
        return errorList; 
        } 
    
        
      // 从开始URL中移出www 
      startUrl = removeWwwFromUrl(startUrl); 
    
        
      toCrawlList.add(startUrl); 
      while (toCrawlList.size() > 0) { 
          
        if (maxUrls != -1) { 
          if (crawledList.size() ==maxUrls) { 
            break; 
          } 
        } 
    
        // Get URL at bottom of the list. 
        String url =toCrawlList.iterator().next(); 
    
        // Remove URL from the to crawl list. 
        toCrawlList.remove(url); 
    
        // Convert string url to URL object. 
        URL verifiedUrl = verifyUrl(url); 
   
        // Skip URL if robots are not allowed toaccess it. 
        if (!isRobotAllowed(verifiedUrl)) { 
          continue; 
        } 
    
        
        // 增加已处理的URL到crawledList 
        crawledList.add(url); 
        String pageContents =downloadPage(verifiedUrl); 
    
          
        if (pageContents != null &&pageContents.length() > 0){ 
          // 从页面中获取有效的链接 
         ArrayList< String> links=retrieveLinks(verifiedUrl, pageContents, crawledList,limitHost);
         
          toCrawlList.addAll(links); 
    
          if(searchStringMatches(pageContents, searchString,caseSensitive)) 
          { 
            result.add(url); 
           System.out.println(url); 
          } 
       } 
    
        
      } 
     return result; 
    } 
    
    // 主函数 
   public static void main(String[] args) { 
       if(args.length!=3){ 
          System.out.println("Usage:javaSearchCrawler startUrl maxUrl searchString");
          return; 
       } 
      int max=Integer.parseInt(args[1]); 
      SearchCrawler crawler = newSearchCrawler(args[0],max,args[2]); 
      Thread search=new Thread(crawler); 
      System.out.println("Start searching..."); 
      System.out.println("result:"); 
      search.start(); 
       
    } 
 }

你可能感兴趣的:(java技术)

java 技术架构相关文档圣心 java 架构开发语言
在Java中，有许多不同的技术和架构，这里我将列举一些常见的Java技术和架构，并提供一些相关的文档资源。SpringFrameworkSpring是一个开源的Java/JavaEE全功能框架，以Apache许可证形式发布，提供了一种实现企业级应用的方法。官方文档：SpringFrameworkSpringBootSpringBoot是Spring的一个子项目，旨在简化创建生产级的Spring应用
Java 并发编程：Java 线程池的介绍与使用栗筝i 栗筝i 的 Java 技术栈 #Java 基础栗筝i 的 Java 技术栈 Java基础 Java 并发 Java 线程池
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第024篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
基于springboot+vue的“考研资讯平台”程序设计实现【毕业论文，源码】一枚务实的码农毕业设计毕设考研 spring boot 毕业论文系统源码
摘要随着现在网络的快速发展，网络的应用在各行各业当中它很快融入到了许多学校的眼球之中，他们利用网络来做这个电商的服务，随之就产生了“考研资讯平台”，这样就让学生考研资讯平台更加方便简单。对于本考研资讯平台的设计来说，它主要是采用java技术。在整个系统的设计当中它是应用mysql数据库来完成的，具体根据网上考研资讯平台的现状来进行开发的，具体根据学生需求实现网上考研资讯平台网络化的管理，各类信息有
Java 基于 SpringBoot+vue 的大学生科创项目在线管理系统（附源码）程序员徐师兄 java spring boot vue.js 大学生科创项目管理系统大学生科创项目
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》Python项目实战《100套》
☕【Java技术指南】「Java8技术盲区」在奔向Java13的同时，也让我们仔细研究一下Stream的学习认知！洛神灬殇
Java8的功能之最要说到Java8的技术体系中，最让人难以忘怀的功能，那非Lambda和Stream莫属了。两者结合操作，达成天作之合，有点势不可挡。它主要用于补充集合类，它的强大，相信用过它的朋友，能明显的感受到，不用使用for循环就能对集合作出很好的操作。Stream使用一种类似用SQL语句从数据库查询数据的直观方式来提供一种对Java集合运算和表达的高阶抽象。这种风格将要处理的元素集合看作
Java虚拟机：运行时内存结构栗筝i 栗筝i 的 Java 技术栈 #Java 基础栗筝i 的 Java 技术栈 Java 基础 Java 虚拟机
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第035篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
手把手教你从零开始开发上线一个生产级别的 Java 小说系统大牛撸码 java 开发语言
项目简介novel是一套基于时下最新Java技术栈SpringBoot3+Vue3开发的前后端分离的学习型小说项目，配备详细的项目开发文档手把手教你从零开始开发上线一个生产级别的Java系统，由小说门户系统、作家后台管理系统、平台后台管理系统等多个子系统构成。包括小说推荐、作品检索、小说排行榜、小说阅读、小说评论、会员中心、作家专区、充值订阅、新闻发布等功能。#开发环境MySQL8.0Redis7
Java 数据类型 -- Java 语言的 8 种基本数据类型、字符串与数组栗筝i 栗筝i 的 Java 技术栈 #Java 基础栗筝i 的 Java 技术栈 Java 基础 Java 入门 Java 数据类型 Java
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第004篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
什么是JVM？它有什么作用？ xiangpingeasy Java面试题 jvm
Java虚拟机（JVM）是运行所有Java程序的软件平台，它独立于硬件和操作系统。JVM是Java技术的核心部分，使得Java能够实现“一次编写，到处运行”（WriteOnce,RunAnywhere，WORA）的特性。JVM主要有以下作用：1.程序的执行JVM负责读取Java字节码（.class文件），并将其转换为机器码执行。这个过程可以通过解释执行（逐行转换并运行）或JIT编译执行（将字节码编
Java技术：2024年开发者必须了解的10个要点青云交 java 开发语言编程语言微服务架构
摘要：随着技术的不断发展，Java语言和其生态系统也在不断演进。本文旨在为Java开发者总结2024年必须掌握的关键技术点和最佳实践。1.浅谈Java语言基础与面向对象编程(OOP)简介Java语言的基础和面向对象的核心概念，强调它们在构建复杂系统中的重要性。2.深入了解Java技术栈评述常用的Java技术栈及其优势，引导开发者合理选择适合项目的技术组合。3.JavaEE框架的探索之旅分析和比较不
java版本ERP管理系统源码 Spring Cloud alibaba Spring Boot MybatisPlus Redis VUE3 ElementUI 微服务 m0_66404702 java spring boot redis ERP管理系统源码
在当今数字化浪潮的推动下，企业对于高效、稳定且易于扩展的管理系统需求日益增长。为了满足这一需求，我们精心打造了一款基于Java技术的鸿鹄ERP（EnterpriseResourcePlanning）管理系统。该系统充分利用了SpringCloudAlibaba、SpringBoot、MybatisPlus、Redis等先进技术栈，并结合前端框架VUE3和ElementUI，构建了一个功能丰富、性能
Java 并发集合：阻塞队列集合介绍栗筝i 栗筝i 的 Java 技术栈 #Java 基础栗筝i 的 Java 技术栈 Java基础 Java 并发 Java 集合阻塞队列
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第028篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
【精选】基于HTML5技术应用于智能宠物寻找与领养系统的设计与实现（全网独一无二，阿龙独创）程序员阿龙 JAVA精选毕设宠物 eclipse java tomcat 毕业设计 spring cloud intellij-idea
博主介绍：✌我是阿龙，一名专注于Java技术领域的程序员，全网拥有10W+粉丝。作为CSDN特邀作者、博客专家、新星计划导师，我在计算机毕业设计开发方面积累了丰富的经验。同时，我也是掘金、华为云、阿里云、InfoQ等平台的优质作者。通过长期分享和实战指导，我致力于帮助更多学生完成毕业项目和技术提升。技术范围：我熟悉的技术领域涵盖SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nod
Java编程开发新手学习：数组方法的应用猜字母游戏 Java小辰
Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言。Java技术具有卓越的通用性、高效性、平台移植性和安全性，广泛应用于PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网，同时拥有全球最大的开发者专业社群。给你学习路线：html-css-js-jq-javase-数据库-jsp-servlet-Struts2-hibernate-mybatis-spring4-springmv
Java开发的企业级Spring Cloud ERP管理系统源码 m0_67544708 java spring cloud ERP管理系统
标题改写：“全面解析鸿鹄ERP管理系统的功能模块与操作流程”文章改写：随着数字化转型的深入，企业对于高效、稳定且具有扩展性的管理系统的需求日益增加。为此，我们开发了一套基于Java技术的鸿鹄ERP管理系统，该系统整合了SpringCloudAlibaba、SpringBoot、MybatisPlus、Redis等前沿技术，并采用了VUE3和ElementUI作为前端框架，打造了一个功能丰富、性能卓
Java行之有效的学习方法，Java直播课：Spring Cloud Alibaba Nacos 注册中心 HUIYL1
Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言。Java技术具有卓越的通用性、高效性、平台移植性和安全性，广泛应用于PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网，同时拥有全球最大的开发者专业社群。Java是一种简单的，跨平台的，面向对象的，分布式的，解释的，健壮的安全的，结构的中立的，可移植的，性能很优异的多线程的，动态的语言。java编程学习方法有哪些呢?01零基础
【PostgreSQL教程】PostgreSQL 高级篇之触发器 No8g攻城狮 postgresql 数据库 sql mysql oracle
博主介绍：✌全网粉丝20W+，CSDN博客专家、Java领域优质创作者，掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌技术范围：SpringBoot、SpringCloud、Vue、SSM、HTML、Nodejs、Python、MySQL、PostgreSQL、大数据、物联网、机器学习等设计与开发。感兴趣的可以先关注收藏起来，在工作中、生活上等遇到相关问题都可以给我留言咨
Java 集合框架：TreeMap 的介绍、使用、原理与源码解析栗筝i 栗筝i 的 Java 技术栈 #Java 基础栗筝i 的 Java 技术栈 Java基础 Java集合 TreeMap r-tree
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第021篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
基于SpringBoot停车场管理系统的设计与实现一点教程 Java项目 spring boot 后端 java spring 停车场管理系统
博主主页：一点教程博主简介：专注Java技术领域和毕业设计项目实战、Java微信小程序、安卓等技术开发，远程调试部署、代码讲解、文档指导、ppt制作等技术指导。主要内容：毕业设计，SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Python、Nodejs、小程序、安卓app、大数据等设计与开发感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以和博主沟通，希
Java 集合框架：Java 中的 Set 集合（HashSet & LinkedHashSet & TreeSet）特点与实现解析栗筝i 栗筝i 的 Java 技术栈 #Java 基础栗筝i 的 Java 技术栈 Java基础 Java集合 Java Set Set 集合
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第017篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
Java虚拟机：类的加载机制栗筝i 栗筝i 的 Java 技术栈 #Java 基础栗筝i 的 Java 技术栈 Java 基础 Java 虚拟机
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第034篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
基于Java+SpringMVC+vue+element宠物管理系统设计实现央顺技术团队成品程序项目 java vue.js 宠物数据库 mybatis 前端 spring boot
基于Java+SpringMVC+vue+element宠物管理系统设计实现博主介绍：5年java开发经验，专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域作者主页央顺技术团队Java毕设项目精品实战案例《1000套》欢迎点赞收藏⭐留言文末获取源码联系方式文章目录基于Java+SpringMVC+vue+element宠物管理系统设计实现一、前言介绍：二、系统
基于Java+SpringBoot+vue实现图书借阅和销售商城一体化系统央顺技术团队成品程序项目 java spring boot vue.js 开发语言后端 mybatis 毕业设计
基于Java+SpringBoot+vue实现图书借阅和销售商城一体化系统作者主页央顺技术团队博主介绍：5年java开发经验，专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域欢迎点赞收藏⭐留言文末获取源码联系方式文章目录基于Java+SpringBoot+vue实现图书借阅和销售商城一体化系统前言介绍：系统实现功能：系统设计：业务流程分析：图书信息实体图系统流
基于Java+SpringBoot+vue+element实现前后端分离玩具商城系统央顺技术团队成品程序项目 java spring boot vue.js 毕业设计 spring 后端
基于Java+SpringBoot+vue+element实现前后端分离玩具商城系统博主介绍：5年java开发经验，专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域作者主页央顺技术团队Java毕设项目精品实战案例《1000套》欢迎点赞收藏⭐留言文末获取源码联系方式文章目录基于Java+SpringBoot+vue+element实现前后端分离玩具商城系统前言介
超越传统搜索引擎：揭秘IndexTank的强大搜索引擎原理（一）凛鼕将至搜索引擎
本系列文章简介：本系列文章将从IndexTank的工作原理和应用领域等方面揭秘其强大的搜索引擎原理。我们将深入探讨其索引结构的构建、高效的查询处理算法以及优化策略等关键要素。此外，我们还将探讨IndexTank的优点和应用领域，包括电子商务、新闻聚合、社交媒体分析等。欢迎大家订阅《Java技术栈高级攻略》专栏，一起学习，一起涨分！目录一、引言1.1IndexTank简介1.2IndexTank与传
什么是B+树，和B树有什么不同？激流丶日常 b树数据结构 B+树 java
博主介绍：博主从事应用安全和大数据领域，有8年研发经验，5年面试官经验，Java技术专家，WEB架构师，阿里云专家博主，华为云云享专家，51CTO专家博主⛪️个人社区：个人社区个人主页：个人主页专栏地址：✅Java中级八股文专题：剑指大厂，手撕Java八股文文章目录1.什么是B+树2.什么是B树3.B+和B树有什么区别4.B+树有什么应用5.用java实现一个B+树1.什么是B+树B+树是一种常用
Java技术专题-Java Agent探针的技术介绍（1）洛神灬殇
前提概要Java调式、热部署、JVM背后的支持者JavaAgent：各个JavaIDE的调试功能，例如eclipse、IntelliJ；热部署功能，例如JRebel、XRebel、spring-loaded；各种线上诊断工具，例如Btrace、Greys，还有阿里的Arthas；各种性能分析工具，例如VisualVM、JConsole等；Agent的介绍JavaAgent直译过来叫做Java代理，
基于SpringBoot高校汉服租赁网站的设计与实现一点教程 Java项目 spring boot 后端 java spring 笔记
博主主页：一点教程博主简介：专注Java技术领域和毕业设计项目实战、Java微信小程序、安卓等技术开发，远程调试部署、代码讲解、文档指导、ppt制作等技术指导。主要内容：毕业设计，SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Python、Nodejs、小程序、安卓app、大数据等设计与开发感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以和博主沟通，希
JavaWeb，JDBC，Maven 兮如风. java 开发语言
Web:全球广域网，也称为万维网(www)，能够通过浏览器访问的网站JavaWeb:是用Java技术来解决相关web互联网领域的技术栈1，关系型数据库优点：1．都是使用表结构,格式一致，易于维护2．使用通用的SQL语言操作，使用方便，可用于复杂查询3.数据存储在磁盘中，安全2，SQL分类DDL:操作数据库，表等DML:对表中的数据进行增删改DQL:对表中的数据进行查询DCL:对数据库进行权限控制3
基于JAVA+SpringBoot+Vue的前后端分离的电影院售票管理运营平台智能编程设计工作室优质毕业设计 java spring boot vue.js 电影院管理电影售票平台
✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取项目下载方式一、项目背景介绍：该系统研究背景聚焦于电影市场的快速增长、互联网+电影院管理、用户体验和服务优化以及数据管理与决策支持。随着人们生活水平的提高，电影观影已成为重要的娱乐方式，电影院作为传统场
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，