m635674608

htmlunit

做Java编程的人其实，很多不懂SEO，也不知道如何让百度收录等等，当然，对于爬虫，网页抓取，也不是所有编程的人有考虑到，但是专门做这个人，还是需要了解一下这里面的知识的，那下面就来介绍一下一些爬虫和网页采集相关的组件和插件吧~

大家在做爬虫、网页采集、通过网页自动写入数据时基本上都接触过这两个组件（权且称之为组件吧），网上入门资料已经很多了，我想从实际的应用角度谈谈我对于这两个组件的看法，并记录在博客中，以便日后翻阅，欢迎大家批评指正。

本文主要比较两者的优劣性以及介绍应用中的使用技巧，推荐一些入门资料以及非常实用的辅助工具，希望能对大家有所帮助。

大家有任何疑问或者建议希望留言给我，一起交流学习。

下面我们首先来看下2个组件的区别和优劣性：

HtmlUnit:

HtmlUnit本来是一款自动化测试的工具，它采用了HttpClient和java自带的网络api结合来实现，它与HttpClient的不同之处在于，它比HttpClient更“人性化”。

在写HtmlUnit代码的时候，仿佛感觉到的就是在操作浏览器而非写代码，得到页面（getPage）– 寻找到文本框（getElementByID || getElementByName || getElementByXPath 等等）– 输入文字（type，setValue，setText等等）– 其他一些类似操作 — 找到提交按钮 — 提交 — 得到新的Page，这样就非常像一个人在后台帮你操作浏览器一样，而你要做的就是告诉他如何操作以及需要填入哪些值。

优点：

一、网页的模拟化

首先说说HtmlUnit相对于HttpClient的最明显的一个好处，HtmlUnit更好的将一个网页封装成了一个对象，如果你非要说HttpClient返回的接口HttpResponse实际上也是存储了一个对象那也可以，但是HtmlUnit不仅保存了这个网页对象，更难能可贵的是它还存有这个网页的所有基本操作甚至事件。这就是说，我们对于操作这个网页可以像在jsp中写js一样，这是非常方便的，比如：你想某个节点的上一个节点，查找所有的按钮，查找样式为“bt-style”的所有元素，对于某些元素先进行一些改造，然后再转成String,或者我直接得到这个网页之后操作这个网页，完成一次提交都是非常方便的。这意味着你如果想分析一个网页会来的非常的容易，比如我附上一段百度新闻高级搜索的代码：

// 得到浏览器对象，直接New一个就能得到，现在就好比说你得到了一个浏览器了

WebClient webclient = new WebClient();

// 这里是配置一下不加载css和javaScript,配置起来很简单，是不是

webclient.getOptions().setCssEnabled(false);

webclient.getOptions().setJavaScriptEnabled(false);

// 做的第一件事，去拿到这个网页，只需要调用getPage这个方法即可

HtmlPage htmlpage = webclient.getPage(“http://news.baidu.com/advanced_news.html”);

// 根据名字得到一个表单，查看上面这个网页的源代码可以发现表单的名字叫“f”

final HtmlForm form = htmlpage.getFormByName(“f”);

// 同样道理，获取”百度一下“这个按钮

final HtmlSubmitInput button = form.getInputByValue(“百度一下”);

// 得到搜索框

final HtmlTextInput textField = form.getInputByName(“q1″);

// 最近周星驰比较火呀，我这里设置一下在搜索框内填入”周星驰“

textField.setValueAttribute(“周星驰”);

// 输入好了，我们点一下这个按钮

final HtmlPage nextPage = button.click();

// 我把结果转成String

String result = nextPage.asXml();

System.out.println(result);

然后你可以把得到的result结果复制到一个文本，然后用浏览器打开该文本，是不是想要的东西（如图结），很简单对吧，为什么会感觉简单，因为它完全符合我们操作浏览器的习惯，当然最终它也是用HttpClient和其它一些工具类实现的，但是这样的封装是非常人性化和令人惊叹的。

Htmlunit可以有效的分析出 dom标签，并且可以有效的运行页面上的js以便得到一些需要执行JS才能得到的值，你仅仅需要做的就是执行executeJavaScript（）这个方法而已，这些都是HtmlUnit帮我们封装好，我们要做的仅仅是告诉它需要做什么。

WebClient webclient = new WebClient();

HtmlPage htmlpage = webclient.getPage(“you url”);

htmlpage.executeJavaScript(“the function name you want to execute”);

对于使用Java程序员来说，对对象的操作就再熟悉不过了，HtmlUnit所做的正是帮我们把网页封装成一个对象，一个功能丰富的，透明的对象。

二、网络响应的自动化处理

HtmlUnit拥有强大的响应处理机制，我们知道：常见的404是找不到资源，100等是继续，300等是跳转…我们在使用HttpClient的时候它会把响应结果告诉我们，当然，你可以自己来判断，比如说，你发现响应码是302的时候，你就在响应头去找到新的地址并自动再跳过去，发现是100的时候就再发一次请求，你如果使用HttpClient,你可以这么去做，也可以写的比较完善，但是，HtmlUnit已经较为完整的实现了这一功能，甚至说，他还包括了页面JS的自动跳转（响应码是200，但是响应的页面就是一个JS），天涯的登录就是这么一个情况，让我们一起来看下。

/**

* @author CaiBo

* @date 2014年9月15日上午9:16:36

* @version $Id$

public class TianyaTest {

/**

public static void main(String[] args) throws Exception {

// 这是一个测试，也是为了让大家看的更清楚，请暂时抛开代码规范性，不要纠结于我多建了一个局部变量等

// 得到认证https的浏览器对象

HttpClient client = getSSLInsecureClient();

// 得到我们需要的post流

HttpPost post = getPost();

// 使用我们的浏览器去执行这个流,得到我们的结果

HttpResponse hr = client.execute(post);

// 在控制台输出我们想要的一些信息

showResponseInfo(hr);

}

private static void showResponseInfo(HttpResponse hr) throws ParseException, IOException {

System.out.println(“响应状态行信息：” + hr.getStatusLine());

System.out.println(“—————————————————————”);

System.out.println(“响应头信息：”);

Header[] allHeaders = hr.getAllHeaders();

for (int i = 0; i < allHeaders.length; i++) {

System.out.println(allHeaders[i].getName() + “:” + allHeaders[i].getValue());

}

System.out.println(“—————————————————————”);

System.out.println(“响应正文：”);

System.out.println(EntityUtils.toString(hr.getEntity()));

}

// 得到一个认证https链接的HttpClient对象（因为我们将要的天涯登录是Https的）

// 具体是如何工作的我们后面会提到的

private static HttpClient getSSLInsecureClient() throws Exception {

// 建立一个认证上下文，认可所有安全链接，当然，这是因为我们仅仅是测试，实际中认可所有安全链接是危险的

SSLContext sslContext = new SSLContextBuilder().loadTrustMaterial(null, new TrustStrategy() {

public boolean isTrusted(X509Certificate[] chain, String authType) throws CertificateException {

return true;

}

}).build();

SSLConnectionSocketFactory sslsf = new SSLConnectionSocketFactory(sslContext);

return HttpClients.custom().//

setSSLSocketFactory(sslsf)//

// .setProxy(new HttpHost(“127.0.0.1″, 8888))

.build();

}

// 获取我们需要的Post流，如果你是把我的代码复制过去，请记得更改为你的用户名和密码

private static HttpPost getPost() {

HttpPost post = new HttpPost(“https://passport.tianya.cn/login”);

// 首先我们初始化请求头

post.addHeader(“Referer”, “https://passport.tianya.cn/login.jsp”);

post.addHeader(“Host”, “passport.tianya.cn”);

post.addHeader(“Origin”, “http://passport.tianya.cn”);

// 然后我们填入我们想要传递的表单参数（主要也就是传递我们的用户名和密码）

// 我们可以先建立一个List，之后通过post.setEntity方法传入即可

// 写在一起主要是为了大家看起来方便，大家在正式使用的当然是要分开处理，优化代码结构的

List<NameValuePair> paramsList = new ArrayList<NameValuePair>();

* 添加我们要的参数，这些可以通过查看浏览器中的网络看到，如下面我的截图中看到的一样

* 不论你用的是firebut,httpWatch或者是谷歌自带的查看器也好,都能查看到（后面会推荐辅助工具来查看）

* 要把表单需要的参数都填齐，顺序不影响

paramsList.add(new BasicNameValuePair(“Submit”, “”));

paramsList.add(new BasicNameValuePair(“fowardURL”, “http://www.tianya.cn”));

paramsList.add(new BasicNameValuePair(“from”, “”));

paramsList.add(new BasicNameValuePair(“method”, “name”));

paramsList.add(new BasicNameValuePair(“returnURL”, “”));

paramsList.add(new BasicNameValuePair(“rmflag”, “1″));

paramsList.add(new BasicNameValuePair(“__sid”, “1#1#1.0#a6c606d9-1efa-4e12-8ad5-3eefd12b8254″));

// 你可以申请一个天涯的账号并在下两行代码中替换为你的用户名和密码

paramsList.add(new BasicNameValuePair(“vwriter”, “ifugletest2014″));// 替换为你的用户名

paramsList.add(new BasicNameValuePair(“vpassword”, “test123456″));// 你的密码

// 将这个参数list设置到post中

post.setEntity(new UrlEncodedFormEntity(paramsList, Consts.UTF_8));

return post;

}

执行上面这个Main函数你会得到一下的结果：

我们看到，响应码确实是200，表明成功了，其实这个响应相当于是302，它是需要跳转的，只不过它的跳转写到了body部分的js里面而已。

location.href=”http://passport.tianya.cn:80/online/loginSuccess.jsp?fowardurl=http%3A%2F%2Fwww.tianya.cn%2F94693372&userthird=&regOrlogin=%E7%99%BB%E5%BD%95%E4%B8%AD……&t=1410746182629&k=8cd4d967491c44c5eab1097e0f30c054&c=6fc7ebf8d782a07bb06624d9c6fbbf3f”;

</script>

它这是一个页面上的跳转

那这个时候如果你使用HttpClient就头疼了（当然也是可以处理的，后面讲到）。如果你使用的是HtmlUnit，整个过程显得简单轻松。

public class TianyaTestByHtmlUnit {

public static void main(String[] args) throws Exception {

WebClient webClient = new WebClient();

// 拿到这个网页

HtmlPage page = webClient.getPage(“http://passport.tianya.cn/login.jsp”);

// 填入用户名和密码

HtmlInput username = (HtmlInput) page.getElementById(“userName”);

username.type(“ifugletest2014″);

HtmlInput password = (HtmlInput) page.getElementById(“password”);

password.type(“test123456″);

// 提交

HtmlButton submit = (HtmlButton) page.getElementById(“loginBtn”);

HtmlPage nextPage = submit.click();

System.out.println(nextPage.asXml());

}

这样简单的几行代码就完成了。

三、并行控制和串行控制

既然HtmlUnit封装了那么多的底层api和hHttpClient操作，那么它有没有给我们提供自定义各种响应策略和监听整个执行过程的方法呢？，答案是肯定的。由于HtmlUnit提供的监听和控制方法比较多，我说几个大家可能接触比较少，但很有用的方法。其他的类似于:设置CSS有效，设置不抛出JS异常，设置使用SSL安全链接，诸如此类，大家通过webClient.getOptions().set***，就可以设置了，这种大家都比较熟了。

（1）首先来看一下JS错误处理监听机制，我们打开HtmlUnit源码可以看到（该源码位置在JavaScriptEngine类中的handleJavaScriptException方法处）

protected void handleJavaScriptException(final ScriptException scriptException, final boolean triggerOnError) {

// Trigger window.onerror, if it has been set.

final HtmlPage page = scriptException.getPage();

if (triggerOnError && page != null) {

final WebWindow window = page.getEnclosingWindow();

if (window != null) {

final Window w = (Window) window.getScriptObject();

if (w != null) {

try {

w.triggerOnError(scriptException);

}

catch (final Exception e) {

handleJavaScriptException(new ScriptException(page, e, null), false);

}

// 这里尝试去取我们设置的JavaScript错误处理器

final JavaScriptErrorListener javaScriptErrorListener = getWebClient().getJavaScriptErrorListener();

if (javaScriptErrorListener != null) {

javaScriptErrorListener.scriptException(page, scriptException);

}

// Throw a Java exception if the user wants us to.

if (getWebClient().getOptions().isThrowExceptionOnScriptError()) {

throw scriptException;

}

// Log the error; ScriptException instances provide good debug info.

LOG.info(“Caught script exception”, scriptException);

}

也就是说我们它在发现JS错误的时候会自动去寻找我们是否有处理器，有的话就会用我们设置的处理器来处理，要在webClient里加一个处理器也非常的方便。使用：

webClient.setJavaScriptErrorListener(new 你自己的JavaScriptErrorListener());即可。自己的JavaScriptErrorListener也很好实现，直接继承JavaScriptErrorListener接口即可，然后你就可以在javaScript出错时自行处理，你可以选择分析它的url、修正它的url、重新再获取或者直接忽略等等。有js错误处理器，当然也还有别的了，这一类型的我就只说一个了。为了防止有小白不明白，我还是贴出一个简单的实现好了。

/**

* @author CaiBo

* @date 2014年8月12日上午12:32:08

* @version $Id: WaiJavaScriptErrorListener.java 3943 2014-08-12 03:54:25Z CaiBo $

public class WaiJavaScriptErrorListener implements JavaScriptErrorListener {

public WaiJavaScriptErrorListener() {

}

@Override

public void scriptException(HtmlPage htmlPage, ScriptException scriptException) {

// TODO Auto-generated method stub

}

@Override

public void timeoutError(HtmlPage htmlPage, long allowedTime, long executionTime) {

// TODO Auto-generated method stub

}

@Override

public void malformedScriptURL(HtmlPage htmlPage, String url, MalformedURLException malformedURLException) {

// TODO Auto-generated method stub

}

@Override

public void loadScriptError(HtmlPage htmlPage, URL scriptUrl, Exception exception) {

// TODO Auto-generated method stub

}

public static void main(String[] args) {

WebClient webClient = new WebClient();

webClient.setJavaScriptErrorListener(new WaiJavaScriptErrorListener());

}

Main方法处实现了JS错误自定义处理的webClient

（2）链接响应监听

很多时候我们想看看HtmlUnit到底去拿了什么东西，或者说我想对它拿的东西过滤一下，再或者我想把它拿到的某些东西存起来，那这个时候响应监听就很必要了。比如说一个最简单的响应监听。

/**

* @author CaiBo

* @date 2014年9月15日上午10:59:30

* @version $Id$

public class SimpleConectionListener extends FalsifyingWebConnection {

private static final Logger LOGGER = LoggerFactory.getLogger(SimpleConectionListener.class);

public SimpleConectionListener(WebClient webClient) throws IllegalArgumentException {

super(webClient);

}

@Override

public WebResponse getResponse(WebRequest request) throws IOException {

// 得到了这个响应，你想怎么处理就怎么处理了，不多写了

WebResponse response = super.getResponse(request);

String url = response.getWebRequest().getUrl().toString();

if (LOGGER.isDebugEnabled()) {

LOGGER.debug(“下载文件链接：” + url);

}

if (check(url)) {

return createWebResponse(response.getWebRequest(), “”, “application/javascript”, 200, “Ok”);

}

return response;

}

private boolean check(String url) {

// TODO 加入你自己的判断什么的

return false;

}

这样我们就实现了一个自己的监听器，虽然比较简陋。现在我们把它设置到我们的webClient里面去。

WebClient webClient = new WebClient();

// 如果你好奇这里仅仅传进去没有返回，怎么webClient就改变了，你可以到这个实例化里面看下就明白了

new WebConnectionListener(webClient);

// 这个webClient在上一步之后，已经被监听了

webClient.getPage(“someUrl”);

结果就如上图所示了。

HtmlUnit还有其他许多并、串行控制方法，统一cookie，统一连接池等等，就不一一叙述了。

四、强大的缓存机制

为什么第一次获取一个网页可能会比较慢，但是第二次来拿就特别快呢？在HtmlUnit源码webClient类中的loadWebResponseFromWebConnection方法中我们可以看到。

final WebResponse fromCache = getCache().getCachedResponse(webRequest);

final WebResponse webResponse;

if (fromCache != null) {

webResponse = new WebResponseFromCache(fromCache, webRequest);

}

else {

try {

webResponse = getWebConnection().getResponse(webRequest);

}

catch (final NoHttpResponseException e) {

return new WebResponse(responseDataNoHttpResponse_, webRequest, 0);

}

getCache().cacheIfPossible(webRequest, webResponse, null);

}

当然，它还有许多别的缓存机制来加快我们的访问速度，减少带宽压力。

劣势：

相对于HttpClient来说，HtmlUnit的优点大致就这么多了，那相对于HttpClient来说，短程距离上（访问量小的情况下），HtmlUnit的性能是不如HttpClient的，这也很容易理解，HtmlUnit把HttpClient封装了一层嘛，在短程距离行不如HttpClient就很正常了，在具体的业务下，那就要看程序员水平了。

写太长我自己容易疏忽，大家看着也累，所以第一篇就只谈一下HtmlUnit的优势和劣势了，下一篇将讲述HttpClient的优势和劣势，之后再对他们进行详细比较以及介绍技巧。

你可能感兴趣的:(htmlunit)

00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
爬虫框架htmlunit整合springboot不兼容的问题小瑞爱编程
使用爬虫框架htmlunit整合springboot不兼容的一个问题本来使用htmlunit爬虫爬取数据非常正常好用，之前一直是直接java程序或者整合Javaswing界面，都没有问题，但是后来整合springboot变成BS架构之后，同样的代码却报错，报错信息如下：这个错误很常见，网上搜索得到的答案也千篇一律，就是解决动态网页的获取问题，添加对js的支持，但是我的代码单独运行时没有问题的，而且
深入理解Unity的碰撞检测机制雅典娜的棒槌
原文链接：http://www.manew.com/thread-102595-1-1.htmlunity的检测流程碰撞检测，就是检测两个物体是否相交，如果物体非常规则，比如球体，直接检测圆心距离是否小于半径和即可，计算量十分小，但是，如果物体不规则，比如一个角色，进行十分细致的碰撞检测就会变的十分困难，这时候，我们一般会用简单几何体去逼近复杂网格image.png如上图所示，我用4个圆去逼近一个
htmlunit取消css,javascript支持待烟火清凉 htmlunit
htmlunit默认是会对网页中的css,javascript解析的，对于一般的非Js加载页面采集，我们可以把css.javascript解析去掉，这样可以提高效率；但是对于Js加载的页面，就不能去掉了packagecom.gcx.htmlunit;importjava.io.IOException;importjava.net.MalformedURLException;importcom.ga
Java：爬虫htmlunit实践 dingcho Java java 爬虫
之前我们已经讲过使用htmlunit及基础，没有看过的可以参考Java：爬虫htmlunit-CSDN博客我们今天就来实际操作一下，爬取指定网站的数据1、首先我们要爬取一个网站数据的时候我们需要对其数据获取方式我们要进行分析，我们今天就拿双色球历史开奖查询-双色球历史开奖结果-彩经网作为我们示例目标，使用google浏览器，示例仅供学习使用历史数据比较多，所以存在分页的情况，请打开f12调出开发者
Java：爬虫htmlunit dingcho Java java 爬虫
为什么htmlunit与HttpClient两者都可以爬虫、网页采集、通过网页自动写入数据，我们会推荐使用htmlunit呢?一、网页的模拟化首先说说HtmlUnit相对于HttpClient的最明显的一个好处，HtmlUnit更好的将一个网页封装成了一个对象，如果你非要说HttpClient返回的接口HttpResponse实际上也是存储了一个对象那也可以，但是HtmlUnit不仅保存了这个网页
Apache HttpClient Pts
image.pngApacheHttpClient简介HttpClient是ApacheJakartaCommon下的子项目，用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包，并且它支持HTTP协议最新的版本和建议。HttpClient已经应用在很多的项目中，比如ApacheJakarta上很著名的另外两个开源项目Cactus和HTMLUnit都使用了HttpClient。Ht
在Unity程序运行时使用C#更改窗口图标设置标题雪千渔 Unity Unity C#
原地址：http://www.imxqy.com/cg/unity/unity-icon.htmlunity是没有提供windows标题修改和窗口图标更换的接口，所以要自己实现。另外没有Icon这个类型，所以直接使用了API来进行对图标的操作。这个类要挂在一个物体上，Awake进行初始化后才能使用。先枚举寻找窗口返回句柄，然后通过SetWindowText设置窗口标题，ExtractIcon来创建
java使用htmlunit+Jsoup爬虫，爬取ajax动态数据写完程序去旅行 java 爬虫
先贴一段代码WebClientweb=newWebClient(BrowserVersion.FIREFOX_38);try{longstartTime=System.currentTimeMillis();//获取开始时间web.getOptions().setJavaScriptEnabled(true);//启用JS解释器，默认为trueweb.setJavaScriptTimeout(20
线程池+jsoup+htmlclient实现微博超话社区自动签到梦染(°ー°〃)星尘不干正事瞎玩爬虫 java 爬虫微博
java线程池+jsoup+htmlunit实现微博超话社区自动签到这是个半夜闲没事写的一个爬虫，所以很多命名可能有点不大好，哈哈，请见谅，程序能运行就行毕竟也只是闲没事摸个鱼写写的，其实里面也有很多东西可以优化的，不过。。。。。。大半夜的，优化个球球，运行完赶紧睡觉去喽还有一点忘记说了，其实里面只需要用到java线程池+jsoup就可以了，只不过使用htmunit解析微博页面js的时候报错，感觉
JAVA爬虫1 - HttpClient的使用测试开发架构师安卓爬虫逆向 java 开发语言
一、简介HttpClient是ApacheJakartaCommon下的子项目，用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包，并且它支持HTTP协议最新的版本和建议。HttpClient已经应用在很多的项目中，比如ApacheJakarta上很著名的另外两个开源项目Cactus和HTMLUnit都使用了HttpClient。下载地址:http://hc.apache.org
网络爬虫山那边的路
一、htmlunit形式WebClientwc=newWebClient(BrowserVersion.FIREFOX_31);//模拟浏览器内核wc.getOptions().setJavaScriptEnabled(true);wc.getOptions().setCssEnabled(true);wc.getOptions().setThrowExceptionOnFailingStatus
Java爬取哔哩哔哩视频（可视化）李南想做条咸鱼 java 音视频开发语言 Java爬虫 Swing htmlunit
链接：我的讲解视频https://www.bilibili.com/video/BV14e411Q7oG/本文仅供学术用途先上图代码爬虫核心importcom.alibaba.fastjson2.JSON;importcom.alibaba.fastjson2.JSONObject;importcom.gargoylesoftware.htmlunit.*;importorg.apache.com
京东简单爬虫假装得大佬 java爬虫
先找到视频的请求url，发现url中vid（猜测是视频参数）是要进行传参的，在代码检查中查找vid，找到参数vid。提取参数vid，拼接url，然后模拟请求。即可进行视频下载packagecom.example.shares.utils;importcom.gargoylesoftware.htmlunit.WebClient;importcom.gargoylesoftware.htmlunit
Apache HttpClient 详解瞎胡扯 HTTP java HttpClient Http
1、简介HttpClient是ApacheJakartaCommon下的子项目，用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包，并且它支持HTTP协议最新的版本和建议。HttpClient已经应用在很多的项目中，比如ApacheJakarta上很著名的另外两个开源项目Cactus和HTMLUnit都使用了HttpClient。HttpClient相比传统JDK自带的URLCo
Unity内存管理 scl_Unity3D Unity 性能优化游戏基础 unity3d 内存管理内存结构
转自：https://www.cnblogs.com/zsb517/p/5724908.htmlUnity3D里有两种动态加载机制：一个是Resources.Load，另外一个通过AssetBundle,其实两者区别不大。Resources.Load就是从一个缺省打进程序包里的AssetBundle里加载资源，而一般AssetBundle文件需要你自己创建，运行时动态加载，可以指定路径和来源的。其
Unity 物理系列二 AddForce velocity 合肥黑
一、AddForceForceModehttps://docs.unity3d.com/cn/2019.4/ScriptReference/Rigidbody.AddForce.htmlhttps://docs.unity3d.com/cn/2019.4/ScriptReference/ForceMode.htmlUnity中关于作用力方式ForceMode的功能注解usingSystem.Col
unity hub、官方文档、assetstore插件商店相关官方资源下载地址千年奇葩 #unity3D 使用技巧笔记 unity unity hub unity资源 unity api unity 版本区别
Unity官方下载地址https://unity.cn/releasesUnityHub版本管理器https://store.unity.com/cn/download?ref=personalUnityManual官方文档、Api说明https://docs.unity3d.com/Manual/index.htmlUnity版本区别、订阅通道https://store.unity.com/cn
【Unity】编辑器扩展之——TreeView 刘一码 Unity 编辑器扩展 unity
官方手册：https://docs.unity3d.com/Manual/TreeViewAPI.htmlUnity中的TreeView可以实现这样的效果：或者这样的效果：TreeView可以实现hierarchy面板效果，元素可以进行点击、双击、重命名、拖拽、排序、展开收起等效果（可以查看对应api）。相较于普通的EditorWindow，TreeView具有元素可交互、可以方便地绘制表格、树形
2019年1月份整理的Unity3D游戏完整源码加油IT Unity3D Unity3D 游戏源码
自学Unity3D比较辛苦和困难，找到一些Unity3D资源，与君共勉。Unity3D3d射击游戏源码EZFPSMultiplayerFPSKithttp://www.idoubi.net/unity3d/complete-project/282.htmlUnity3D暴力之城游戏源码FullGameKit–Hammer2http://www.idoubi.net/unity3d/complete
2019年4月份整理的Unity3D游戏完整源码 weixin_34148340 游戏
Unity3D×××游戏完整源码GIRacing2http://www.idoubi.net/unity3d/complete-project/3570.htmlUnity3D街机几何跳跃完整游戏源码GeometryJumphttp://www.idoubi.net/unity3d/complete-project/3561.htmlUnity3DQ版糖果消消乐完整源码CandyMatch3Kit
HttpClient工具类茶碗儿 Java
一、概念HttpClient是ApacheJakartaCommon下的子项目，用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包，并且它支持HTTP协议最新的版本和建议。HttpClient已经应用在很多的项目中，比如ApacheJakarta上很著名的另外两个开源项目Cactus和HTMLUnit都使用了HttpClient。HttpClient通俗的讲就是模拟了浏览器的行为
springboot之爬虫抓取数据 404 Not Bug java 数据挖掘爬虫后端 spring boot
一.加入依赖org.apache.httpcomponentshttpclient4.5.9net.sourceforge.htmlunithtmlunit2.27org.jsoupjsoup1.11.3二、建立HttpClientDownPage这个类请求方法分为get和post两种，代码如下：//设置代理，模仿浏览器privatestaticfinalStringUSER_AGENT="Moz
Unity新的Input System 弹吉他的小刘鸭 Unity unity
参考：https://www.youtube.com/watch?v=HmXU4dZbaMw&ab_channel=BMo参考：https://docs.unity3d.com/Packages/[email protected]/manual/index.htmlUnity更新了新的InputSystem，让人比较烦的是，新的InputSystem与旧的InputSystem不可
Java简单的爬虫实践 HelloWorld丶小工匠
简介实现基于Jsoup来爬取网页上图片并下载到本地环境JDK1.8IntelliJIdea2020Jsoup1.13.1引入jar包jsoupnet.sourceforge.htmlunithtmlunit2.27org.jsoupjsoup1.8.3实现代码思路：1、定义需要下载初始路径，可以随机找个图片多的网页地址2、获取页面内容，定义方法getHtml(Stringurl)3、获取页面内容图
如何在无显示器的Ubuntu下跑前端测试 chengly0129 Docker Maven &Jenkins
很久以前，我也使用selenium做自动化的集成测试，使用HtmlUnit的webdriver，所以不需要显示器。但是HtmlUnit的表现总是有些不如意。而最近在项目中发现这篇文章，解决我长久以来的问题：在没有显示器的服务器上运行Firefox的集成测试。Selenium是一个web自动化测试框架。用它可以实现web应用自动化测试。不过，我不只是用它来做测试，我还用它从电子商务网站签到页面爬取j
Shader 学习之路-Unity 标准着色器（九） AnimeKing
1、Unity标准着色器（StandardShader）官方文档：https://docs.unity3d.com/Manual/StandardShaderMaterialParameterRenderingMode.htmlUnity标准着色器是一个内置的着色器，它用于渲染“真是世界”的对象，如石头、木头、玻璃、塑料和金属，具有全面的功能。Unity自带两个新的Shader，分别是Standa
java使用htmlunit + jsoup 爬网站图片案例(爬虫学习) 代号：猿a java 爬虫学习
申明该文章用于自己学习爬虫使用案例分析目的:从百度图片中搜索"风景"并下载图片到本地思路:使用htmlunit进行模拟用户操作,并使用jsoup对数据进行解析,获取到需要的数据后,再下载到本地保存htmlunit官网jsoup官网操作步骤使用谷歌浏览器打开百度图片网站https://image.baidu.com输入"风景",点击"百度一下"按钮页面进行跳转对当前页面页面中的图片地址进行获取,并保
如何对使用React和EMF parsley设计的Web UI应用程序进行测试自动化亿牛云爬虫专家前端 java 爬虫技术前端 react.js ui EMF parsley 自动化测试 www.16yun.cn
导语WebUI应用程序是指通过Web浏览器访问的应用程序，它们通常具有复杂的用户界面和交互逻辑。为了确保WebUI应用程序的功能、性能和用户体验，测试自动化是一种有效的方法，它可以在不需要人工干预的情况下，快速地执行重复的测试任务，并提供可靠的测试结果。本文将介绍如何对使用React和EMFparsley设计的WebUI应用程序进行测试自动化，以及使用HtmlUnitDriver和java代码实现
游戏开发中常用的一些资料与网址记录东方快弟游戏研发备忘录 unity 游戏引擎
先集中记录后期优化常用官方网址Unity官网手册https://docs.unity3d.com/Manual/index.htmlUnity更新说明https://docs.unity3d.com/cn/2021.2/Manual/UpgradeGuides.htmlAndroid-gradlehttps://developer.android.google.cn/studio/releases
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分