梁野的博客转移啦

jsoup抓取页面与页面解析提取数据

前两天的工作是解析亚马逊的页面，获取需要的数据，所以呢，我就选择了jsoup，选择的版本是1.9.2，这个大家可以去joup官网()maven仓库那下载就是了，我就不多说了。

首先，科普下什么是jsoup（我也是用了才知道的，嘿嘿）：

jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。

接下来，就参照官方API和自己的代码讲解一下jsoup的用法。

接下来，就参照官方API和自己的代码讲解一下jsoup的用法。
接下来，就参照官方API和自己的代码讲解一下jsoup的用法。、

1、连接一个URL，并返回一个Document对象

//Creates a new Connection to a URL. Use to fetch and parse a HTML page. 
//创建一个新的连接到指定URL。用于获取和解析这个HTML页面
Document doc = Jsoup.connect("https://jsoup.org/").get();//获取Jsoup官网，并返回一个Document对象

2、也可以把一个HTML字符串转为document对象，不管你这个html是否完整，它都可以解析包装成一个document对象

//把一个字符串解析成document对象
		String html = "First parse"
				  + "Parsed HTML into a doc.";
		Document document = Jsoup.parse(html);

3、解析body碎片

@Test
	public void test02(){
		//解析一个不完整的HTML页面
		String html = "Lorem ipsum.";
		//该方法会自动补全标签，并为其添加html和body标签，使其转化为一个Document对象
		Document doc = Jsoup.parseBodyFragment(html);
		//获取doc的body部分
		Element body = doc.body();
	}

4、从一个URL加载一个文档对象

//根据CSDN的URL地址加载一个Document对象
		Document doc = Jsoup.connect("http://www.csdn.net/").get();
		//获取title内容
		String title = doc.title();

 
    Document doc = Jsoup.connect("http://example.com")//指定连接的参数获取document

  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(3000)
  .post(); 
    
 
    5、从文件加载一个文档对象

@Test
	public void test01() throws IOException{
		//Jsoup.parse(File in, String charsetName, String baseUri)
		File input = new File("C:\\Users\\Administrator\\Desktop\\hello.txt");
		//baseUri 参数用于解决文件中URLs是相对路径的问题。如果不需要可以传入一个空的字符串。
		Document doc = Jsoup.parse(input, "UTF-8", "http://blog.csdn.net/");
		System.out.println(doc);
	}

6、使用DOM方法遍历一个对象

@Test
	public void test02() throws IOException{
		File input = new File("C:\\Users\\Administrator\\Desktop\\hello.txt");
		Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

		//获取ID为content的元素
		Element content = doc.getElementById("content");
		//获取在conten里的标签为a的元素
		Elements links = content.getElementsByTag("a");
		for (Element link : links) {
		//获取a标签中属性为href的值
		  String linkHref = link.attr("href");
		 //获取a标签中的文本
		  String linkText = link.text();
		}
	}

说明

Elements这个对象提供了一系列类似于DOM的方法来查找元素，抽取并处理其中的数据。具体如下：

查找元素

getElementById(String id)
getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key) (and related methods)
兄弟元素: siblingElements(), firstElementSibling(), lastElementSibling();nextElementSibling(), previousElementSibling()
Graph: parent(), children(), child(int index)

元素数据

attr(String key)获取属性attr(String key, String value)设置属性
attributes()获取所有属性
id(), className() and classNames()
text()获取文本内容text(String value) 设置文本内容
html()获取元素内HTMLhtml(String value)设置元素内的HTML内容
outerHtml()获取元素外HTML内容
data()获取数据内容（例如：script和style标签)
tag() and tagName()

操作HTML和文本

append(String html), prepend(String html)
appendText(String text), prependText(String text)
appendElement(String tagName), prependElement(String tagName)
html(String value)

7、使用选择器语法来选择元素

@Test
	public void test03() throws IOException{
		File input = new File("/tmp/input.html");
		Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

		Elements links = doc.select("a[href]"); //带有href属性的a元素
		Elements pngs = doc.select("img[src$=.png]"); //扩展名为.png的图片
		Element masthead = doc.select("div.masthead").first();//class等于masthead的div标签
		Elements resultLinks = doc.select("h3.r > a"); //在h3元素之后的a元素
	}

说明

jsoup elements对象支持类似于CSS (或jquery)的选择器语法，来实现非常强大和灵活的查找功能。.

这个select 方法在Document, Element,或Elements对象中都可以使用。且是上下文相关的，因此可实现指定元素的过滤，或者链式选择访问。

Select方法将返回一个Elements集合，并提供一组方法来抽取和处理结果。

Selector选择器概述

tagname: 通过标签查找元素，比如：a
ns|tag: 通过标签在命名空间查找元素，比如：可以用 fb|name 语法来查找元素
#id: 通过ID查找元素，比如：#logo
.class: 通过class名称查找元素，比如：.masthead
[attribute]: 利用属性查找元素，比如：[href]
[^attr]: 利用属性名前缀来查找元素，比如：可以用[^data-] 来查找带有HTML5 Dataset属性的元素
[attr=value]: 利用属性值来查找元素，比如：[width=500]
[attr^=value], [attr$=value], [attr*=value]: 利用匹配属性值开头、结尾或包含属性值来查找元素，比如：[href*=/path/]
[attr~=regex]: 利用属性值匹配正则表达式来查找元素，比如： img[src~=(?i)\.(png|jpe?g)]
*: 这个符号将匹配所有元素

Selector选择器组合使用

el#id: 元素+ID，比如： div#logo
el.class: 元素+class，比如： div.masthead
el[attr]: 元素+class，比如： a[href]
任意组合，比如：a[href].highlight
ancestor child: 查找某个元素下子元素，比如：可以用.body p 查找在"body"元素下的所有 p元素
parent > child: 查找某个父元素下的直接子元素，比如：可以用div.content > p 查找 p 元素，也可以用body > * 查找body标签下所有直接子元素
siblingA + siblingB: 查找在A元素之前第一个同级元素B，比如：div.head + div
siblingA ~ siblingX: 查找A元素之前的同级X元素，比如：h1 ~ p
el, el, el:多个选择器组合，查找匹配任一选择器的唯一元素，例如：div.masthead, div.logo

伪选择器selectors

:lt(n): 查找哪些元素的同级索引值（它的位置在DOM树中是相对于它的父节点）小于n，比如：td:lt(3) 表示小于三列的元素
:gt(n):查找哪些元素的同级索引值大于n，比如： div p:gt(2)表示哪些div中有包含2个以上的p元素
:eq(n): 查找哪些元素的同级索引值与n相等，比如：form input:eq(1)表示包含一个input标签的Form元素
:has(seletor): 查找匹配选择器包含元素的元素，比如：div:has(p)表示哪些div包含了p元素
:not(selector): 查找与选择器不匹配的元素，比如： div:not(.logo) 表示不包含 class=logo 元素的所有 div 列表
:contains(text): 查找包含给定文本的元素，搜索不区分大不写，比如： p:contains(jsoup)
:containsOwn(text): 查找直接包含给定文本的元素
:matches(regex): 查找哪些元素的文本匹配指定的正则表达式，比如：div:matches((?i)login)
:matchesOwn(regex): 查找自身包含文本匹配指定正则表达式的元素
注意：上述伪选择器索引是从0开始的，也就是说第一个元素索引值为0，第二个元素index为1等

可以查看Selector API参考来了解更详细的内容

8、从元素集合抽取属性、文本和HTML

@Test
	public void test04(){
		String html = "An example link.";
		Document doc = Jsoup.parse(html);//解析HTML字符串返回一个Document实现
		Element link = doc.select("a").first();//查找第一个a元素

		String text = doc.body().text(); // "An example link"//取得字符串中的文本
		String linkHref = link.attr("href"); // "http://example.com/"//取得链接地址
		String linkText = link.text(); // "example""//取得链接地址中的文本

		String linkOuterH = link.outerHtml(); 
		    // "example"
		String linkInnerH = link.html(); // "example"//取得链接内的html内容
	}

说明

上述方法是元素数据访问的核心办法。此外还其它一些方法可以使用：

Element.id()
Element.tagName()
Element.className() and Element.hasClass(String className)

这些访问器方法都有相应的setter方法来更改数据.

9、处理URLs

@Test
	public void test05() throws IOException{
		Document doc = Jsoup.connect("http://www.open-open.com").get();

		Element link = doc.select("a").first();
		String relHref = link.attr("href"); // == "/"
		String absHref = link.attr("abs:href"); // "http://www.open-open.com/"
	}

说明

在HTML元素中，URLs经常写成相对于文档位置的相对路径： .... 当你使用 Node.attr(String key) 方法来取得a元素的href属性时，它将直接返回在HTML源码中指定定的值。

假如你需要取得一个绝对路径，需要在属性名前加 abs: 前缀。这样就可以返回包含根路径的URL地址attr("abs:href")

因此，在解析HTML文档时，定义base URI非常重要。

如果你不想使用abs: 前缀，还有一个方法能够实现同样的功能 Node.absUrl(String key)。

10、 程序示例：获取所有链接

这个示例程序将展示如何从一个URL获得一个页面。然后提取页面中的所有链接、图片和其它辅助内容。并检查URLs和文本信息。

运行下面程序需要指定一个URLs作为参数

package org.jsoup.examples;

		import org.jsoup.Jsoup;
		import org.jsoup.helper.Validate;
		import org.jsoup.nodes.Document;
		import org.jsoup.nodes.Element;
		import org.jsoup.select.Elements;

		import java.io.IOException;

		/**
		 * Example program to list links from a URL.
		 */
		public class ListLinks {
		    public static void main(String[] args) throws IOException {
		        Validate.isTrue(args.length == 1, "usage: supply url to fetch");
		        String url = args[0];
		        print("Fetching %s...", url);

		        Document doc = Jsoup.connect(url).get();
		        Elements links = doc.select("a[href]");
		        Elements media = doc.select("[src]");
		        Elements imports = doc.select("link[href]");

		        print("\nMedia: (%d)", media.size());
		        for (Element src : media) {
		            if (src.tagName().equals("img"))
		                print(" * %s: <%s> %sx%s (%s)",
		                        src.tagName(), src.attr("abs:src"), src.attr("width"), src.attr("height"),
		                        trim(src.attr("alt"), 20));
		            else
		                print(" * %s: <%s>", src.tagName(), src.attr("abs:src"));
		        }

		        print("\nImports: (%d)", imports.size());
		        for (Element link : imports) {
		            print(" * %s <%s> (%s)", link.tagName(),link.attr("abs:href"), link.attr("rel"));
		        }

		        print("\nLinks: (%d)", links.size());
		        for (Element link : links) {
		            print(" * a: <%s>  (%s)", link.attr("abs:href"), trim(link.text(), 35));
		        }
		    }

		    private static void print(String msg, Object... args) {
		        System.out.println(String.format(msg, args));
		    }

		    private static String trim(String s, int width) {
		        if (s.length() > width)
		            return s.substring(0, width-1) + ".";
		        else
		            return s;
		    }

示例输入结果

Fetching http://news.ycombinator.com/...

Media: (38)
 * img:  18x18 ()
 * img:  10x1 ()
 * img:  x ()
 * img:  0x10 ()
 * script: 
 * img:  15x1 ()
 * img:  x ()
 * img:  25x1 ()
 * img:  x (Analytics by Mixpan.)
 
Imports: (2)
 * link  (stylesheet)
 * link  (shortcut icon)
 
Links: (141)
 * a:   ()
 * a:   (Hacker News)
 * a:   (new)
 * a:   (comments)
 * a:   (leaders)
 * a:   (jobs)
 * a:   (submit)
 * a:   (login)
 * a:   ()
 * a:   (Facebook speeds up PHP)
 * a:   (mcxx)
 * a:   (9 comments)
 * a:   ()
 * a:   ("Tough. Django produces XHTML.")
 * a:   (andybak)
 * a:   (3 comments)
 * a:   ()
 * a:   (More)
 * a:   (Lists)
 * a:   (RSS)
 * a:   (Bookmarklet)
 * a:   (Guidelines)
 * a:   (FAQ)
 * a:   (News News)
 * a:   (Feature Requests)
 * a:   (Y Combinator)
 * a:   (Apply)
 * a:   (Library)
 * a:   ()
 * a:   ()

11、设置属性值

在你解析一个Document之后可能想修改其中的某些属性值，然后再保存到磁盘或都输出到前台页面。

方法

可以使用属性设置方法 Element.attr(String key, String value), 和 Elements.attr(String key, String value).

假如你需要修改一个元素的 class 属性，可以使用 Element.addClass(String className) 和Element.removeClass(String className) 方法。

Elements 提供了批量操作元素属性和class的方法，比如：要为div中的每一个a元素都添加一个rel="nofollow" 可以使用如下方法：

doc.select("div.comments a").attr("rel", "nofollow");

说明

与Element中的其它方法一样，attr 方法也是返回当 Element (或在使用选择器是返回 Elements 集合)。这样能够很方便使用方法连用的书写方式。比如：

doc.select("div.masthead").attr("title", "jsoup").addClass("round-box");

12、设置元素的html内容

Element div = doc.select("div").first(); // 
div.html("lorem ipsum
"); // lorem ipsum
div.prepend("First");//在div前添加html内容
div.append("Last");//在div之后添加html内容
// 添完后的结果: First
lorem ipsum
Last

Element span = doc.select("span").first(); // One
span.wrap("");
// 添完后的结果: One

说明

Element.html(String html) 这个方法将先清除元素中的HTML内容，然后用传入的HTML代替。
Element.prepend(String first) 和 Element.append(String last) 方法用于在分别在元素内部HTML的前面和后面添加HTML内容
Element.wrap(String around) 对元素包裹一个外部HTML内容。

13、设置元素的文本内容

Element div = doc.select("div").first(); // 
div.text("five > four"); // five > four
div.prepend("First ");
div.append(" Last");
// now: First five > four Last

说明

文本设置方法与 HTML setter 方法一样：

Element.text(String text) 将清除一个元素中的内部HTML内容，然后提供的文本进行代替
Element.prepend(String first) 和 Element.append(String last) 将分别在元素的内部html前后添加文本节点。

对于传入的文本如果含有像 <, > 等这样的字符，将以文本处理，而非HTML。

14、消除不受信任的html (来防止xss攻击)

在做网站的时候，经常会提供用户评论的功能。有些不怀好意的用户，会搞一些脚本到评论内容中，而这些脚本可能会破坏整个页面的行为，更严重的是获取一些机要信息，此时需要清理该HTML，以避免跨站脚本 cross-site scripting 攻击（XSS）。

String unsafe = 
  "Link";
String safe = Jsoup.clean(unsafe, Whitelist.basic());
// now: Link

说明

XSS又叫CSS (Cross Site Script) ，跨站脚本攻击。它指的是恶意攻击者往Web页面里插入恶意html代码，当用户浏览该页之时，嵌入其中Web里面的html代码会被执行，从而达到恶意攻击用户的特殊目的。XSS属于被动式的攻击，因为其被动且不好利用，所以许多人常忽略其危害性。所以我们经常只让用户输入纯文本的内容，但这样用户体验就比较差了。

一个更好的解决方法就是使用一个富文本编辑器WYSIWYG如CKEditor 和 TinyMCE。这些可以输出HTML并能够让用户可视化编辑。虽然他们可以在客户端进行校验，但是这样还不够安全，需要在服务器端进行校验并清除有害的HTML代码，这样才能确保输入到你网站的HTML是安全的。否则，攻击者能够绕过客户端的Javascript验证，并注入不安全的HMTL直接进入您的网站。

jsoup的whitelist清理器能够在服务器端对用户输入的HTML进行过滤，只输出一些安全的标签和属性。

jsoup提供了一系列的Whitelist基本配置，能够满足大多数要求；但如有必要，也可以进行修改，不过要小心。

这个cleaner非常好用不仅可以避免XSS攻击，还可以限制用户可以输入的标签范围。

你可能感兴趣的:(java工作知识梳理)

寻路中国~工厂~25 Carreybook
作者再本节继续讲述自己在丽水工业区参观各种工厂的所见所闻，何伟中文水平很6，蓑衣也容易和当地老板和工人聊上天，很多细节方面的记录，堪称一绝，比如为什么工厂老板不喜欢四川人和江西人进场工作，还有就是通过寻味工人的业余爱好判断他们是否勤劳，另外何伟还亲身参与了一把建筑工地的爆破和电钻，对那个年代的建筑工人有了深层的了解，基建狂魔之下，建筑行业还是非常景气的。浙江某工厂大门我刚到丽水进行考察的时候，他们
普通人副业选择什么工作副业最好的选择测评君高省
为未来的升级铺路，是非常必要的。那么对于我们普通人来说，应该做什么副业来发展呢？下面，小编给大家总结了五个可以让你月入过万的副业，想靠副业改变生活的朋友可以看一下，然后从中选择一个坚持下去。01.自媒体写作写作真的是一个人的硬核技能，可以有效地放大我们的才华与能力，不管你的职业是什么，我都真心建议你学会写作这门功课。我之前在做早教老师时，副业就是写作，刚开始时我的主业与副业收入都差不多，后来副业收
心路299～动力训练作业42 豆豆汪宝
1.记录我的训练过程；手臂一直放在桌面上，有一刻抬起来，马上又掉下来，翻转了几次，今天的动作总是跟不上，似乎就是想睡觉的感觉，不想动，楼梯就看到太阳底下大门口有一小节金黄色的楼梯，画面一闪而过，就听见数数了，放松阶段记不住了，手臂绷紧环节很享受，后面断断续续的断片了，2.联系到的事情，想法，感受；最近工作上的事情有些多，自己有些抗拒，就像今天的训练一样，接纳自己的状态，这是在蓄积力量。3.进步一小
游戏托哪里找平台游戏托兼职平台游戏托兼职会飞滴鱼儿
（如果你玩手游，请你认真看完这篇文章。因为下面的内容可能会颠覆你的认知。）我本人从2015年从事手游研发和运营5年时间，曾经是某一游戏大厂的运营主管，这五年时间里我接手过17款热门游戏的研发与运营工作。但在2020年，我毅然决然的退出游戏行业。所有才敢爆出手游产业链的内幕。大家玩游戏肯定都遇到过托，其实市面上百分之85的手游里面都有手游托，甚至达到一款游戏一个服都有一个托。我们业内以内部号来称呼。
工作之外的生活，也可以充实到极致借书人hyt
今天是周天，早晨六点起床，看了半小时书后开始洗漱、做早餐，早餐是六个馄炖，一颗水煮生菜。现在正在星巴克坐在落地窗前写文章，标配是拿铁、bose降噪耳机、MacBookAir。答应朋友写一篇关于借钱消费及计划消费的文章，但是因为诸多友邻咨询我如何做到自律，所以先写了这篇文章。我认为我的生活状态是很好很健康的，是我自己想要的生活。朝九晚五的工作，因为时间固定，自由时间较多，所以可以从容的安排工作以外的
MySQL(149)如何进行数据清洗？辞暮尔尔-烟火年年 MySQL mysql python 数据库
数据清洗在数据处理和分析过程中至关重要，确保数据质量和一致性。以下是一个详细的指南，展示如何使用Java进行数据清洗，包括处理缺失值、重复值、异常值、数据类型转换以及标准化等步骤。一、准备工作确保安装有Java开发环境（JDK）和Maven或Gradle等依赖管理工具。我们将使用ApacheCommonsCSV库来处理CSV文件，并使用Java标准库进行数据清洗操作。二、加载数据首先，我们加载数据
MySQL(147)如何进行跨平台迁移？辞暮尔尔-烟火年年 mysql adb 数据库
跨平台迁移涉及将数据库从一个操作系统或平台迁移到另一个，例如从Windows迁移到Linux，或从不同架构的硬件之间进行迁移。这个过程比同平台迁移更加复杂，需要特别注意数据库的兼容性、数据编码、文件路径等问题。以下是一步一步的指导，详细介绍如何进行跨平台数据库迁移。一、准备工作1.确认源与目标平台源平台：当前运行数据库的操作系统和硬件平台。目标平台：新的操作系统和硬件平台。2.安装数据库软件在目标
社团达人 WEIBOLAOMAO
不知不觉间，我又开始怀旧起来了，一怀旧，人就会伤感。很久以前，准确的说是大学的时候，我的业余生活依赖社团。因为和朋友在一起的感觉是最好的。不过后来才知道社团里面不都是朋友，并且不可能大学四年都在社团里面过，更重要的是，必须在一个自己主导的圈子里面交朋友，才会有主动权。后来我十分怀念2012届的学生会，也是这个原因，有一群志同道合的人一起说话，一起做事，那种感觉真的很棒。出来工作以后，尤其是来到这个
（详细！！）2024最新Neo4j详细使用指南熊猫发电机：miniqq207 neo4j neo4j
Neo4j详细使用指南一、介绍Neo4j是什么Neo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态
（详细文档）java web在线商城系统（jsp + servlet）熊猫发电机：miniqq207 实训项目数据仓库大数据
目录一、设计任务......................................................................................41.1设计意义................................................................................41.2设计目的..........
又是匆忙的一天香草芬芳
给你分享我的一天，一天就这样过去了，大部分时间在刷题，陪伴儿子玩了一会，做家务一会，冥想一会，刷抖音一会，和儿子以及妈妈聊天一会，一日三餐一会，取快递买电池一会，完成线上教学工作一晚上，批改完两个班的作业两个多小时，就这样在此刻准备休息了，又是一天到晚的忙碌，但是成长的过程让人很开心快乐。我并没有因为这样忙碌的一天到晚而不开心，反而我觉得今天我赚到了，因为我没有浪费时间。这可能就是有了对比才有了拼
mysql事物详解
前言：事物是什么？作为一个java程序员，也许我们仅仅只是停留在会使用的程度上，会通过在类上或者方法上使用@Transactional注解的方式来使用事物，但是背后的原理，为什么使用这个注解就能使事物生效可能并不是很清楚。下面本文详细一一介绍事物是什么，事物的特性，怎么使用等等。1.事物是什么所谓事物，在我的理解中就是一系列操作的一个集合，一旦其中一个操作失败，那么整个操作集合必须全部失败，回滚到
JAVAWeb2 DanB24 oracle 数据库
1.数据库设计1.软件的研发步骤数据库设计概念数据库设计就是根据业务系统的具体需求，结合我们所选用的DBMS，为这个业务系统构造出最优的数据存储模型。建立数据库中的表结构以及表与表之间的关联关系的过程。有哪些表？表里有哪些字段？表和表之间有什么关系？数据库设计的步骤需求分析（数据是什么?数据具有哪些属性?数据与属性的特点是什么）逻辑分析（通过ER图对数据库进行逻辑建模，不需要考虑我们所选用的数据库
你永远叫不醒一个装睡的人，等他自己醒的时候已经晚了鱼和熊掌兼得
在办公室批改作业，旁边的两位老师在聊天，说起以前上学时的事情。一位老师说：“高中三年我都是混过来的，最后还考上中专，大家都替我可惜，觉得我要是努力一点能考的更好，只有我自己没啥感觉。”“当时能考上中专已经很不错了，成绩下来的时候我开心坏了。现在知道后悔了，那时候要是用点心就好了。”“那你爸妈也不管你吗？”“一开始管我很严，成绩很不错。后来我爸工作调动，我也跟着回来了。家里有一个大爷是重男轻女，只要
白帽必备技术栏目一（javascript基础）
直接进入主题正好也在带学生会把笔记同步发送到csdn上后期不管是去就业还是在家里挖洞都都行javascript基础注意事项局部作用域里面给到的变量不加var就会变成全局变量数据类型boolean布尔类型boolean除了0和空字符串以及nullundefined其他的都是truevarbool=true;varbool=false;number类型varnum=10;//10varnum=0x23
晨间日记的奇迹读后感6-10 优雅生活_9919
【今日阅读页数】6--10【金句】早上写日记之后，觉得整个人神清气爽，于是一整天下来，工作的情绪也承接了早上的愉悦情绪。【感悟】早上起床后，精力充沛，虽然没有达到作者的这种状态，但也略微有所感触，也开始写自己的晨间日记了，养成写晨间日记的习惯，拥抱人生梦想！
人的行为读书笔记，2-7 夕颜剑主
第二章人的行为科学在认识论层次的一些问题第七节历史的范畴和专门的研究方法1.历史的研究范畴与历史家如何进行真正的历史工作历史的范畴是研究所有关于人的行为的经验资料。历史学家收集、批判、筛选所有可以取得的文件，以这种证据为基础，着手进行真正的历史工作。2.错误的历史研究方法有人说，历史的任务是揭露一些事件实际上是如何发生的，不允许有所遐想，亦不许有价值判断（也即，对于一切价值判断保持中立）。他们认为
从零开发推客小程序系统：完整技术方案与实战经验 wx_ywyy6798 小程序推客小程序开发推客系统开发微信小程序推客小程序推客系统推客分销系统开发
一、推客小程序的市场价值社交电商爆发式增长背景推客模式的优势：低成本获客、用户裂变小程序作为推客系统载体的天然优势二、技术架构设计text1.前端技术栈：-微信小程序原生开发/uni-app跨平台方案-自定义分享组件开发-可视化数据看板实现2.后端技术选型：-Node.js/PHP/JavaSpringBoot等后端框架对比-高性能分销关系链存储方案-佣金结算系统的设计要点3.数据库设计：-用户层
linux如何使用jstack分析线程状态 ycllycll linux
在高并发，多线程环境下的java程序经常需要分析线程状态，本本是一个分析步骤无具体讲解（具体命令可自行google学习）一般流程：1.使用jps-l查看有哪些java程序在运行2.使用top查看步骤1中进程号（pid或者vmid）所占用cpu以及内存情况（或者省略步骤1）3.使用top-Hppid查看具体该pid下各个线程所占用的cpu情况（进程下的线程有一个nid，后面需要用到）4.使用jsta
周末总结(2024/07/12) 全栈黎明日记
工作人际关系核心实践：要学会随时回应别人的善意，执行时间控制在5分钟以内遇到接不住的话题时拉低自己，抬高别人(无阴阳气息)朋友圈点赞控制在5min以内，职场社交不要放在5min以外职场的人际关系在面对利益冲突是直接质疑，要快准狠，不要内耗、回复消息要控制在30min之内，一定要及时回复每周抽出10min时间用来反思人际关系不能当面揭别人的短，这会显得自己情商很低外圆内方遇到问题要主动沟通当日事当日
周末总结(2024/06/28)
工作人际关系核心实践：要学会随时回应别人的善意，执行时间控制在5分钟以内遇到接不住的话题时拉低自己，抬高别人(无阴阳气息)朋友圈点赞控制在5min以内，职场社交不要放在5min以外职场的人际关系在面对利益冲突是直接质疑，要快准狠，不要内耗、回复消息要控制在30min之内，一定要及时回复每周抽出10min时间用来反思人际关系不能当面揭别人的短，这会显得自己情商很低外圆内方遇到问题要主动沟通当日事当日
【人工智能之深度学习】6. 卷积核工作原理：从边缘检测到特征抽象的逐层演进（附可视化工具与行业实战代码） AI_DL_CODE 人工智能深度学习卷积核特征提取卷积神经网络边缘检测特征可视化
摘要：卷积核是卷积神经网络（CNN）的核心组件，其通过局部感受野与参数共享机制实现高效特征提取。本文从数学本质出发，揭示卷积操作的空域-频域对偶性：空域卷积等价于频域乘积（F{f∗g}=F{f}⋅F{g}F\{f*g\}=F\{f\}⋅F\{g\}F{f∗g}=F{f}⋅F{g}），解释边缘检测核（Sobel、Laplacian）的频域响应特性。通过特征可视化实验表明，CNN特征呈现逐层抽象规律：
2023-02-28 jnvjkdnfvd
一、早期新手指南环节01妖怪追捕开始游戏后建号，追随主线任务直至主线任务完成后，逐渐杀怪追捕。杀怪追捕不仅可以在环节中打进武器装备，还可以领工作经验卷和徽章原材料，可谓一石三鸟。02淬体觉醒在咱们打进一定量的妖怪追捕时，我们应该考虑到觉醒了，大家可点击觉醒，然后进入淬体选择项，在咱们觉醒宝钻充裕时能够进行觉醒，可是在咱们觉醒宝钻不足的情况下，也不需要惊慌，我们只需再次点一下淬体，随后追随它提醒去相
混合开发Hybrid，JSBridge原理简述永恒即是最美
混合开发（Hybrid），是一种开发模式，指使用多种开发模型开发App。一般有两大模式：原生Native、WebH5。混合开发时，原生、Web相互通信都离不开JSBridge。JSBridge：以JavaScript引擎或Webview容器作为媒介，通过协定协议进行通信，实现Native端和Web端双向通信的一种机制。（webView是移动端提供的运行JavaScript的环境，是系统渲染Web网
Windows环境下批量重命名文件的三种高效方法数据冰山
本文还有配套的精品资源，点击获取简介：在Windows系统中，批量修改文件夹内文件名称能极大提高工作效率。本文介绍了三种方法：利用Windows自带的批量重命名功能、使用批处理脚本和借助第三方工具“批量改变文件名称.exe”。每种方法都提供了操作步骤，并强调了数据备份的重要性，以防止文件误改或丢失。1.Windows自带批量重命名功能的使用方法在本章中，我们将从零开始，探索Windows操作系统内
脱岗离岗逃岗监测识别软件系统平台标检测算法#YOLO
值班脱岗智能监测识别系统是一种利用AI视频智能分析技术的智能化系统，能够对办公工作岗位区域、岗亭、值班室、生产线岗位等进行7*24小时不间断实时监测。该系统的出现，有助于提高工作效率，确保工作秩序的正常运行，同时也能有效避免值班人员脱岗、懈怠等现象的发生。该系统的工作原理是通过高清摄像头捕捉实时画面，然后利用AI视频智能分析技术对画面进行实时分析，识别出是否有人脱岗、懈怠或者有其他异常情况发生。当
2023-05-02|老子|第六十二章| 一生的宝藏陆颜
道者万物之奥----老子《道德经》第六十二章道是万物的归处，万物的家园，万物根本的藏身之处。遵循大道是事情成功的唯一标准，每一件事情背后都有所遵循的规律，我们要看到这个规律，就像是窥探到天机，打开了天眼，活得通透；也像找到了宝藏，还必须得打开潘多拉魔盒，不害怕才能活得精彩。我们工作中的大道是什么？我认为企业的使命、愿景、价值观，这是一家公司的大道，如果没有就像是一艘要下海远航的船，全速前进，他却不
知足常乐～挂在嘴边，有多少人真的懂其真正的含义拾一君
过了而立之年，突然真正明白了知足常乐的意义。我属于永远看着远方的人，以前觉得这是居安思危，其实这何尝不是另一种好高骛远。大学毕业那年，我因为不喜欢自己的专业，想要换个行业工作。高不成低不就，毕业半年都没有找到工作，半年的失业非常的煎熬，一次次被拒，我觉得自己好像永远找不到工作了，非常的绝望，感觉人生看不到希望了。那年圣诞，我终于收到了一份录用通知，我觉得那是我人生中收到的最棒的圣诞礼物！半年的待业
老年人可以从事哪些职业? 高省飞智导师
针对当下的经济形势，对于一名50多岁的人来说，想找到一份合适的工作确实是很难，但拼体力挣钱也肯定是力不从心，那么，目前社会上，有哪些不用出体力挣钱的途径，比较适合一名50多岁的人呢？我在这里给大家推荐几种，仅供用于调研参考。私导服务当今社会上有外出旅游需求的人很多，特别是一些离退休的老人们，他们不缺钱，只是不方便或缺乏安全感，所以，私人导游服务则应运而生。对于一名50多岁的人来说，目前可以选择在这
Python设计模式：适配模式 niuguangshuo python基础 python 设计模式开发语言
1.适配模式（AdapterPattern）详解适配模式（AdapterPattern）是一种结构型设计模式，它允许将一个类的接口转换成客户端所期望的另一种接口。适配模式使得原本由于接口不兼容而无法一起工作的类可以协同工作。换句话说，适配模式充当了一个桥梁，允许不同接口的类之间进行交互。在软件开发中，常常会遇到需要使用现有类的情况，但这些类的接口与我们需要的接口不匹配。适配模式提供了一种解决方案，
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比