u012315428

jsoup的使用

hello

在用了一段时间的正则表达式之后，一直想找个机会学习一下jsoup，据说是解析网页的神器，但苦于官方的英文文档。迟迟没有动手

自从看了youtube上的jsoup的视频之后，短短几行就实现了之前几十行的任务，（爬取网页上的所有超链接），这坚定了我学习jsoup的

决心，结合中文文档和英文文档，花了大概两天的时间，大概了解了一下jsoup的使用，对于正则表达式头疼的不行的我来说，

真乃神器啊，花点时间整理一下，原谅我大篇幅的抄官网，写的实在好，静下心来，一定看的懂。

ps：吐槽一下印象笔记，之前写过一次，没保存，就关闭了，居然没提示是否保存，哎，没办法，再整理一遍，遂有点粗糙，仅供参考

1、

   
   
   
   
    
    
    
    String html = "<html><head><title>First parse</title></head>" + "<body><p>Parsed HTML into a doc.</p></body></html>"; Document doc = Jsoup.parse(html);

parse(String html, String baseUri) 这方法能够将输入的HTML解析为一个新的文档 (Document），参数 baseUri 是用来将相对 URL 转成绝对URL，并指定从哪个网站获取文档。如这个方法不适用，你可以使用 parse(String html) 方法来解析成HTML字符串如上面的示例。.

只要解析的不是空字符串，就能返回一个结构合理的文档，其中包含(至少) 一个head和一个body元素。

一旦拥有了一个Document，你就可以使用Document中适当的方法或它父类 Element和 Node中的方法来取得相关数据。

2、

String html = "<div><p>Lorem ipsum.</p>";
Document doc = Jsoup.parseBodyFragment(html);
Element body = doc.body();

假如你有一个HTML片断 (比如. 一个 div 包含一对 p 标签; 一个不完整的HTML文档) 想对它进行解析。这个HTML片断可以是用户提交的一条评论或在一个CMS页面中编辑body部分。

parseBodyFragment 方法创建一个空壳的文档，并插入解析过的HTML到body元素中。假如你使用正常的 Jsoup.parse(String html) 方法，通常你也可以得到相同的结果，但是明确将用户输入作为 body片段处理，以确保用户所提供的任何糟糕的HTML都将被解析成body元素。

Document.body() 方法能够取得文档body元素的所有子元素，与 doc.getElementsByTag("body")相同。

3、从一个url加载doc

//load a document from a url
   //doc = Jsoup.connect(" http://www.jsoup.org/").get();
   //Elements links = doc.select("a");

   //System.out.println(doc);
   /*获得body
   Element body = doc.body();
   System.out.println(body);
   */
   /*
    * 获得title
   String title = doc.title();
   System.out.println(title);
   */
   /*打印所有链接
   for(Element e:links)
   {
    //System.out.println(e);
    //System.out.println(e.attr("abs:href"));

}
*/

connect(String url) 方法创建一个新的 Connection , 和 get() 取得和解析一个HTML文件。如果从该URL获取HTML时发生错误，便会抛出 IOException，应适当处理。

Document doc = Jsoup.connect("http://example.com")
  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(3000)
  .post();

这个方法只支持Web URLs ( http 和 https 协议); 假如你需要从一个文件加载，可以使用 parse(File in, String charsetName) 代替。

4、

在本机硬盘上有一个HTML文件，需要对它进行解析从中抽取数据或进行修改。

可以使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法：

    
    
    
    
     
     
     
     File input = new File("/tmp/input.html"); Document doc = Jsoup.parse(input, "UTF-8", http://example.com/);
    
    
    
    
    
    
    
    
     
     
     
     
     
     
     
     parse(File in, String charsetName, String baseUri) 这个方法用来加载和解析一个HTML文件。如在加载文件的时候发生错误，将抛出IOException，应作适当处理。
     
     
     
     baseUri 参数用于解决文件中URLs是相对路径的问题。如果不需要可以传入一个空的字符串。
     
     
     
     另外还有一个方法parse(File in, String charsetName) ，它使用文件的路径做为 baseUri。 这个方法适用于如果被解析文件位于网站的本地文件系统，且相关链接也指向该文件系统。

5、

你有一个HTML文档要从中提取数据，并了解这个HTML文档的结构。

将HTML解析成一个Document之后，就可以使用类似于DOM的方法进行操作。示例代码：

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

//得到所有a标签
   Elements as = doc.getElementsByTag("a");
   for(Element a : as){
    System.out.println(a);
   }

/*
 Elements as = doc.getElementsByTag("a");
 for(Element a : as){
 System.out.println(a);
 }
 */
 //找到id的nav的标签
 /*
 Element ids = doc.getElementById("nav");
 System.out.println(ids);
 */
 /*得到class = appdown 的标签

 Elements classes = doc.getElementsByClass("appDown");
 System.out.println(classes);
 */
 /*
 Elements attrs = doc.getElementsByAttribute("href");
 System.out.println(attrs);
 out:
 <a href=" http://house.focus.cn/" target="_blank">房产</a>
 <a href=" http://house.focus.cn/" target="_blank">更多</a>
 */
 /*得到parent标签
 Element div = doc.getElementsByClass("appDown").first();
 System.out.println(div);
 Element parent = div.parent();
 System.out.println(parent);
 <li class="appDown"><a href=" http://k.sohu.com/">App</a></li>
 <ul>
 <li class="client dev-pc"><a href="javascript:void(0);" class="dev-cur">电脑</a> </li>
 <li class="retina dev-pad"> <a href="#" class="dev-cur">Pad</a></li>
 <li class="client dev-pad"><a href="#"> 电脑</a></li>
 <li class="retina dev-pc"><a href="#">Pad</a></li>
 <li class="handset"><a href=" http://m.sohu.com/">手机</a></li>
 <li class="appDown"><a href=" http://k.sohu.com/">App</a></li>
 </ul>
 */
 /*得到标签的属性值
 Element aa = doc.getElementsByTag("a").first();
 System.out.println(aa);
 Attributes aatt = aa.attributes();
 System.out.println(aatt);
 <a href=" http://news.sohu.com/" target="_blank"><img src=" http://news.sohu.com/upload/2013/images/news_logo0.gif" width="112" height="48" alt="搜狐新闻" filter="1"></a>
 href=" http://news.sohu.com/" target="_blank"
 */

将HTML解析成一个Document之后，就可以使用类似于DOM的方法进行操作。示例代码：

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

查找元素

getElementById(String id)
getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key) (and related methods)
Element siblings: siblingElements(), firstElementSibling(), lastElementSibling();nextElementSibling(), previousElementSibling()
Graph: parent(), children(), child(int index)

元素数据

attr(String key)获取属性attr(String key, String value)设置属性
attributes()获取所有属性
id(), className() and classNames()
text()获取文本内容text(String value) 设置文本内容
html()获取元素内HTMLhtml(String value)设置元素内的HTML内容
outerHtml()获取元素外HTML内容
data()获取数据内容（例如：script和style标签)
tag() and tagName()

操作HTML和文本

append(String html), prepend(String html)
appendText(String text), prependText(String text)
appendElement(String tagName), prependElement(String tagName)
html(String value)

6、

File input = new File("test.html");
 Document doc = Jsoup.connect(" http://jsoup.org/").get();

 //System.out.println(doc);
 /*
 Element content = doc.getElementById("content");
 System.out.println(content);
 */
 /*
 Elements links = doc.getElementsByTag("a");
 for(Element link : links){
 String linkHref = link.attr("abs:href");
 String Linktext = link.text();
 //System.out.println(linkHref);

 System.out.println(Linktext);
 }
 */
 /*
 Element link = doc.select("a").first();
 //System.out.println(link);
 String text = doc.body().text();
 //System.out.println(text);
 String linkhref = link.attr("href");
 String linktext = link.text();
 String linkouterH = link.outerHtml();
 String linkInnerH = link.html();
 System.out.println(linkhref+linktext+linkouterH+linkouterH);
 // /jsoup<a href="/">jsoup</a><a href="/">jsoup</a>
 * */
 Elements links = doc.select("a[href]");//带有href属性的a元素
 Elements pngs = doc.select("img[src$=.png]");//扩展名为.png的图片
 Element masthead = doc.select("div.content").first();
 //class 等于masthead -的div标签
 Elements resultlinks = doc.select("h2.r>a");

 System.out.println(links.first());
 System.out.println(pngs.first());
 //System.out.println(masthead);
 System.out.println(resultlinks.first());

说明

jsoup elements对象支持类似于CSS (或jquery)的选择器语法，来实现非常强大和灵活的查找功能。.

这个select 方法在Document, Element,或Elements对象中都可以使用。且是上下文相关的，因此可实现指定元素的过滤，或者链式选择访问。

Select方法将返回一个Elements集合，并提供一组方法来抽取和处理结果。

Selector选择器概述

tagname: 通过标签查找元素，比如：a
ns|tag: 通过标签在命名空间查找元素，比如：可以用 fb|name 语法来查找 <fb:name> 元素
#id: 通过ID查找元素，比如：#logo
.class: 通过class名称查找元素，比如：.masthead
[attribute]: 利用属性查找元素，比如：[href]
[^attr]: 利用属性名前缀来查找元素，比如：可以用[^data-] 来查找带有HTML5 Dataset属性的元素
[attr=value]: 利用属性值来查找元素，比如：[width=500]
[attr^=value], [attr$=value], [attr*=value]: 利用匹配属性值开头、结尾或包含属性值来查找元素，比如：[href*=/path/]
[attr~=regex]: 利用属性值匹配正则表达式来查找元素，比如： img[src~=(?i)\.(png|jpe?g)]
*: 这个符号将匹配所有元素

Selector选择器组合使用

el#id: 元素+ID，比如： div#logo
el.class: 元素+class，比如： div.masthead
el[attr]: 元素+class，比如： a[href]
任意组合，比如：a[href].highlight
ancestor child: 查找某个元素下子元素，比如：可以用.body p 查找在"body"元素下的所有 p元素
parent > child: 查找某个父元素下的直接子元素，比如：可以用div.content > p 查找 p 元素，也可以用body > * 查找body标签下所有直接子元素
siblingA + siblingB: 查找在A元素之前第一个同级元素B，比如：div.head + div
siblingA ~ siblingX: 查找A元素之前的同级X元素，比如：h1 ~ p
el, el, el:多个选择器组合，查找匹配任一选择器的唯一元素，例如：div.masthead, div.logo

伪选择器selectors

:lt(n): 查找哪些元素的同级索引值（它的位置在DOM树中是相对于它的父节点）小于n，比如：td:lt(3) 表示小于三列的元素
:gt(n):查找哪些元素的同级索引值大于n，比如： div p:gt(2)表示哪些div中有包含2个以上的p元素
:eq(n): 查找哪些元素的同级索引值与n相等，比如：form input:eq(1)表示包含一个input标签的Form元素
:has(seletor): 查找匹配选择器包含元素的元素，比如：div:has(p)表示哪些div包含了p元素
:not(selector): 查找与选择器不匹配的元素，比如： div:not(.logo) 表示不包含 class=logo 元素的所有 div 列表
:contains(text): 查找包含给定文本的元素，搜索不区分大不写，比如： p:contains(jsoup)
:containsOwn(text): 查找直接包含给定文本的元素
:matches(regex): 查找哪些元素的文本匹配指定的正则表达式，比如：div:matches((?i)login)
:matchesOwn(regex): 查找自身包含文本匹配指定正则表达式的元素
注意：上述伪选择器索引是从0开始的，也就是说第一个元素索引值为0，第二个元素index为1等

7、

要取得一个属性的值，可以使用Node.attr(String key) 方法
对于一个元素中的文本，可以使用Element.text()方法
对于要取得元素或属性中的HTML内容，可以使用Element.html(), 或 Node.outerHtml()方法

String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);//解析HTML字符串返回一个Document实现
Element link = doc.select("a").first();//查找第一个a元素

String text = doc.body().text(); // "An example link"//取得字符串中的文本
String linkHref = link.attr("href"); // "http://example.com/"//取得链接地址
String linkText = link.text(); // "example""//取得链接地址中的文本

String linkOuterH = link.outerHtml(); 
    // "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"//取得链接内的html内容

8、

你有一个包含相对URLs路径的HTML文档，需要将这些相对路径转换成绝对路径的URLs。

方法

在你解析文档时确保有指定base URI，然后
使用 abs: 属性前缀来取得包含base URI的绝对路径。代码如下：

Document doc = Jsoup.connect("http://www.open-open.com").get();

Element link = doc.select("a").first();
String relHref = link.attr("href"); // == "/"
String absHref = link.attr("abs:href"); // "http://www.open-open.com/"

说明

在HTML元素中，URLs经常写成相对于文档位置的相对路径： <a href="/download">...</a>. 当你使用 Node.attr(String key) 方法来取得a元素的href属性时，它将直接返回在HTML源码中指定定的值。

假如你需要取得一个绝对路径，需要在属性名前加 abs: 前缀。这样就可以返回包含根路径的URL地址attr("abs:href")

因此，在解析HTML文档时，定义base URI非常重要。

如果你不想使用abs: 前缀，还有一个方法能够实现同样的功能 Node.absUrl(String key)

9、

可以使用属性设置方法 Element.attr(String key, String value), 和 Elements.attr(String key, String value).

假如你需要修改一个元素的 class 属性，可以使用 Element.addClass(String className) 和Element.removeClass(String className) 方法。

Elements 提供了批量操作元素属性和class的方法，比如：要为div中的每一个a元素都添加一个rel="nofollow" 可以使用如下方法：

doc.select("div.comments a").attr("rel", "nofollow");

说明

与Element中的其它方法一样，attr 方法也是返回当 Element (或在使用选择器是返回 Elements 集合)。这样能够很方便使用方法连用的书写方式。比如：

doc.select("div.masthead").attr("title", "jsoup").addClass("round-box");

Element.html(String html) 这个方法将先清除元素中的HTML内容，然后用传入的HTML代替。
Element.prepend(String first) 和 Element.append(String last) 方法用于在分别在元素内部HTML的前面和后面添加HTML内容
Element.wrap(String around) 对元素包裹一个外部HTML内容。

文本设置方法与 HTML setter 方法一样：

Element.text(String text) 将清除一个元素中的内部HTML内容，然后提供的文本进行代替
Element.prepend(String first) 和 Element.append(String last) 将分别在元素的内部html前后添加文本节点。

对于传入的文本如果含有像 <, > 等这样的字符，将以文本处理，而非HTML。

/*
 Elements e = doc.select("a").attr("rel", "nofolow");//为所有的a标签增加属性值

 doc.select("div.wrap").attr("title","jsoup").addClass("round-box");
 doc.select("a").remove();//删除a标签
 System.out.println(doc);
 */
 /*修改div的内容
 Element div = doc.select("div").first();
 div.html("这是我加的");
 div.prepend("哈哈");
 div.append("字串");
 */
 /*用wrap里面的包住span标签
 Element span = doc.select("span").first();
 span.wrap("<li><a href='http://www.baidu.com'></a></li>");
 */
 /*
 Element div = doc.select("div").first();
 div.text("five > four");
 div.prepend("First ");
 div.append(" Last");
 System.out.println(doc);
 <div class="wrap">
 First five > four Last
 </div>
 */

10、

消除不受信任的HTML (来防止XSS攻击)

问题

在做网站的时候，经常会提供用户评论的功能。有些不怀好意的用户，会搞一些脚本到评论内容中，而这些脚本可能会破坏整个页面的行为，更严重的是获取一些机要信息，此时需要清理该HTML，以避免跨站脚本cross-site scripting攻击（XSS）。

方法

使用jsoup HTML Cleaner 方法进行清除，但需要指定一个可配置的 Whitelist。

String unsafe = 
  "<p><a href='http://example.com/' onclick='stealCookies()'>Link</a></p>";
String safe = Jsoup.clean(unsafe, Whitelist.basic());
// now: <p><a href="http://example.com/" rel="nofollow">Link</a></p>

说明

XSS又叫CSS (Cross Site Script) ，跨站脚本攻击。它指的是恶意攻击者往Web页面里插入恶意html代码，当用户浏览该页之时，嵌入其中Web里面的html代码会被执行，从而达到恶意攻击用户的特殊目的。XSS属于被动式的攻击，因为其被动且不好利用，所以许多人常忽略其危害性。所以我们经常只让用户输入纯文本的内容，但这样用户体验就比较差了。

一个更好的解决方法就是使用一个富文本编辑器WYSIWYG如CKEditor 和 TinyMCE。这些可以输出HTML并能够让用户可视化编辑。虽然他们可以在客户端进行校验，但是这样还不够安全，需要在服务器端进行校验并清除有害的HTML代码，这样才能确保输入到你网站的HTML是安全的。否则，攻击者能够绕过客户端的Javascript验证，并注入不安全的HMTL直接进入您的网站。

jsoup的whitelist清理器能够在服务器端对用户输入的HTML进行过滤，只输出一些安全的标签和属性。

jsoup提供了一系列的Whitelist基本配置，能够满足大多数要求；但如有必要，也可以进行修改，不过要小心。

这个cleaner非常好用不仅可以避免XSS攻击，还可以限制用户可以输入的标签范围。

你可能感兴趣的:(jsoup的使用)

origin和python有什么不同_python爬虫之git的使用（origin说明） weixin_39878760
1、首先我们回忆两个命令#gitremoteaddorigin远程仓库链接#gitpush-uoriginmaster我们一起看看这个命令，git是git的一级命令，push就是下载，-u应该使用用账户验证maser就是分支的名字(前面我们说过)，那么这个origin是个什么鬼？大家看看下面的这个5毛钱图，就能发现，其实origin就是远程仓库的名称。如果不相信在看看我的配置文件#vi.git/c
（三）python网络爬虫（理论+实战）——爬虫与反爬虫阳光宅男xxb 30天学会python网络爬虫 python 大数据爬虫
系列文章目录（1）python网络爬虫—快速入门（理论+实战）（一）（2）python网络爬虫—快速入门（理论+实战）（二）序言本人从事爬虫相关工作已8年以上，从一个小白到能够熟练使用爬虫，中间也走了些弯路，希望以自身的学习经历，让大家能够轻而易举的，快速的，掌握爬虫的相关知识并熟练的使用它，避免浪费更多的无用时间，甚至走
NVIDIA-TensorRT-Python推理呆呆珝推理框架 python 人工智能开发语言
1,前言NVIDIATensorRT进行模型推理的Python实现。TensorRT是一个高性能的深度学习推理优化器和运行时，它能够为深度学习模型提供低延迟和高吞吐量的推理能力。(由于官方文档的使用还是比较简单，也可能自己很菜，参考了别人的文档和自己摸索，写出来这个可以使用的API)2.Python-API推理step1：导入基本库(环境自行配置)#导入TensorRT库importtensorr
如何高效调用API：使用Python构建可靠的网络请求 qq_37836323 python 开发语言
#引言在当今的开发环境中，API的使用变得无处不在。无论是获取数据还是操作远程服务，API都是一个必不可少的工具。然而，由于网络限制和访问不稳定等问题，在某些地区开发者可能需要考虑使用API代理服务来提高API的访问成功率。本文将带您了解如何使用Python高效调用API，并提供实用的代码示例。#主要内容##API调用的基础API（应用程序编程接口）允许不同的软件程序通过API端点进行通信。对于P
橘子学Mybatis09之Mybatis关于二级缓存的使用玄衣如雪 #Mybatis mybatis
前面我们说了一级缓存，但是实际上我们说那玩意其实不咋实用。于是既然设计了缓存体系，就不可能弄个不实用的给人们。所以这里就引出二级全局缓存。全局缓存就是无视sqlSession，你可以理解为一个分布式的缓存。作为全局的访问。一、二级缓存1、开启方式二级缓存默认是不开启的，所以他需要你手动去开启。开启方式需要满足下面四个条件。1、需要在核心配置文件，我的是sqlMapConfig.xml中指定，在SE
openresty+lua实现实时写kafka sky@梦幻未来大数据 openresty nginx openresty lua
一.背景在使用openresty+lua+nginx+flume，通过定时切分日志发送kafka的方式无法满足实时性的情况下，小编开始研究openresty+lua+nginx+kafka实时写kafka，从而达到数据实时性，和高性能保证。二.实现1.openresty安装nginx，以及lua的使用请看博主上一篇博客https://blog.csdn.net/qq_29497387/articl
PHP语言的数据库编程 Linux520小飞鱼包罗万象 golang 开发语言后端
PHP语言的数据库编程引言随着互联网的发展，动态网站已成为主流，而动态网站的核心就是与数据库进行交互。PHP（超文本预处理器）是一种流行的开源服务器端脚本语言，被广泛用于Web开发。它以其简单易学和功能强大而受到开发者的青睐。而在PHP的生态系统中，数据库编程占据了重要的位置。本文将系统地探讨PHP语言的数据库编程，包括数据库的基本概念、PHP与MySQL的结合、PDO的使用，以及一些常见的数据库
oracle12c merge into,Oracle MERGE INTO的使用方法俊銘 oracle12c merge into
非常多时候我们会出现例如以下情境,假设一条数据在表中已经存在,对其做update,假设不存在,将新的数据插入.假设不使用Oracle提供的merge语法的话,可能先要上数据库select查询一下看是否存在,然后决定怎么操作,这种话须要写很多其它的代码,同一时候性能也不好,要来回数据库两次.使用merge的话则能够一条SQL语句完毕.1)主要功能提供有条件地更新和插入数据到数据库表中假设该行存在，运
ESP-IDF使用LED组件实现各种LED效果控制荻夜 ESP32 esp32 led_indicator
ESP32使用LED组件实现各种LED控制ESP-IDF组件管理LED组件简介测试LED组件写在最后ESP-IDF组件管理IDF组件管理器工具用于下载ESP-IDFCMake项目的依赖项，该下载在CMake运行期间自动完成。IDF组件管理器可以从自动从组件注册表或Git仓库获取组件，具体的使用和介绍，请查看官方文档，需要注意的是ESP-IDF管理器是IDF4.4以后引入的特性，使用IDF框架时，建
ESP32开发日记4-来讲讲ESP32之外的东西(Valgrind 工具的使用) 我在武汉上早八开发工具笔记物联网 linux c语言 c++
目录简介安装Valgrind基本使用总结简介从第一篇文章我们知道，乐鑫官方给集成了一个调试工具，能够在程序异常时分层追踪到导致异常的地方。这个功能实际上很像Valgrind，她是一个在Linux环境下广泛使用的编程工具套件，主要用于内存调试、内存泄漏检测以及性能分析。它对于识别程序中的内存和线程问题非常有用，特别适用于C和C++程序的开发和调试。在实际的开发过程当中如果遇到不好找的问题特别是崩溃内
sql耗时监控与sql语句日志输出心写来潮个人笔记 sql java 数据库
由于工作上涉及到分库分表查询，需要监测每条sql的执行耗时并打印sql语句，下面分享一下p6spy监控的使用，同时也当做一个学习记录。1.添加maven依赖p6spyp6spy3.0.02.添加配置文件spy.propertiesmodulelist=com.p6spy.engine.spy.P6SpyFactory,com.p6spy.engine.logging.P6LogFactory,co
MYSQL学习笔记(五)：单行函数(字符串、数学、日期时间、条件判断、信息、加密、进制转换函数)讲解羊小猪~~ MYSQL mysql 学习笔记 sql 数据库考研后端
前言：学习和使用数据库可以说是程序员必须具备能力，这里将更新关于MYSQL的使用讲解，大概应该会更新30篇+，涵盖入门、进阶、高级(一些原理分析);这一篇是讲解单行函数，当然mysql函数很多哈，只有多用才能记得住；这些函数，如果不用，记得再牢都会忘记(我是这样的)，但是可以先看一下，动手打一下，会现用现查即可，而且现在AI这么发达不是么；虽然MYSQL命令很多，但是自己去多敲一点，到后面忘记了，
SHELL 命令：dirname basename的使用 seableble
取一个文件存储路径，可以用dirname。使用起来分两种情况：一、带全路径的，例：aguo@auto-test:~>dirname/home/aguo/insert.sql/home/aguo＃获得文件所在目录二、仅仅是文件名的，例：aguo@auto-test:~>dirnameEnvironment.表示路径就是当前目录字号：大中小#basenameinclude/stdio.hstdio.h
C# 中 default 使用详解鲤籽鲲 C#c#数据库开发语言
总目录前言在C#中，default关键字用于表示类型默认值。它可以根据上下文推断出适用的类型，并返回该类型的默认值。随着C#版本的发展，default的用法也变得更加丰富和灵活。本文将详细介绍default在不同场景下的使用方法及其最佳实践。一、default获取类型的默认值1.语法与作用可以使用default关键字来获取任意类型的默认值。值类型（如int,double,struct等）：返回类型
Vue - toRefs() 和 toRef() 的使用来一碗刘肉面 Vue vue.js 前端 javascript
一、toRefs()在Vue3中,toRefs()可以将响应式对象的属性转换为可响应的refs。主要用于在解构响应式对象时，保持属性的响应性。1.导入toRefs函数import{toRefs}from'vue';2.将响应式对象的属性转换为refconststate=reactive({count:0,message:'Hello,Vue3!'});//toRefs()接受一个响应式对象，并返回
python中strip()和split()的使用方法（学习笔记）木子_李轩笔记
1.strip()：用于移除字符串头、尾指定的字符(默认空格)，不能删除中间部分的字符。#未使用strip()path=r"C:\Users\67539\Desktop\22\11.txt"f=open(path,"r")forlineinf:#按行读取print(line)f.close()#结果cat22airplane23dog58mug86#########################
Flask基础和URL映射終不似少年遊* python进阶学习 flask python 后端开发框架
目录1.Flask介绍2.Flask第一个应用程序3.Flask运行方式4.Flask中DEBUG模式5.Flask环境参数的加载6.Flask路径参数的使用7.Flask路径参数类型8.Flask路径参数类型转换底层9.Flask自定义路由转换器自定义步骤：10.自定义转换to_python函数11.Postman的使用功能：使用示例：12.查询参数的使用13.请求体参数的使用14.上传文件的使
CSGHub 快速部署指南算法llm
CSGHub快速部署指南OmnibusCSGHub是OpenCSG推出的使用Docker快速部署CSGHub的一种方式，主要用于快速功能体验和测试。Docker部署方式允许用户以较低成本在本地计算机部署CSGHub。此种部署方法非常适合概念验证和测试，使用户能够立即访问CSGHub的核心功能（包括模型，数据集管理、Space应用创建以及模型的推理和微调（需要GPU））。本文将带您一步步完成部署。什
Python--字符串小丁丁_ddxdd 技术层-python
描述Pythonstrip()方法用于移除字符串头尾指定的字符（默认为空格）。语法strip()方法语法：str.strip([chars]);参数chars--移除字符串头尾指定的字符。返回值返回移除字符串头尾指定的字符生成的新字符串。实例以下实例展示了strip()函数的使用方法：#!/usr/bin/pythonstr="0000000thisisstringexample....wow!!
【自然语言处理（NLP）】NLTK的使用（分句、分词、词频提取）道友老李自然语言处理(NLP)自然语言处理人工智能
文章目录介绍NLTK主要功能模块安装使用分句分词去除标点符号去除停用词stopword噪音单词,词频提取个人主页：道友老李欢迎加入社区：道友老李的学习社区介绍自然语言处理（NaturalLanguageProcessing，NLP）是计算机科学领域与人工智能领域中的一个重要方向。它研究的是人类（自然）语言与计算机之间的交互。NLP的目标是让计算机能够理解、解析、生成人类语言，并且能够以有意义的方式
oracle之行转列 limts oracle 数据库
对于Oracle的行转列功能一直云里雾里，马马虎虎，对行转列的使用场景和使用方法都不够深刻，最近有空理解一下。Oracle11g后有专门的函数pivot，对于特定的场景可以直接套用。需求：求各份job不同员工工资是多少？jobsaldeptnoA100010A100020A200020B300020B400030C500020C600030select①*from(select②job,sal,d
语言模型的价值定位与技术突破：从信息处理到创新认知 XianxinMao 语言模型人工智能 chatgpt
标题：语言模型的价值定位与技术突破：从信息处理到创新认知文章信息摘要：当前语言模型的核心价值主要体现在信息综合与处理能力上，用户友好的交互界面是其成功关键。在模型计算机制方面，推理能力的实现包括chain-of-thought和自适应计算两种范式，而内部计算过程研究将成为未来重点。数据质量方面，需要权衡人工标注与合成数据的使用比例，后者展现出显著潜力但仍需完善质量控制机制。基础模型评估应建立在多维
SOME/IP服务接口辣椒卷二王网络协议网络 someip 车载中间件
本系列文章将分享我在学习SOME/IP过程中积累的一些感悟，并结合SOME/IP的理论知识进行讲解。主要内容是对相关知识的梳理，并结合实际代码展示SOME/IP的使用，旨在自我复习并与大家交流。文中引用了一些例图，但由于未能找到原作者信息，若存在侵权问题，请联系删除。什么是Some/IP在前面的博客中我们介绍了SOA，英文翻译过来是面向服务。SOME/IP（Scalableservice-Orie
驾驭MySQL性能优化利器：八大工具助您告别低效SQL 墨瑾轩一起学学数据库【一】mysql 性能优化 sql
已列出工具的使用说明：1.mysqltuner.pl安装与使用：下载最新版本的mysqltuner.pl脚本（通常通过wget或curl命令获取）。为脚本赋予执行权限（chmod+xmysqltuner.pl）。运行脚本，提供MySQL服务器的用户名、密码以及端口号（如有必要）。示例：Code./mysqltuner.pl--user=root--password=your_password--h
Javascript和jquery事件-鼠标移入移出事件 weixin_30740295 javascript ViewUI
javascript使用mouseover和mouseout，只在css中支持hoverjquery支持mouseover和mouseout，封装了mouseenter、mouseleave事件函数和hover函数1、有关js中的mouseover和mouseout原生js的事件类型是mouserout和mouseover，之前提到的事件冒泡的缺陷就在这里，之前说的使用阻止冒泡就行，大概说得太轻易
使用 @EmbeddedId 和 @ManyToOne 实现复合主键的 JPA 实践 t0_54manong 个人开发
在实际的软件开发中，我们常常需要处理复杂的实体关系，尤其是在数据库设计中，复合主键的使用场景非常常见。本文将通过一个具体的例子，展示如何在JavaPersistenceAPI(JPA)中使用@EmbeddedId和@ManyToOne注解来实现复合主键，并通过Hibernate进行数据持久化和查询。一、背景与需求假设我们有一个员工任务管理系统，其中员工（Employee）和任务（Task）是一对多
Git Bash在Windows下的使用与技巧 t0_54coder git bash windows 个人开发
在Windows系统中，Git提供了一个非常实用的工具——GitBash。它通过模拟UNIX风格的命令行环境，为开发者提供了一个强大的工具集，使得在Windows上进行版本控制和开发工作变得更加便捷。今天，我们就来深入了解一下GitBash的使用方法和一些实用技巧。一、GitBash是什么？GitBash是一个基于MinGW64的命令行工具，它为Windows系统提供了一个类似UNIX的环境。Mi
JavaScript 高阶函数 BYh_blog javascript 开发语言 ecmascript
在JavaScript中，高阶函数（Higher-OrderFunction）是一种特殊的函数它至少满足以下两个条件之一接受一个或多个函数作为参数返回一个函数作为结果高阶函数在JavaScript中非常常见，它们使得代码更加灵活和可重用下面是一些常见的使用高阶函数高阶函数重写(Arraymethod)1.forEachArray.prototype.myForEach=function(callb
EF Core 乐观、悲观并发控制 AAA猪饲料批发李师傅 .NET .netcore
目录并发控制的概念悲观并发控制实现问题乐观并发控制实现RowVersion实体类及配置概念总结并发控制的概念并发控制：避免多个用户同时操作资源造成的并发冲突问题。举例：统计点击量。最好的解决方案：非数据库解决方案。数据库层面的两种策略：悲观、乐观。悲观并发控制悲观并发控制一般采用行锁、表锁等排他锁对资源进行锁定，确保同时只有一个使用者操作被锁定的资源。EFCore没有封装悲观并发控制的使用，需要开
【前端js】 indexedDB Nosql的使用方法 Loong_DQX 前端 javascript nosql indexedDB
一、背景Redis的数据存储位置是在服务器内存中，它的目的是是获取数据更快；indexedDB是在客户端的本地存储中，它想要解决的问题是存储更多的数据，相较于localStorage、sessionStorage。这篇文章想讲的是indexedDB，用于将网页中所要用到的数据存储在本地中，使用索引实现对数据的高性能搜索。二、indexedDB数据库2.1indexedDB的特点非关系型数据库：数据
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S