weixin_30608503

Scrapy1.4爬取笑话网站数据，Python3.5+Django2.0构建笑话应用

Part1：需求简要描述

1、抓取http://www.jokeji.cn网站的笑话

2、以瀑布流方式显示

Part2：安装爬虫框架Scrapy1.4

1、安装Scrapy1.4

E:\django\myProject001>pip install scrapy

执行报错：

error: Unable to find vcvarsall.bat

Failed building wheel for Twisted

2、安装wheel

E:\django\myProject001>pip install wheel

3、下载编译好的wheel文件

访问下面链接下载编译好的wheel文件到当前目录下

https://www.lfd.uci.edu/~gohlke/pythonlibs/

4、安装编译好的wheel文件

E:\django\myProject001>pip install Twisted-17.9.0-cp35-cp35m-win_amd64.whl
E:\django\myProject001>pip install Scrapy-1.4.0-py2.py3-none-any.whl

5、查看Scrapy是否安装成功

E:\django\myProject001>scrapy version

Scrapy 1.4.0

6、安装Py32Win模块

E:\django\myProject001>pip install pypiwin32

访问windows系统API的库

7、安装OpenPyXL

E:\django\myProject001>pip install openpyxl

用于将爬取数据写入Excel文件

Part3：创建项目及应用

1、创建项目及应用

E:\django>django-admin startproject myProject001

E:\django>cd myProject001

E:\django\myProject001>python3 manage.py startapp joke

2、修改settings.py

文件路径：myProject001\myProject001\settings.py

# 增加应用

INSTALLED_APPS = [
'django.contrib.admin',
'django.contrib.auth',
'django.contrib.contenttypes',
'django.contrib.sessions',
'django.contrib.messages',
'django.contrib.staticfiles',
'joke',
]

# 修改amind管理后台语言

LANGUAGE_CODE = 'zh-hans'
TIME_ZONE = 'Asia/Shanghai'

3、修改modles.py

文件路径：myProject001\joke\models.py

from django.db import models

class Jokes(models.Model):
    jokeText = models.TextField(u'笑话内容')
    createDate = models.DateField(u'创建日期', auto_now_add=True)
    modifyDate = models.DateField(u'修改日期', auto_now=True)

4、创建数据迁移文件并执行

E:\django\myProject001>python3 manage.py makemigrations
E:\django\myProject001>python3 manage.py migrate

使用SQLite查看数据库，表创建成功

5、修改views.py

文件路径：myProject001\joke\views.py

from django.shortcuts import render
from django.http import HttpResponse

def index(request):
    return HttpResponse('这里是笑话应用的首页')

6、在joke应用下创建urls.py

文件路径：myProject001\joke\urls.py

from django.urls import path
from . import views

urlpatterns = [
    path('', views.index, name='index'),
]

7、修改项目应用下的urls.py

文件路径：myProject001\myProject001\urls.py

from django.contrib import admin
from django.urls import path,include

urlpatterns = [
    path('admin/', admin.site.urls),
    path('joke/', include('joke.urls')),
]

8、创建应用首页模板文件index.html

模板文件路径：

myProject001\joke\templates\joke\index.html

模板文件内容：

<html>
    <head>
        <title>笑话应用的首页title>
    head>
    <body>
        
    body>
html>

9、启动应用

E:\django\myProject001>python3 manage.py runserver

访问如下地址，应用创建成功

http://127.0.0.1:8000/joke/

Part4：了解XPath一些基本知识

1、节点和属性

DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
        <title>开心一刻title>
        <link rel="icon" href="/favicon.ico" type="image/x-icon" />
        <link href="css/list.css" rel="stylesheet" type="text/css" />
    head>
    <body>
        <div class="style_top">
            <div class="list_title">
                <ul>
                    <li>
                        <a href="/jokehtml/bxnn/2017122722221351.htm"target="_blank" >醉人的笑容你会有a>
                    li>
                    <li>
                        <a href="/jokehtml/fq/201712272221462.htm"target="_blank" >搞笑夫妻乐事儿多a>
                    li>
                    <li>
                        <a href="/jokehtml/mj/2017122722205011.htm"target="_blank" >幽默密切联系生活a>
                    <i>
                ul>
            div>
        div>
    body>
html>

节点/元素：html、head、body、div、li 等

节点/元素文本内容：开心一刻、醉人的笑容你会有

属性：class、href 等

属性值：style_top、/jokehtml/bxnn/2017122722221351.htm 等

2、XPath使用路径表达式选取节点


表达式	描述	实例
节点名称	选取此节点的所有子节点	body
/	从根节点选取	/html
//	选择文档中的节点，而不考虑位置	//li
.	选取当前节点	.//title
..	选取当前节点的父节点
@	选取属性	//@href
谓语	找某个特定的节点或者包含某个指定的值的节点	//title[@lang='eng']
*	任意元素	//*
@*	任意属性	//title[@*]
node()	任意类型
\|	或运算符	//title \| //price
:	命名空间	my:*
text()	文本内容	/html/head/title/text()
response.xpath()	返回选择器列表，使用xpath语法选择的节点	response.xpath('//base/@href').extract()
response.css()	返回选择器列表，使用css语法选择的节点	response.css('base::attr(href)').extract()
response.extract()	返回被选择元素的unicode字符串
response.re()	返回通过正则表达式提取的unicode字符串列表

Part5：分析网页源代码确定抓取数据的逻辑

1、笑话内容页面源码分析

笑话内容所在的html代码

<span id="text110">
    <P>1、为了省腮红钱，我每天出门给自己两个耳光。P>
    <P>2、不要把今天的工作拖到明天，明天还不是要做？还不如干脆点，今天就把工作辞了。 P>
    <P>3、朋友，你听我一句劝，钱没了可以再挣，所以我找你借的那笔钱就不还了吧。P>
    <P>4、正能量的东西也不能多看，就好比自己挺穷的，哪能天天看有钱人的生活？肯定越看越伤心。还不如多看点更丧的东西，显得自己元气尚存。P>
    <P>5、根据一个人的车，我们就能看出这个人是什么样的。比如：如果它在沟里，它就是女人的车。P>
    <P>6、以前小时候女鬼总喜欢在梦里吓我，现在长大了，懂事了，单身久了，女鬼都不敢出现了！P>
    <P>7、我喜欢了一个女生，为了弄清楚她是什么样的人，所以我关注她小号。然后被她发现，扇了我一巴掌，把我从厕所赶出来了。P>
    <P>8、老是看到有人说趴在兰博基尼方向盘上哭，然后大家都很羡慕的样子，所以我想问一下，哪里有兰博基尼方向盘出售？P>
    <P>9、这个世界上漂亮女孩已经那么多，为啥不能多一个我？P>
    <P>10、我都19了，还没来月经，身边的女孩纸胸都老高了，我还是平胸，怎么办啊！可怕的是腿上胳膊上汗毛老长了，更更可怕的是裤裆里，长出来个可怕的东西，有时候软软的，有时候硬硬的，好可怕啊，我该怎么办？P>
span>

翻页所在的html代码

<div class=zw_page1>
下一篇：<a href="../../JokeHtml/bxnn/2017122722221351.htm">爆逗二货,醉人的笑容你会有a>
div>
<div class=zw_page2>
上一篇：<a href="../../JokeHtml/bxnn/2017122900222852.htm">搞笑很出色的是二货a>
div>

2、定义提取逻辑

先依据初始链接提取笑话内容

分支1：

提取下一篇链接，依据下一篇链接提取笑话内容

如此循环，直至没有下一篇链接

分支2：

提取上一篇链接，依据上一篇链接提取笑话内容

如此循环，直至没有上一篇链接

Part6：创建Scrapy项目抓取数据

1、创建Scrapy项目

E:\scrapy>scrapy startproject myScrapy1815

执行上面的命令生成项目myScrapy1815

再在目录myScrapy1815\myScrapy1815\spiders\下创建文件myJoke_spider.py

项目的完整目录结构如下

2、定义Item

Item是保存爬取到的数据的容器，可以理解为编程中的对象。一个Item即一个对象保存的是一条记录。

打开文件myScrapy1815\myScrapy1815\items.py

# -*- coding: utf-8 -*-

# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html

import scrapy


class Myscrapy1815Item(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    pass

class JokeItem(scrapy.Item):
    # 正文内容
    joke_content = scrapy.Field()

3、编写Spider

打开文件myScrapy1815\myScrapy1815\spiders\myJoke_spider.py

添加如下内容

import scrapy
from scrapy.http.request import Request
from myScrapy1815.items import JokeItem

class JokeSpider(scrapy.Spider):
    name = "joke"
    allowed_domains = ["jokeji.cn"]
    start_urls = [
        "http://www.jokeji.cn/JokeHtml/bxnn/2017122900211092.htm"
    ]

    def parse(self, response):
        # 获取笑话内容
        jokes = response.xpath('//span[@id="text110"]/p').extract()
        for joke in jokes:
            item = JokeItem()
            item['joke_content'] = joke
            yield item

        # 获取下一篇链接
        nexthref = response.xpath('//div[@class="zw_page1"]/a/@href').extract_first()
        if nexthref is not None:
            # 将相对url转为绝对url
            nexthref = response.urljoin(nexthref)
            # 继续获取下一篇笑话
            yield Request(nexthref, callback=self.parseNexthref)

        # 获取上一篇链接
        prevhref = response.xpath('//div[@class="zw_page2"]/a/@href').extract_first()
        if prevhref is not None:
            # 将相对url转为绝对url
            prevhref = response.urljoin(prevhref)
            # 继续获取下一篇笑话
            yield Request(prevhref, callback=self.parsePrevhref)

    def parseNexthref(self, response):
        # 获取笑话内容
        jokes = response.xpath('//span[@id="text110"]/p').extract()
        print(jokes)
        for joke in jokes:
            item = JokeItem()
            item['joke_content'] = joke
            yield item

        # 获取下一篇链接
        nexthref = response.xpath('//div[@class="zw_page1"]/a/@href').extract_first()
        if nexthref is not None:
            # 将相对url转为绝对url
            nexthref = response.urljoin(nexthref)
            # 继续获取下一篇笑话，测试时可以将下一行代码注释掉
            #yield Request(nexthref, callback=self.parseNexthref)

    def parsePrevhref(self, response):
        # 获取笑话内容
        jokes = response.xpath('//span[@id="text110"]/p').extract()
        for joke in jokes:
            item = JokeItem()
            item['joke_content'] = joke
            yield item

        # 获取上一篇链接
        prevhref = response.xpath('//div[@class="zw_page2"]/a/@href').extract_first()
        if prevhref is not None:
            # 将相对url转为绝对url
            prevhref = response.urljoin(prevhref)
            # 继续获取上一篇笑话，测试时可以将下一行代码注释掉
            #yield Request(prevhref, callback=self.parsePrevhref)

4、编写Item Pipeline

当Item在Spider中被收集之后，它将会被传递到Item Pipeline

打开文件myScrapy1815\myScrapy1815\pipelines.py

# -*- coding: utf-8 -*-

# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html

import sqlite3
import json
import re
from openpyxl import Workbook

class Myscrapy1815Pipeline(object):

    def __init__(self):
        # 文件文件
        self.file = open('myItems.json', 'w', encoding='utf-8')
        # Excel文件
        self.wb = Workbook()
        self.ws = self.wb.active
        self.ws.title = "笑话集" #定义sheet名称
        self.ws.append(['joke_content']) #定义表头
        # 数据库连接
        self.conn = sqlite3.connect("E:\\django\\myProject001\\db.sqlite3")

    # 当spider被开启时方法被调用
    def open_spider(self, spider):
        pass

    # 每个item pipeline组件都需要调用该方法
    def process_item(self, item, spider):
        # 写入文本文件
        line = json.dumps(dict(item), ensure_ascii=False) + "\n"
        self.file.write(line)
        # 写入Excel文件
        self.ws.append([item['joke_content']])
        self.wb.save('myItems.xlsx')
        # 写入数据库
        record = item['joke_content']
        record = record.replace('
','\r\n')
        pattern = re.compile(r'<[^>]+>', re.S)  
        record = pattern.sub('', record)
        sql="insert into joke_jokes(jokeText,createDate,modifyDate) values('"+record+"',datetime('now','localtime'),datetime('now','localtime'))"
        self.conn.execute(sql)
        self.conn.commit()
        return item

    # 当spider被关闭时方法被调用
    def close_spider(self, spider):
        self.file.close()
        self.conn.close()
        pass

5、激活Item Pipeline

打开文件myScrapy1815\myScrapy1815\settings.py

删掉如下三行代码之前的注释符#

ITEM_PIPELINES = {
    'myScrapy1815.pipelines.Myscrapy1815Pipeline': 300,
}

6、启动Spider

E:\scrapy\myScrapy1815>scrapy crawl joke

抓取的数据，文本文件格式如下

抓取的数据，Excel文件格式如下

抓取的数据，保存在SQLite数据库中如下

Part7：以瀑布流方式显示笑话内容

1、修改settings.py

文件位置：myProject001\myProject001\settings.py

ALLOWED_HOSTS = ['10.61.226.236','127.0.0.1','localhost']

允许通过以上3个地址访问

2、修改应用的urls.py

文件位置：myProject001\joke\urls.py

from django.urls import path
from . import views

urlpatterns = [
    path('', views.index, name='index'),
    path('index_ajax/', views.index_ajax),
]

3、修改views.py

文件位置：myProject001\joke\views.py

from json import dumps
from django.core import serializers
from django.shortcuts import render
from django.http import HttpResponse,JsonResponse
from . import models

# 页面首次加载的记录数
FIRST_PAGE_SIZE = 50
# Ajax每次加载的记录数
PAGE_SIZE = 20

def index(request):
    # 首次加载
    jokes = models.Jokes.objects.all()[0:FIRST_PAGE_SIZE]
    return render(request, 'joke/index.html', {'jokes':jokes})

def index_ajax(request):
    # 当前页码
    pageIndex = int(request.POST.get('pageIndex','1'))
    # 总记录数
    totalCount = models.Jokes.objects.filter().count()

    # 定义提取记录的范围（数组上标、数组下标）
    lBound = FIRST_PAGE_SIZE + (pageIndex-1) * PAGE_SIZE
    uBound = FIRST_PAGE_SIZE + pageIndex * PAGE_SIZE

    # 是否有下一页（上标小于总记录数时有下一页）
    hasNextPage = 1 if uBound <= totalCount else 0

    # 如果上标大于或等于总记录数，则上标使用总记录数
    if uBound >= totalCount:
        uBound = totalCount

    # 按范围提取记录
    jokes = models.Jokes.objects.all()[lBound:uBound]

    # 序列化JSON
    json_data = {}
    json_data['hasNextPage'] = hasNextPage
    json_data['jokes'] = serializers.serialize('json', jokes)

    # 返回JSON格式的数据
    return HttpResponse(JsonResponse(json_data), content_type="application/json")

4、修改模板文件index.html

文件位置：myProject001\joke\templates\joke\index.html

DOCTYPE html>
<html lang="zh-CN">
    <head>
        <meta charset="utf-8">
        <meta http-equiv="X-UA-Compatible" content="IE=edge">
        <meta name="viewport" content="width=device-width, initial-scale=1">
        
        <title>段子title>
        {% load static %}
        <link rel="stylesheet" type="text/css" href="{% static 'joke/css/bootstrap.min_v3.3.7.css' %}" />
        <link rel="stylesheet" type="text/css" href="{% static 'joke/css/style.css' %}" />
        
        
        
    head>
    <body>
    <div class="container">
        <div id="masonry" class="row masonry">
            {% for joke in jokes %}
            <div class="col-md-4 col-sm-6 col-xs-12 item ">
                <div class="well well-sm" style="line-height:180%;">
                    <span class="label label-success">{{ joke.pk }}span>  {{ joke.jokeText }}
                div>
            div>
            {% endfor %}
        div>
    div>
    <script src="{% static 'joke/js/jquery.min_v1.12.4.js' %}">script>
    <script src="{% static 'joke/js/bootstrap.min_v3.3.7.js' %}">script>
    <script src="{% static 'joke/js/masonry.pkgd.min_v4.2.0.js' %}">script>
    <script src="{% static 'joke/js/imagesloaded.pkgd.min_v4.1.3.js' %}">script>
    
    <script>
        $("#loadingModal").modal('show');
        $('.masonry').masonry({
            //itemSelector: '.item'
        });
    script>
    
    <script>
        // 默认加载第2页
        var pageIndex = 1;
        // 是否正在加载标记
        var isLoading = 0;
        // 是否已提示没有更多内容
        var isNotice = 0;
        // 是否还有更多
        var hasNextPage = 1;
        // 页面滚动到底部，触发加装
        $(window).scroll(function(){
            var scrollTop = $(this).scrollTop();
            var scrollHeight = $(document).height();
            var windowHeight = $(this).height();
            if(scrollTop + windowHeight == scrollHeight){
                if(hasNextPage == 0 & isNotice == 0){
                    // 没有下一页内容时提示
                    isNotice = 1;
                    $('#masonry').append('提示：没有更多内容了...');
                    $('#masonry').masonry('reloadItems');
                    $('#masonry').masonry('layout');
                }else if(hasNextPage == 1 & isLoading == 0){
                    // 避免Ajax执行过程中反复被调用
                    isLoading = 1;
                    $('#masonry').append('提示：正在加载更多内容...');
                    $('#masonry').masonry('reloadItems');
                    $('#masonry').masonry('layout');
                    setTimeout("loadJoke(pageIndex);", 1000);
                }
            }
        });
        // Ajax方法
        function loadJoke(arg){
            //var host = 'localhost';
            //var port = '8000';
            var labelCss = 'label label-info';
            if(pageIndex%2 == 1){
                labelCss = 'label label-info';
            }
            else{
                labelCss = 'label label-success';
            }
            $.ajax({
                url: "./index_ajax/",
                type: "POST",
                dataType: 'json',
                data: {pageIndex: arg},
                success: function (data) {
                    $("#noticeInfomation").remove();
                    hasNextPage = data['hasNextPage'];
                    jokes = JSON.parse(data['jokes']);
                    for (var obj in jokes){
                        $('#masonry').append(''+''+labelCss+'">'+jokes[obj].pk+'  '+jokes[obj].fields.jokeText+'');
                        $('#masonry').masonry('reloadItems');
                        $('#masonry').masonry('layout');
                    }
                    pageIndex = pageIndex + 1;
                    isLoading = 0;
                }
            });
        };
        //Django的CSRF保护机制（ajax）
        $.ajaxSetup({
            data: {csrfmiddlewaretoken: '{{ csrf_token }}' },
        });
    script>
    body>
html>

5、启动应用

访问应用：http://10.61.226.236/joke/

页面效果如下

6、补充说明

UI使用了bootstrap、jquery、masonry、ajax无限加载

=====结束=====

转载于:https://www.cnblogs.com/sam11/p/8134698.html

你可能感兴趣的:(Scrapy1.4爬取笑话网站数据，Python3.5+Django2.0构建笑话应用)

关于tomcat gloria123_ tomcat java
**web应用服务器安装在服务端的服务产品，在web服务器上放置一些允许客户端直接访问的资源，启动服务，客户端通过ip+端口号即可以访问web应用服务器上的资源下载tomcat压缩包并解压后：tomcat:bin目录:存放启动和停止服务等的脚本mac电脑通过命令sudoshstartup.sh来启动，windows系统通过bat可以手动启动conf目录：存放tomcat服务器配置文件web.xml
并发编程（三）——线程间的共享和协作霸图& java并发编程并发编程
并发编程（三）——线程间的共享和协作一线程间的共享线程开始运行，拥有自己的栈空间，就如同一个脚本一样，按照既定的代码一步一步地执行，直到终止。但是，每个运行中的线程，如果仅仅是孤立地运行，那么没有一点儿价值，或者说价值很少，如果多个线程能够相互配合完成工作，包括数据之间的共享，协同处理事情。这将会带来巨大的价值。1.1synchronized内置锁synchronized关键字：synchroni
推荐一款革命性的游戏对话管理工具：Godot 4 Dialogue Manager 袁菲李
推荐一款革命性的游戏对话管理工具：Godot4DialogueManager项目地址:https://gitcode.com/gh_mirrors/go/godot_dialogue_manager项目介绍在游戏开发领域中，对白设计是构建沉浸式剧情和角色深度的关键。Godot4DialogueManager，一个专为Godot引擎打造的开源插件，提供了直观且强大的分支对话编辑器和运行时解决方案。这
Godot 对话管理器教程陆汝萱
Godot对话管理器教程godot_dialogue_managerApowerfulnonlineardialoguesystemforGodot项目地址:https://gitcode.com/gh_mirrors/go/godot_dialogue_manager1.项目介绍Godot对话管理器是一个专为Godot游戏引擎设计的插件，它提供了编辑器和运行时支持，帮助你构建分支型对话系统。这个
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language UnknownBody LLM Daily Multimodal 语言模型人工智能自然语言处理
摘要深度学习的最新进展给地震监测带来了革命性变化，但开发一个能在多个复杂任务中表现出色的基础模型仍然充满挑战，尤其是在处理信号退化或数据稀缺的情况时。本文提出SeisMoLLM，这是首个利用跨模态迁移进行地震监测的基础模型，它无需在地震数据集上进行直接预训练，就能充分发挥大规模预训练大语言模型的强大能力。通过精心设计的波形标记化处理和对预训练GPT-2模型的微调，SeisMoLLM在DiTing和
【批量图片区域识别改名】有没有可以自动批量识别jpg图片上的区域文字，并直接提取文字命名的软件么? 没有我们教你基于WPF和腾讯api的方案做一个如沐春风菜鸡收割机图片OCR识别扫描PDF提取内容 PDF明细提取表格工具实现PDF明细转Excel PDF数据导出Excel 批量PDF内容提取工具批量图片识别区域内容改名批量图片识别多个区域内容导表格
应用场景描述在很多实际工作场景中，我们可能会遇到大量的图片文件，这些图片中包含特定区域的文字信息，比如发票图片上的发票号码、合同图片上的合同编号等。手动识别并为图片命名效率极低且容易出错。使用自动批量识别JPG图片上的区域文字，并直接提取文字为图片命名的软件，可以大大提高工作效率，减少人工操作带来的错误。实现方案：基于WPF和腾讯云OCRAPI步骤1：准备工作注册腾讯云账号：访问腾讯云官网（腾讯云
【春招笔试真题】饿了么2025.03.07-开发岗真题春秋招笔试突围最新互联网春秋招试题合集 java 算法网络
饿了么2025.03.07-开发岗题目1️⃣：统计01串中0和1的个数，通过计算可能的交换方式确定不同字符串数量2️⃣：使用模板匹配技术识别验证码图片中的"#"符号分布模式3️⃣：构建字典树（Trie）优化异或查询，实现高效的数字黑板游戏整体难度这套题目整体难度适中，由简到难逐步递进：第一题是基础的计数问题，需要理解交换操作的特性第二题是模式识别问题，需要实现模板匹配第三题是高级数据结构应用，需要
Spring Boot 与 Spring MVC 有何不同大G哥 spring spring boot mvc 后端 java
SpringBoot和SpringMVC都是Spring框架的一部分，但它们有不同的目标和功能。以下是它们之间的主要区别：1.核心目标SpringBoot：SpringBoot的目标是简化Spring应用的配置和部署。它通过提供默认配置和嵌入式服务器(如Tomcat、Jetty或Undertow)，使开发者能够快速构建和启动Spring应用，而无需配置繁琐的XML或类配置。SpringMVC：Sp
mysql 数据库部署 IT 古月方源网络安全运维网络数据库
以下是基于CentOS7系统部署MySQL数据库的详细步骤及常见问题解决方案：一、卸载旧版本MySQL/MariaDB停止服务并检查残留systemctlstopmariadb#停止MariaDB服务rpm-qa|grepmariadb#检查MariaDB安装包rpm-e--nodepsmariadb-libs-*#强制卸载MariaDB及其依赖包rm-rf/etc/my.cnf/var/lib/
C# &Unity 唐老狮 No.8 模拟面试题咩咩-哈基米版 C#&&Unity 面试题与算法合集 c#unity 开发语言
本文章不作任何商业用途仅作学习与交流安利唐老狮与其他老师合作的网站,内有大量免费资源和优质付费资源,我入门就是看唐老师的课程打好坚实的基础非常非常重要:全部-游习堂-唐老狮创立的游戏开发在线学习平台-PoweredByEduSoho如果你发现了文章内特殊的字体格式,那是AI补充的知识,我发现原网站下面有答案,我将会把答案以不同样式穿插在回答之中目录C#1.如果我们想为Unity中的Transfor
Linux 提权藤原千花的败北权限提升网络安全 linux 运维网络安全
文章目录前言1.内核漏洞提权脏牛（CVE-2016-5195）2.不安全的系统配置项2.1SUID/SGID提权2.2sudo提权2.3定时任务提权2.4capabilities提权3.第三方软件提权TomcatmanagerNginx本地提权（CVE-2016-1247）Redis未授权4.参考前言Linux提权总结1.内核漏洞提权内核管理着组件（如系统上的内存）和应用程序之间的通信。这个关键作
【推荐项目】 043-停车管理系统蜗牛 | ICU 推荐项目 spring boot vue.js java 前端框架
043-停车管理系统介绍使用springbootvuejsmysql技术搭建框架。智能停车管理系统描述后端框架：采用SpringBoot与MySQL的强强联合，为系统提供稳健、高效的服务支撑。前端框架：前端选用Vue.js，打造流畅、美观的用户交互界面。管理员功能：用户信息管理：轻松管理用户信息，包括新增、编辑、删除及查询用户。界面清晰，操作便捷，确保用户数据的安全与准确。车位信息管理：实时查看车
autoreconf --install的作用 812503533 git
autoreconf--install是在使用GNUAutotools构建系统的项目中常用的一条命令，下面为你详细解释其含义以及使用--install选项的原因。autoreconf命令概述autoreconf是一个用于自动重新生成Autotools项目所需配置脚本的工具。Autotools是一组用于创建可移植构建系统的工具集合，主要包括autoconf、automake和libtool。在开发或
redis持久化 xing.xing redis
目录redis持久化RDB（RedisDatabase）持久化AOF（AppendOnlyFile）持久化redis持久化在Redis中，持久化是确保数据在Redis服务器重启后不丢失的关键功能。Redis提供了两种主要的数据持久化方式：RDB（RedisDatabase）持久化和AOF（AppendOnlyFile）持久化。Redis的默认持久化方式是RDB（快照）。在Redis启动时，它会定期
Spring MVC 拦截器跪在镜子前喊帅 java java
前言SpringMVC提供了一个拦截器的机制，它专门用于拦截controller层的路由请求。它的本质是：AOP面向切面的编程，也就是说符合横切关注点的功能都可以考虑使用拦截器实现。比如一些应用场景：权限检查例如：用户登录检查，访问项目的内部接口时，可以通过拦截器检测用户是否登录，如果登录，直接放回用户登录页面。日志记录更新推荐用原生的AOP机制会更好一点，粒度会更细，控制起来也更方便，如果你是针
QT显示网页控件QAxWidget、QWebEngineView及区别 AI+程序员在路上 QT&C++实战系列 qt 开发语言
一.QT种显示网页控件QAxWidget1.介绍QAxWidget属于QtAxContainer模块，ActiveX是微软提出的一种组件对象模型（COM）技术，允许不同的软件组件在Windows操作系统上进行交互和集成。QAxWidget为开发者提供了在Qt应用程序中使用ActiveX控件的能力，通过它可以将各种ActiveX控件嵌入到应用程序界面中。2.使用引入必要的模块在.pro文件中添加QT
Docker高级应用-限制容器的cpu和内存云原生的爱好者 docker 容器运维
一、为什么要用docker限制容器的cpu和内存1.资源隔离与公平分配防止资源争用：在多容器环境中，限制CPU和内存可以避免某个容器占用过多资源，影响其他容器的运行。确保公平性：通过限制资源，确保每个容器都能获得所需的计算能力，避免资源被少数容器独占。2.提高系统稳定性防止内存泄漏：限制内存可以避免容器因内存泄漏耗尽主机内存，导致系统崩溃。避免CPU过载：限制CPU使用可以防止容器过度占用CPU，
Llama3.1是AI界的Linux？先部署起来再说！ AI大模型探索者人工智能 linux 运维语言模型 ai LLama llama
前言就在昨天，Meta发布了Llama3.1，这次带来的中杯、大杯和超大杯3个版本。从纸面数据来看，Llama3.1超大杯已经能跟GPT-4Omni、Claude3.5Sonnet分庭抗礼了。而中杯和大杯更是将同量级的对手摁在地上摩擦。要知道，Llama的对手可是闭源模型啊工友们！小扎同志说，开源AI会成为行业的标准，就像Linux一样！不管怎么说，既然你开源了，那我就在本地部署起来吧。本文使用O
新导则下的防洪评价报告编制方法及洪水建模实践技术吹翻书页的风水文水利地质地下水环境科学 arcgis 防洪评价报告编制 HEC-RAS软件二维水动力模型计算
目录1、《防洪评价报告编制导则解读河道管理范围内建设项目编制导则》（SL/T808-2021）解读2、防洪评价相关制度与解析3、防洪评价地形获取及常用计算4、HEC-RAS软件原理及特点5、HEC-RAS地形导入6、一维数学模型计算7、基于数学模型软件的一维构筑物的水动力模型计算及本章内容在报告中编写方法8、数值模型软件概述及数据基础处理9、基于数学模型软件的二维水动力模型计算析及结果输出及评价章
四种主要的 API 架构风格：RPC、SOAP、REST、GRAPHQL 小马不敲代码系统设计架构 rpc graphql
讨论四种主要的API架构风格，比较它们的优缺点，并重点介绍每种情况下最适合的API架构风格。RPCSOAPRESTGRAPHQL两个单独的应用程序需要中介程序才能相互通信，因此，开发人员经常需要搭建桥梁——也就是应用程序编程接口（API），来允许一个系统访问另一个系统的信息或功能。为了快速、大规模地集成不同的应用程序，API使用协议或规范来定义那些通过网络传输的消息的语义和信息。这些规范构成了AP
R+VIC 模型融合实践技术应用及未来气候变化模型预测 weixin_贾水文模型集合水文水资源防洪评价风险评估滑坡泥石流数学建模经验分享
目前，无论是工程实践或是科学研究中都存在很多著名的水文模型如SWAT/HSPF/HEC-HMS等。虽然，这些软件有各自的优点；但是，由于适用的尺度主要的是中小流域，所以在预测气候变化对水文过程影响等方面都有所不足。VIC模型是一个大尺度的半分布式水文模型，其设计之初就是为了模拟大流域的水文过程；它能够计算陆地－大气的能量通量，考虑土壤性质和土地利用的影响，自带有简化的湖泊/湿地模块，也能够将植被状
06 - gldas水文模型数据处理 - 下载、matlab读取咋（za）说论文笔记笔记经验分享
gldas水文模型数据处理-下载、matlab读取0.引言1.GLDAS水文数据介绍2.GLDAS数据下载3.GLDAS数据读取的matlab程序0.引言根据水量平衡方程，陆地水储量变化(Δtws\DeltatwsΔtws
PySide2是 Qt 库的 Python 绑定之一 WwwwwH_PLUS #Qt qt python 开发语言
PySide2是Qt库的Python绑定之一，它为Python程序员提供了创建跨平台桌面应用程序的工具和功能。PySide2是Qt5.x系列的Python绑定，而Qt本身是一个跨平台的图形用户界面（GUI）框架，广泛用于开发各种类型的桌面应用程序，包括多种平台（Windows、Linux、macOS）的应用。主要特点跨平台支持：PySide2可以在Windows、Linux和macOS上运行，允许
使用LangChain访问个人数据第一章-简介明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序正文在大数据时代，数据价值逐渐凸显，打造定制化、个性化服务，个人数据尤为重要。要开发一个具备较强服务能力、能够充分展现个性化智能的应用程序，大模型与个人数据的对齐是一个重要步骤。作为针对大模型开发应运而生的框
使用LangChain访问个人数据第八章-总结明志刘明大模型学习手册 langchain 人工智能
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序本部分前几个章节请查看使用LangChain访问个人数据第一章-简介使用LangChain访问个人数据第二章-文档加载使用LangChain访问个人数据第三章-文档分割使用LangChain访问个人数据第四章
基于 LangChain 开发应用程序第一章-简介明志刘明大模型学习手册 langchain 人工智能
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分章节目录如下：基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出基于LangChain开发应用程序第三章-储存基于LangChain开发应用程序第四章-模型链基于LangChain开发应用程序第五章-基于文档的问答基于LangCh
matlab spmd,matlab并行计算命令其实我是老莫 matlab spmd
1.matlab仿真模型怎么并行计算以单台双核计算机为例。首先打开MATLAB命令窗口，输入matlabpoolopen就OK了。这样，就相当于将一台计算机的两个核心，当做两台机器用啦。接下来是编程序实现的方法。MATLAB并行计算的模式有几种？主要是两种：parfor模式和spmd模式。两种模式的应用都很简单。第一个中，parfor其实就是parallel+for简化而来，顾名思义啊，就是把原来
docker运行容器命令 redis 指定端口 big maom~~ docker redis eureka 容器运维
我整理的一些关于【Docker】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://edu.51cto.com/surl=QsXoR2使用Docker运行Redis容器并指定端口的详细指南本文旨在帮助初学者理解如何使用Docker来运行Redis容器，并指定端口。Docker是一个开源平台，允许开发者将应用和其依赖打包成一个标准的单元——容器。通过使用Docker，开发者可以确保
云存储技术的神器--rclone llody_55 经验分享 linux python centos 运维 mysql ossinsight
原文地址：云存储技术的神器--rclone云存储技术的神器--rclone今天我们要推荐一款运维必备工具--rclone。官网地址：Rclone中文网：rclone中文站-专为国人汉化，解决数据同步/数据备份/数据迁移需求Rclone是什么？Rclone，即"rsyncforcloudstorage"，是一款专业的用于管理和同步云储存数据的开源命令行工具。通过该工具，用户不仅可以在各类型云盘之间拷
Vue数据响应式原理 tuoluoo vue学习笔记 vue.js 前端 javascript
前言Vue是一个结构的框架,也就是数据层、视图层、数据-视图层；响应式的原理就是实现当数据更新时，视图层也要相应的更新响应式实现基于发布订阅模式和数据劫持实现1.发布订阅模式：vue使用发布订阅模式来实现数据变动的通知和更新2.数据劫持：vue通过object.defineProperty对数据进行劫持Vue2响应式原理基于js的object.defineProperty()方法，该方法可将传入的
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache