布衣空空

Django+Scrapy完成微博首页热点的提取和网页显示

1. 本系统编写的思路

2. 系统的目录结构

3. 项目建立和编程代码过程展示

4. 效果展示

5. 碰到的问题及解决思路（重要）

6. 总结

1. 本系统编写的思路

系统是采用的Django+Scrapy+Mysql三层架构进行开发的，主要思路是我们通过scrapy框架进行微博热点的爬取，经过一系列的处理最终成为我们想要的item，然后存入mysql数据库，最后Django从数据库中读取数据在网页上输出。其中我们在django和scrapy两个框架之间使用了scrapy-djangoitem工具包，将从scrapy得到的item与django的model建立关联，通过django强大的orm管理，直接将item存入数据库，减少了在scrapy编写sql的过程，提高了效率。除此之外，本系统开发十分简单，特别适合刚入门的童鞋学习。

2. 系统的目录结构

目录的结构影响到django和scrapy框架间是否能够通过scrapy-djangoitem进行连接，由于我之前在这之间碰到了很大的弯路，所以我这里选择了一种比较简答的项目创建方式，可以在之后的环境变量中省却很大的功夫（我还没从坑中完全爬起），更好的连接django和scrapy。

│ manage.py
│ tree.txt
│
├─.idea
│ │ DjangoRelateScrapy.iml
│ │ misc.xml
│ │ modules.xml
│ │ workspace.xml
│ │
│ ├─inspectionProfiles
│ └─libraries
│ R_User_Library.xml
│
├─DjangoRelateScrapy
│ │ settings.py
│ │ urls.py
│ │ wsgi.py
│ │ __init__.py
│ │
│ └─__pycache__
│ settings.cpython-37.pyc
│ urls.cpython-37.pyc
│ wsgi.cpython-37.pyc
│ __init__.cpython-37.pyc
│
├─microblog
│ │ admin.py
│ │ apps.py
│ │ models.py
│ │ tests.py
│ │ urls.py
│ │ views.py
│ │ __init__.py
│ │
│ ├─migrations
│ │ │ 0001_initial.py
│ │ │ 0002_auto_20190502_2117.py
│ │ │ __init__.py
│ │ │
│ │ └─__pycache__
│ │ 0001_initial.cpython-37.pyc
│ │ 0002_auto_20190502_2117.cpython-37.pyc
│ │ __init__.cpython-37.pyc
│ │
│ └─__pycache__
│ admin.cpython-37.pyc
│ models.cpython-37.pyc
│ urls.cpython-37.pyc
│ views.cpython-37.pyc
│ __init__.cpython-37.pyc
│
├─static
│ ├─css
│ │ a.css
│ │
│ ├─img
│ │ approve.png
│ │ comment.png
│ │ jiji.png
│ │ repost.png
│ │ weibo.png
│ │
│ └─js
├─templates
│ test.html
│ weibo.html
│
└─weibo
│ scrapy.cfg
│
└─weibo
│ items.py
│ main.py
│ middlewares.py
│ pipelines.py
│ settings.py
│ __init__.py
│
├─spiders
│ │ WBlog.py
│ │ __init__.py
│ │
│ └─__pycache__
│ WBlog.cpython-37.pyc
│ __init__.cpython-37.pyc
│
└─__pycache__
items.cpython-37.pyc
main.cpython-37.pyc
pipelines.cpython-37.pyc
settings.cpython-37.pyc
__init__.cpython-37.pyc
或者：

3. 项目建立和编程代码过程展示

1. 首先我们新建一个Django项目

django-admin startproject DjangoRelateScrapy

2. 打开新建的django项目，然后新建一个app

cd DjangoRelateScrapy
python manage.py startapp microblog

3. 在django的根目录下，即DjangoRelateScrapy项目目录下，创建scrapy项目

scrapy startproject weibo

4. 进入创建的scrapy项目，生成spider类

cd weibo
scrapy genspider WBlog "weibo.com"

5. 以上我们基本的项目的结构就创建完毕，接下来让我们从scrapy项目开始，一步步编写代码和配置文件，编写核心的爬虫文件WBlog.py:

import json
import re

import scrapy
from scrapy.spiders import CrawlSpider

from weibo.items import WeiboItem


class WblogSpider(CrawlSpider):
    name = 'WBlog'
    aallowed_domains = ['weibo.com']
    offset = 0
    base_url = "https://weibo.com/a/aj/transform/loadingmoreunlogin?ajwvr=6&category=1760&page={0}&lefnav=0&cursor=&__rnd=1556799484815"
    start_urls = [base_url.format(offset)]

    def parse(self, response):
        data = json.loads(response.text)
        if data and 'data' in data:
            pattern = re.compile(
                '(.*?).*?subinfo S_txt2">(.*?).*?'
                + 'S_txt2">(.*?).*?praised S_ficon W_f16">ñ(.*?).*?ficon_'
                + 'repeat S_ficon W_f16">.*?(.*?).*?forward S_ficon W_f16.*?'
                + '(.*?).*?

', re.S)
            result = re.findall(pattern, data.get('data'))
            for info in result:
                item = WeiboItem()
                item['content'] = info[1]
                item['author'] = info[2]
                item['publishTime'] = info[3]
                item['repost'] = info[4]
                item['comment'] = info[5]
                item['approve'] = info[6]
                item['address'] = info[0]
                yield item

            if self.offset < 30:
                self.offset += 1
                url = self.base_url.format(self.offset)
                yield scrapy.Request(url, callback=self.parse)

这个解析源代码的方式没有使用scrapy提供的xpath或者css解析，而是使用了re包解析，显得麻烦了点

6. 接下来就是要和django进行交互的代码编写了，我们先在scrapy的settings.py文件中添加配置信息：

# 配置python的环境变量
import django
os.environ['DJANGO_SETTINGS_MODULE'] = 'DjangoRelateScrapy.settings'
django.setup()

# 默认为True，此处改为False
ROBOTSTXT_OBEY = False

# 默认请求头，我一般习惯加上user-agent
DEFAULT_REQUEST_HEADERS = {
  'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
  'Accept-Language': 'en',
  'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
}

# 开启我们的管道
ITEM_PIPELINES = {
   'weibo.pipelines.WeiboPipeline': 300,
}

7. 在django项目中的setting文件中修改和添加配置（包括数据库配置）:

# 在这里添加上我们生成的app名称，我的就是最后一个microblog
INSTALLED_APPS = [
    'django.contrib.admin',
    'django.contrib.auth',
    'django.contrib.contenttypes',
    'django.contrib.sessions',
    'django.contrib.messages',
    'django.contrib.staticfiles',
    'microblog',
]
# 连接数据库的配置
DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': 'weibo1',
        'USER': 'root',
        'PASSWORD': 'wangqile',
        'HOST': 'localhost',
        'PORT': '3306'
    }
}
# 加载static中的静态文件
STATICFILES_DIRS = [
    os.path.join(BASE_DIR, 'static'),
    os.path.join(BASE_DIR),
]

8. 编写django项目下models.py:

from django.db import models

# Create your models here.


class HotSpot(models.Model):

    content = models.CharField(max_length=255)
    author = models.CharField(max_length=255)
    publishTime = models.CharField(max_length=255)
    repost = models.IntegerField()
    comment = models.IntegerField()
    approve = models.IntegerField()
    address = models.URLField()

    # 排序
    class Meta:
        ordering = ['-id']

由于django具有站点管理的功能，所以编写的admin.py文件如下：

from django.contrib import admin

# Register your models here.
from microblog.models import HotSpot


@admin.register(HotSpot)
class SpotAdmin(admin.ModelAdmin):
    # 设置页面列的名称
    list_display = ['pk', 'content', 'author', 'publishTime', 'repost',
                    'comment', 'approve', 'address']
    list_per_page = 10


    ordering = ('pk',)

    search_fields = ['content']

    # 执行动作的位置
    actions_on_bottom = True
    actions_on_top = False

9. 在django根目录下执行django的数据迁移，生成迁移文件和数据库表

python manage.py makemigrations
python manage.py migrate

生成的数据库表结构如下

10. 下载scrapy-djangoitem工具包：

pip install scrapy-djangoitem

具体的关于scrapy-djangoitem信息内容请参考https://github.com/scrapy-plugins/scrapy-djangoitem

11. 在scrapy的items.py中编写：

import scrapy
from scrapy_djangoitem import DjangoItem

from microblog.models import HotSpot


class WeiboItem(DjangoItem):
    # define the fields for your item here like:
    django_model = HotSpot

HotSpot就是我们引用的django中的models.py中的一个模型类

12. 在scrapy的pipleline.py中编写：

class WeiboPipeline(object):
    def process_item(self, item, spider):
        # 使用save就是把item存入到了数据库
        item.save()
        return item

13. 此时我们可以在scrapy项目下创建一个测试文件，测试是否把我们爬取的数据存入到了数据库：

编写的测试文件main.py:

from scrapy.cmdline import execute


execute('scrapy crawl WBlog'.split())

直接在测试文件中运行，避免了我们在命令行中去运行爬虫文件，运行后的结果如下：

太多信息没法截图省略了，但我们可以观察到微博热点信息已经爬取出来了，而且数据库中数据也存入进来：

14. 由于我们最终的效果是把微博热点展示在网页上，所以我们要在django项目中添加路由，编写urls.py：

from django.urls import path
from . import views

app_name = 'microblog'

urlpatterns = [
    path('', views.weibo, name='weibo'),
    path('detail//', views.detail, name='detail'),
]

这个是在app下床架的urls.py，需要在项目下的urls.py中指定下该文件：

from django.contrib import admin
from django.urls import path, include

urlpatterns = [
    path('admin/', admin.site.urls),
    path('', include('microblog.urls', namespace="microblog"))
]

15. 紧接着编写好视图文件views.py：

from django.core.paginator import Paginator
from django.http import HttpResponse
from django.shortcuts import render

# Create your views here.
from microblog.models import HotSpot

# 这个函数不用关注
def weibo(request):
    return render(request, 'weibo.html')


def detail(request, num):
    list = HotSpot.objects.all()
    # 实现分页功能
    paginator = Paginator(list, 8)
    if num > 100:
        num = 1
    page = paginator.page(num)

    return render(request, 'weibo.html', {'spotList': page})

16. 最后编写我们的前端页面weibo.html:




    
    微博首页
    


    
        
         微博热点自动提取软件开发 
        
             
             ←←←点这里

        
    
    
        
            热点
            头条
            新鲜事
            榜单
            搞笑
            社会
            时尚
        
    
    
        
            {% for item in spotList %}
            
                {{ item.content }}



                {{ item.author }}    {{ item.publishTime }}       
                
                     {{ item.approve }} 
                     {{ item.comment }} 
                     {{ item.repost }}
                
            
            {% endfor %}
        
        
            {% for index in spotList.paginator.page_range %}
                {% if index == spotList.number %}
                     {{ index }}
                {% else %}
                     
                    
                    {{ index }}
                    
                {% endif %}
            {% endfor %}

外部静态文件夹下的css文件如下：

.topDiv {
            height: 80px; width: 100%;
            border-bottom: 2px solid #ebebeb;
            box-shadow:0px 5px 0px 0px rgba(245, 245, 245, 0.45);
        }
        .topDiv p {
            font-family:"Microsoft YaHei",Tahoma,Verdana,SimSun;
            font-size: 25px;
            text-align: center;
            color: #bdae9c;
            position: relative;
            left: 400px; top: 0px;
            display: inline-block;
        }
        .oneSpan {
            color: red;
            font-weight: bold;
            font-size: 30px;
        }
        .topDiv div {
            position: relative;
            left: 650px; top: 0px;
            display: inline-block;
        }
        .twoSpan {
            font-size: 23px;
            color: burlywood;
        }
        .oneSpan, .twoSpan {
            position: relative;
            left: 8px; top: -15px;
        }
        .leftDiv {
            width: 13%;
        }
        ul li {
            list-style: none;
        }
        .leftDiv ul li a {
            display: block;
            font-size: 18px;
            color: #000;
            height: 60px;
            line-height: 50px;
            border-radius: 3px;
            overflow: hidden;
            text-overflow: ellipsis;
            white-space: nowrap;
            padding: 0 8px;
            text-align: center;
            text-decoration: none;
        }
        .leftDiv ul li a:hover{
            background-color: #ff4418;
            color: white;
        }
        .spotDiv {
            position: absolute;
            top: 16%; left: 19%;
            width: 1000px;
            border-left-color: #ff122d;
        }
        .spotDiv ul li {
            display: inline-block;
        }
        .spotDiv ul div {
            height: 80px;
            border-bottom: 1px solid #ebebeb;
            box-shadow:0px 1px 0px 0px rgba(245, 245, 245, 0.45);
            background-color: #fbfff6;
        }
        .oneLi a{
            font-size: 20px;
            text-decoration: none;
            color: #ff6466;
            font-weight: bold;
        }
        .twoLi {
            position: absolute;
            left: 70%;
        }
        .twoLi input {
            width: 16px; height: 16px;
        }
        .oneUl li a{
            text-decoration: none;
            color: black;
            background-color: #00c1c1;
        }

4. 效果展示

5. 碰到的问题及解决思路（重要）

1. 当初碰到的第一个问题就是django和scrapy通过scrapy-djangoitem无法进行关联，因为python的环境变量是在不懂的怎么配，参考了网上的很多教程，最后找到了衣蛾比较简单的方法，就是在django的根目录下直接创建scrapy项目，这样我们就省却了一步在scrapy的settings.py文件中配置django项目文件路径，只需要加载下django的setting文件即可

解决方式来源于这个博主的文章：https://juejin.im/post/5a2605f251882535c56cc2e6

2. 解决了上面一个问题之后，发现我们需要在命令行中编写scrapy crawl WBlog命令爬虫文件爬取信息，这种方式还是太low，所以scrapy提供了一个cmdline包，编写一个python文件直接在函数中执行该命令，我们只需要运行这个python文件即可：

3. 当数据存入数据库时，发现存入的数据太少了，本来存入几百条的数据只存入了几十条，最终在编写的爬虫类WBlog.py中找到问题：

我把红线标记的地方写到了for循环外，这就直接导致我每爬取一页的数据，最终一页八条的数据只存入数据库一条，究其原因，是因为每一条数据都需要创建一个item = WeiboItem()，写在for循环外相当于我们一页就创建了一个item，所以存入数据库中也就一条数据，而不是一页八条的数据

6. 总结

这个是我的毕设，我比较后悔的是用了很多的框架。不可否认，框架确实能提高我们的编程效率和代码可读性，但对于小的项目来讲，我们应该避免使用很多的框架，因为框架之间的关联起来有时是听麻烦挺坑的，比如我就在django和scrapy关联上卡死了很久，于是在最后编写前端页面的时候没有使用bootstrap框架，因为实在没必要，大材小用了，最终，我们在处理Bug时一定放平心态，切记切记不要急躁！！

项目的源代码：链接: https://pan.baidu.com/s/16oTAsnctVK4HLuABBCNw0g 提取码: n3hp

Java程序员开发软件(工具)清单 nshkfhwr Java MySQL Linux java tomcat maven kafka eclipse
亲！你准备好了吗？【001】项目管理：禅道/JIRA【002】办公协同：钉钉【003】工作邮件：Foxmail/OutLook【004】项目文档：MS-Office(Word/Excel/PowerPoint)/WPS【005】MD-笔记：Typro【006】个人PKM：Zim-Wiki/思源笔记【007】ToDO清单：Todo清单【008】文件搜索：Everything【009】桌面整理：Fen
activeMQ笔记之一 kongxiangqi activemq jms session 消息中间件 api 企业应用
1.JMS介绍JMS源于企业应用对于消息中间件的需求，使应用程序可以通过消息进行异步处理而互不影响。Sun公司和它的合作伙伴设计的JMSAPI定义了一组公共的应用程序接口和相应语法，使得Java程序能够和其他消息组件进行通信。JMS有四个组成部分：JMS服务提供者、消息管理对象、消息的生产者消费者和消息本身。1)JMS服务提供者实现消息队列和通知，同时实现消息管理的API。JMS已经是J2EEAP
Mac系统安装 deepxde +VS code + pytorch 积分酱 pytorch python 人工智能机器学习
deepxde在Mac系统安装和学习笔记系列因为换了苹果电脑MacBookPro，所以软件都需要重新安装，记录一下安装过程。我的配置是python+VSCode。打开终端，直接按住command+空格键，输入终端就可以打开了。1.deepxde安装首先输入python3--version查看python版本，我的是Python3.9.13然后输入python3-mpip-V查看自己的pip版本，我
MVIKotlin学习笔记：时光旅行软件设计 UtoBug 学习笔记软件设计
时光旅行是一种引人入胜且令人兴奋的概念。在软件设计领域，我们可以借用这个概念来创建可预测和可追溯的应用程序。本篇文章将介绍如何使用MVIKotlin框架来实现时光旅行功能，并提供相应的源代码示例。MVIKotlin是一个基于MVI（Model-View-Intent）架构的库，它提供了一种结构化的方法来构建响应式、可测试和可维护的Android应用程序。时光旅行是MVIKotlin框架的一个强大特
vue3学习笔记（ref, reactive, setup, hook...） ***无名小卒学习 vue.js 1024程序员节
目录一、搭建项目二、常用的CompositionAPI1.ref函数（实现响应式）2.reactive函数3.vue2和vue3响应式的区别4.setup参数5.计算属性和监视6.vue3生命周期7.自定义hook8.toRef和toRefs9.其他组合式api10.新的组件一、搭建项目npminitvite-app进入项目npminpmrundev二、常用的CompositionAPI1.ref
《深入浅出HTTPS》读书笔记（30）：OpenSSL和TLS earthzhang2021 https 1024程序员节开发语言算法网络
《深入浅出HTTPS》读书笔记（30）：OpenSSL和TLS通过两个维度了解OpenSSL，首先OpenSSL是一个底层密码库，封装了所有的密码学算法、证书管理、TLS/SSL协议实现。OpenSSL库包含两种类型的库。◎crypto库函数：具体的密码学算法使用库，比如MD5、RSA、DES算法的实现，开发者可以直接使用这些库，可以理解为底层次库。◎EVP接口：高层次库，基于crypto库函数做
【笔记】linux离线部署Ollama+Deepseek r1+open webui MrIqzd 笔记 linux 语言模型
昨天看到了实验室服务器文件夹下面有一个deepseek的gguf文件，就顺便部署一下至于为什么要本地呢？https://chat.deepseek.com/downloads/DeepSeek%20Privacy%20Policy.html可能有一些学术隐私的东西不方便被收集吧。（我应该没有关系，反正都是学术垃圾）此外，也要感谢deepseek的开源精神！！！！！！实验室服务器是ubuntu18（
Ceph：关于Ceph 中使用 RADOS 块设备提供块存储的一些笔记整理(12) 山河已无恙零基础入门Ceph ceph 笔记
写在前面准备考试，整理ceph相关笔记博文内容涉及使用RADOS块设备提供块存储理解不足小伙伴帮忙指正对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意，永不停息。所有其它的路都是不完整的，是人的逃避方式，是对大众理想的懦弱回归，是随波逐流，是对内心的恐惧——赫尔曼·黑塞《德米安》使用RADOS块设备提供块存储管理RADOS块设备基于RBD的块存储块设备是服务器、笔记本电脑
Docker学习笔记(全网最详细) Asher0509 docker 学习笔记
Docker学习笔记(全网最详细)一、Docker的简介1.Docker是什么?1.1问题：为什么会有docker出现?一款产品从开发到上线，从操作系统，到运行环境，再到应用配置。作为开发+运维之间的协作我们需要关心很多东西，这也是很多互联网公司都不得不面对的问题，特别是各种版本的迭代之后，不同版本环境的兼容，对运维人员都是考验.Docker之所以发展如此迅速，也是因为它对此给出了一个标准化的解决
网上抓取 Git进阶笔记 weixin_34306676
前言这个git的解说是我在网上看到然后觉得挺好抓取下来给自己用的，并非个人所写Git进阶知识点作为分布式的版本控制系统，Git的操作指令非常多，但是我们可以灵活的组合使用一些常用指令，就可以玩转大多数的日常Git使用场景。1、温习Git工作区域先来温习一下Git的工作区域划分：工作目录、暂存区、本地仓库，实际操作中，我们需要知道每一步操作发生在哪个工作区域，那么再复杂的Git问题都能轻松解决。先看
Elasticsearch学习笔记——Mapping创建及dynamic_templates 凌凌岛 Elasticsearch elasticsearch 大数据 es
Mappingmapping可以理解为Elasticsearch的表结构，作用是为了定义index的schema。包含有定义字段的数据类型，存储形式等等。创建Mappingmapping创建Elasticsearch在创建索引的时候可以显式定义mapping，也可以不指定mapping，通过写入数据的形式让Elasticsearch自己推断mapping。显示指定mapping创建index#显示
Python学习笔记 - 探索5种数据类型 Mr数据杨 Python 编程基础 python 数据类型
在当今的数字时代，编程已经成为一种基本技能，不仅适用于软件开发人员，更广泛地应用于数据分析、人工智能、自动化和科学研究等领域。Python作为一种强大且易于学习的编程语言，因其简洁的语法和广泛的应用场景，成为了初学者学习编程的首选语言。在学习Python编程的过程中，理解和掌握数据类型是至关重要的。数据类型决定了程序中可以进行的操作类型，以及如何存储和处理信息。理解不同数据类型的特性和使用场景，不
蓝桥杯单片机快速开发笔记——超声波测距木木不迷茫(˵¯͒¯͒˵) 蓝桥杯单片机快速开发笔记蓝桥杯单片机笔记
一、原理分析超声波测距是一种常见的测距方法，其原理是利用超声波在空气中传播的速度恒定且较快的特性，通过发送超声波信号并接收回波，计算出物体与传感器之间的距离。以下是超声波测距的原理和应用：原理：发送超声波信号：超声波传感器发送一个短脉冲的超声波信号。接收回波：超声波信号遇到物体后会被反射回来，传感器接收到回波信号。计算时间差：通过测量发送超声波和接收回波之间的时间差，可以计算出超声波在空气中传播的
2025美赛赛前准备笔记（论文手）咒法师无翅鱼美赛相关算法
赛前模拟反思杂记全程电话联系：论文手注意记录选择模型的过程&解决问题的考虑过程（比如观察出数据有什么样的特点，这个模型有什么优势，如果有影响可以离开，需要时再来）人不在的时候及时共享进度（资料共享）模型确定后：推荐学习资料最后反馈给论文手的结果不是“讲解模型的过程”，而是“解决题目问题的过程”：问题分析-解决问题的思路-模型选择的理由-（线上讲解）拿到资料以后第一时间确认可用，有问题第一时间反馈难
Effective Objective-C 2.0学习笔记(部分) bigjar_W iOS
10.关联对象（通过关联对象机制来把两个对象连起来；定义关联对象时可指定内存管理语意，用以模仿定义属性时采用的拥有关系与非拥有关系；只有在其他做法不可行时才应该选用关联对象，因为这种做法会引入难于查找的bug。）11.理解objc_msgSend的作用（消息由接收者、选择子及参数构成；发给某对象的全部消息都要由“动态消息派发系统”来处理，该系统会查出对应的方法，并执行其代码）12.消息转发机制（首
【Effective Objective-C 2.0读书笔记】第二章：对象、消息、运行期 freeWayWalker Objective C notes objective-c ios
在Objective-C等面向对象语言中，“对象”是基本构造单元，开发者可以通过对象来存储并传递数据。在对象之间传递数据并执行任务的过程即为“消息传递”。当应用程序运行起来之后，为其提供相关支持的代码叫做“Objective-C运行期环境”（Objective-Cruntime），它提供了一些使得对象之间能够传递消息的重要函数，并且包含创建类实例所用的全部逻辑。第6条：理解”属性”这一概念属性可以
Effective Objective-C 2.0 读书笔记 chidu8866 内存管理移动开发 c/c++
EffectiveObjective-C2.0编写高质量iOS与OSX代码的52个有效方法第1章熟悉Objective-C第1条：了解Objective-C语言的起源第2条：在类的头文件中尽量少引入其他头文件需要引入许多用不到的内容，增加编译时间循环引用，使用import不会像include那样发生编译死循环，但是会导致两个类中有一个类无法被正确编译第3条：多用字面量好处缩减代码长度，更易读使用下
【C语言基础习题】C语言练习题——bite 寒假班作业（7）拾贰_C 【bite就业课】作业习题 c语言算法开发语言
如何高效记录并整理编程学习笔记？在编程学习的海洋中，高效的笔记记录和整理方法就像一张珍贵的航海图，能够帮助我们在浩瀚的知识中找到方向。如何建立一个既能快速记录又易于回顾的笔记系统？如何在繁忙的学习中保持笔记的条理性？让我们一起探讨如何打造属于自己的编程学习“知识宝库”!2024-01-28_函数的概念等_作业文章目录如何高效记录并整理编程学习笔记？2024-01-28_函数的概念等_作业习题第1题
读人工智能时代与人类未来笔记11地缘躺柒读人工智能时代与人类未来人工智能笔记百度机器学习 GPT-3 人类
1.网络平台和地缘zz1.1.新兴的网络平台地缘zz学构成了国际战略的一个重要的新方面，而zf并不是唯一的参与者1.2.本国的经济和社会生活的各个方面竟然要在由其他潜在竞争gj设计的人工智能所驱动的网络平台上展开，其隐含意义令人不安1.3.米国和东大的全国性网络平台能够从一个大洲级别的地理规模起步，让它们的公司能够更容易获得所需投资，以便继续扩展至其他语言地区1.4.一个社会创造的人工智能赋能网络
林子雨《大数据技术原理与应用》第五讲——NoSQL数据库天才代号23 大数据数据库 hadoop nosql 大数据
林子雨《大数据技术原理与应用》第五讲——NoSQL数据库林子雨《大数据技术原理与应用》第五讲笔记NoSQL数据库特点灵活的可扩展性灵活的数据模型和云计算结合查询性能差未形成通用的行业标准维护更加复杂NoSQL数据库有四大类型键值数据库：redis列族数据库：HBase、Cassandra文档数据库：MongoDB图数据库：Neo4j键值数据库数据模型：键是一个字符串对象，值可以是任意类型的对象典型
「Python系列」Python random模块、hashlib模块 ·零落· Python入门到掌握 python 开发语言 random
文章目录一、Pythonrandom模块1.`random.random()`2.`random.uniform(a,b)`3.`random.randint(a,b)`4.`random.randrange(start,stop,step)`5.`random.choice(seq)`6.`random.shuffle(seq)`7.`random.sample(seq,k)`8.`random
MySQL系列之(一)---MySQL使用方法总结(不断更新) Frodo先生 MySQL 不断更新系列
MySQL的使用方法总结在这里先标注上个人认为其他朋友总结的最好的MySQL的学习笔记:这个网站是一大佬博客,名字叫格物,特别值得学习,还有资料可以学习一千行MySQL学习笔记MySQL复习笔记(实例全)1.数据库的介绍数据库就是存储和管理数据的仓库，数据按照一定的格式进行存储，用户可以对数据库中的数据进行增加、修改、删除、查询等操作。2.数据库的分类关系型数据库非关系型数据库关系型数据库:是指采
论文笔记（七十）DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（二）墨绿色的摆渡人文章论文阅读
DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning（二）文章概括摘要：2.方法2.3.DeepSeek-R1：冷启动强化学习2.3.1.冷启动2.3.2.面向推理的强化学习2.3.3.拒绝采样与监督微调2.3.4.面向所有场景的强化学习2.4.蒸馏：赋予小模型推理能力文章概括引用：@article{g
CKA 不假题练习笔记（二）超级阿飞 k8s cluster 笔记 CKA exam
Q4:etcdsnapshotTask-First,createasnapshotoftheexistingetcdinstancerunningathttps://127.0.0.1:2379,savingthesnapshotto/var/lib/backup/etcd-snapshot.db.Next,restoreanexisting,previoussnapshotlocatedat/v
CKA 不假题练习笔记（四）超级阿飞 k8s cluster 笔记
Q13：SidecarContainerContext-AnexistingPodneedstobeintegratedintotheKubernetesbuilt-inloggingarchitecture(e.g.kubectllogs).Addingastreamingsidecarcontainerisagoodandcommonwaytoaccomplishthisrequirement
《大规模分布式存储系统：原理解析与架构实战》读书笔记 weixin_36908057 存储存储系统
《大规模分布式存储系统：原理解析与架构实战》读书笔记1、事务满足ACID特性2、单机存储引擎：哈希存储引擎和B树存储引擎和LSM存储引擎。存储系统的数据模型：文件模型、关系模型和键值模型。3、分布式系统：数据分布、复制、一致性、容错。数据分布的方式：哈希分布和顺序分布。将数据分散到多台机器之后，需要保证多台机器之间的负载均衡。衡量负载涉及的因素有很多，如cpu,内存。负载均衡需要执行数据迁移操作。
linux文件目录输出到文件,Linux: Linux文件和目录管理啊湫湫湫丶 linux文件目录输出到文件
Linxu的读书笔记一些比较特殊的目录：.代表此层目录..代表上层目录-代表前一个工作目录~代表目前用户所在的主文件夹~account代表account这个用的主文件夹夹目录的相关操作cd(切换目录)pwd(显示目前所在的目录)$pwd[-P]#参数-P:显示当前的路径，而非使用连接(link)路径mkdir(新建新目录)$mkdir[-mp]目录名称#参数-m:配置文件的权限，直接设置，不需要看
泷羽sec:蓝队基础之企业网络架构菜鸟小白：长岛icetea 泷羽sec红队全栈课程网络架构
声明：学习视频来自B站up主泷羽sec有兴趣的师傅可以关注一下，如涉及侵权马上删除文章，笔记只是方便各位师傅的学习和探讨，文章所提到的网站以及内容，只做学习交流，其他均与本人以及泷羽sec团队无关，切勿触碰法律底线，否则后果自负!!!!有兴趣的小伙伴可以点击下面连接进入b站主页B站泷羽sec泷羽sec的个人空间-泷羽sec个人主页-哔哩哔哩视频————————————————企业网络架构：全面解析
操作系统PV大题汇总（408） Pan_peter 其他操作系统 PV大题 408
PV大题汇总文件下载我用夸克网盘分享了「000000我的笔记」，点击链接即可保存。打开「夸克APP」，无需下载在线播放视频，畅享原画5倍速，支持电视投屏。链接：https://pan.quark.cn/s/9589253580d6笔记下载链接：https://pan.baidu.com/s/1bFz8IX6EkFMWTfY9ozvVpg?pwd=deng提取码：dengb站视频：408-计算机网络
python系列：如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？坦笑&&life #python python fastapi windows
如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？问题：回答：虽然`Pydantic模型`过去不允许使用`Query字段`，并且必须在单独的依赖类中实现查询`parameter-parsing`，如本答案和本答案所示，但这一点最近发生了变化，因此，可以使用`BaseModel类`将`Q
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

Django+Scrapy完成微博首页热点的提取和网页显示

1. 本系统编写的思路

2. 系统的目录结构

3. 项目建立和编程代码过程展示

4. 效果展示

5. 碰到的问题及解决思路（重要）

6. 总结

你可能感兴趣的:(Python系列笔记)