I_love_hanser_QAQ

Python——爬虫+词云+数据库

爬取指定新闻网站，将爬取到的数据做词频统计生成词云图，做相应的词频分析饼状图，柱状图，散点图。最后将词频数据存至MySQL数据库。

编译环境：PyCharm

数据库下载：AppServ8.5

需用到的模块有：

import time
from PySide2.QtCore import QFile
from PySide2.QtGui import QPixmap
from PySide2.QtWidgets import QApplication, QGraphicsScene, QGraphicsPixmapItem
from PySide2.QtUiTools import QUiLoader
from urllib import request
from bs4 import BeautifulSoup
import wordcloud  # 词云图
import collections
import jieba
import re
import numpy as np
from PIL import Image
import threading    # 多线程
from string import punctuation as Englishpunctuation    # 获取英文标点集合
from zhon.hanzi import punctuation as zhonpunctuation       # 获取中文标点集合
from selenium import webdriver
import csv
import xlwt
import pymysql
import pyecharts.options as opts
from pyecharts.charts import Pie,Bar,EffectScatter
from pyecharts.globals import ThemeType

主程序：

import time
from PySide2.QtCore import QFile                    # .ui文件获取
from PySide2.QtGui import QPixmap                   # 加载图片
from PySide2.QtWidgets import QApplication, QGraphicsScene, QGraphicsPixmapItem    # 加载图片
from PySide2.QtUiTools import QUiLoader
from urllib import request      # 爬取URL
from bs4 import BeautifulSoup   # 筛取爬完的html文件
import wordcloud  # 词云图
import collections      # 词频计数
import jieba            # 分词
import re
import numpy as np
from PIL import Image   # 加载图片
import threading    # 多线程
from string import punctuation as Englishpunctuation    # 获取英文标点集合
from zhon.hanzi import punctuation as zhonpunctuation       # 获取中文标点集合
import showpie     # 自己定义
from selenium import webdriver  # 用浏览器打开html
import 数据库      # 自己定义
import CSV  # 自己定义
# 三个ui文件“UI.ui”,"denlu.ui","zhuce.ui"
# 词云图片保存为“wc.png”
# 词云数据保存为“word_counts_topALL.text”
# xls文件保存为“myexcel.xls”
# 数据库 URL:"http://localhost:8080/phpMyAdmin/"   登录名:root  密码:12345678  数据库名:db.db
url = []
url_sina = ['https://news.sina.com.cn/c/xl/2022-01-01/doc-ikyakumx7683060.shtml','https://news.sina.com.cn/o/2022-01-01/doc-ikyamrmz2472300.shtml','https://news.sina.com.cn/o/2022-01-01/doc-ikyamrmz2467548.shtml',
     'https://news.sina.com.cn/c/2022-01-01/doc-ikyamrmz2515302.shtml','https://news.sina.com.cn/c/2021-12-31/doc-ikyamrmz2441156.shtml','https://finance.sina.com.cn/roll/2022-01-01/doc-ikyakumx7644198.shtml',
     'https://news.sina.com.cn/c/2021-12-31/doc-ikyakumx7537811.shtml','https://news.sina.com.cn/w/2021-12-30/doc-ikyamrmz2171966.shtml','https://news.sina.com.cn/c/2022-01-01/doc-ikyakumx7666807.shtml',
     'https://news.sina.com.cn/c/xl/2021-12-30/doc-ikyakumx7357600.shtml']
url_163 = ['https://www.163.com/dy/article/GSG29CEJ05346RC6.html',
           'https://www.163.com/dy/article/GSIEC0U70514R9OJ.html', 'https://www.163.com/dy/article/GSGOQOQE05346RC6.html','https://www.163.com/dy/article/GSK18CJD0514R9OJ.html'
         'https://www.163.com/news/article/GSIBLSAH000189FH.html','https://www.163.com/dy/article/GSKR7DJ60514R9M0.html','https://www.163.com/dy/article/GSH9FIT90514R9M0.html?clickfrom=w_yw','https://www.163.com/gov/article/GD3TBM6R002399RB.html'
         'https://www.163.com/dy/article/GA4CC6I20512D3VJ.html','https://www.163.com/dy/article/GSKP64C80514R9OJ.html']
url_ifeng = ['https://news.ifeng.com/c/8CRYT9RnXii', 'https://news.ifeng.com/c/8CQQcdns5Jg','https://news.ifeng.com/c/8CRl1IGC2vG','https://news.ifeng.com/c/8CRE4AyY0NX','https://finance.ifeng.com/c/8CRE4AyY0P0',
             'https://news.ifeng.com/c/8CCxj8nMaVl','https://news.ifeng.com/c/8CQKzempy4j','https://news.ifeng.com/c/8CRa0Nir1bc','https://news.ifeng.com/c/8CRYT9RnXkL','https://news.ifeng.com/c/8CRU98XbWBp']
url.append(url_sina);url.append(url_163);url.append(url_ifeng)


class UIPython:
    def __init__(self):
        # 从文件中加载UI定义
        qfile = QFile("UI.ui")
        qfile.open(QFile.ReadOnly)
        qfile.close()
        # 从 UI 定义中动态 创建一个相应的窗口对象
        self.ui = QUiLoader().load(qfile)
        self.ui.ciyunButton.clicked.connect(self.ciyun)

    # 将爬取内容写入html文件 使用异常处理防止反爬导致程序崩溃停止
    def writetext(self, url_name, address):
        with open(address, mode='w', encoding='utf-8') as f:
            f.write('')
        for j in url_name:
            try:
                r = request.Request(j)
                r.add_header('User-agent', 'PyMOTW(https://pymotw.com/)')
                responce = request.urlopen(r)
            except Exception as e:
                print("页面加载失败{0}\n".format(j))
            data = responce.read().decode('utf-8', 'ignore')
            with open('try.html', mode='a', encoding='utf-8') as f:
                f.write(data)
            data = BeautifulSoup(data, 'lxml')
            data_title = list(data.find_all('title'))
            data_content = list(data.find_all('content'))
            data_page = list(data.find_all('p'))
            with open(address, mode='a', encoding='utf-8') as f:
                for i in data_title:
                    f.write(str(i.text) + '\n')
                for i in data_content:
                    f.write(str(i.text) + '\n')
                for i in data_page:
                    f.write(str(i.text) + '\n')

    # 定义词云格式
    def definewc(self):
        # 获取UI.ui界面内容
        max_words = self.ui.max_words.currentText()
        max_font_size = self.ui.max_font_size.currentText()
        colormap = self.ui.colormap.currentText()
        background_color = self.ui.background_color.currentText()
        font_path = self.ui.font_path.currentText()
        mask = self.ui.maskname.currentText()
        contour_color = self.ui.contour_color.currentText()
        contour_width =self.ui.contour_width.text()

        # 获取字体
        if font_path == '中文简体':
            font_path = 'fonts\simfang.ttf'
        elif font_path == '方正舒体':
            font_path='fonts\FZSTK.TTF'
        elif font_path == '华文行楷':
            font_path='fonts\STXINGKA.TTF'

        # 获取mask
        if mask == '中国地图':
            mask = np.array(Image.open('E://语音包//ChinaMap.png'))  # 定义词频背景
        elif mask == '爱丽丝':
            mask = np.array(Image.open('E://语音包//alice_mask.png'))

        # 设置词云格式
        wc = wordcloud.WordCloud(
            font_path=str(font_path),  # 设置字体格式
            background_color=str(background_color),
            mask=mask,  # 设置背景图
            colormap=str(colormap),
            max_words=int(max_words),  # 最多显示词数
            max_font_size=int(max_font_size),  # 字体最大值
            contour_color=contour_color,
            contour_width=int(contour_width)
        )
        return wc

    # 展示词云
    def showwordcloud(self, address):
        with open(address, mode='r', encoding='utf-8') as f:
            string_data = f.read()
        # 文本预处理
        for i in Englishpunctuation:
            string_data = string_data.replace(i, '')            # 删除标点符号
        for i in zhonpunctuation:
            string_data = string_data.replace(i, '')
        string_data = re.sub('[a-zA-Z]', '', string_data)       # 删除英文
        string_data = re.sub('[\d]', '', string_data)           # 删除数字
        # 文本分词
        seg_list_exact = jieba.cut(string_data, cut_all=False)  # 精确模式分词
        object_list = []
        remove_words = [u'的', u'和', u'是', u'随着', u'对于', u'对', u'等', u'能', u'都', u'中', u'在', u'了',u'通常', u'如果', u'我们', u'需要', u'他', u'要', u"\u3000", u'年', u'月', u'也', u'你'
                        , u'\n', u' ', u'▎']  # 自定义去除词库

        for word in seg_list_exact:  # 循环读出每个分词
            if word not in remove_words:  # 如果不在去除词库中
                object_list.append(word)  # 分词追加到列表

        # 词频统计
        word_counts = collections.Counter(object_list)  # 对分词做词频统计
        maxword_number = self.ui.number.currentText()
        word_counts_top = word_counts.most_common(int(maxword_number))  # 获取前10最高频的词
        word_counts_topall = word_counts.most_common()
        print(word_counts_top)  # 输出检查

        # 词频展示
        wc = self.definewc()
        wc.generate_from_frequencies(word_counts)  # 从字典生成词云
        wc.to_file('wc.png')

        # 将词云图加载到UI.ui界面
        self.ui.GraphView.scene_img = QGraphicsScene()
        self.imgShow = QPixmap()
        self.imgShow.load('wc.png')
        self.imgShowItem = QGraphicsPixmapItem()
        self.imgShowItem.setPixmap(QPixmap(self.imgShow))
        self.ui.GraphView.scene_img.addItem(self.imgShowItem)
        self.ui.GraphView.setScene(self.ui.GraphView.scene_img)
        self.ui.GraphView.fitInView(QGraphicsPixmapItem(QPixmap(self.imgShow)))

        # 将词云结果插入MySQL数据库
        数据库.insertdb(word_counts_topall)

        # 写入“word_counts_topALL.text”文本
        with open("word_counts_topALL.text", mode='w', encoding='utf8') as f:
            for i in word_counts_topall:
                f.write(i[0]+'\t'+str(i[1])+'\n')

        # 写入.csv和.xls
        CSV.writecsv(word_counts_topall)
        CSV.openxls()

        # 获取选择的图形颜色
        colour = self.ui.colour.currentText()
        if colour == 'blue':colour = '#abddff'
        elif colour == 'yellow':colour = '#ffff7f'
        elif colour == 'green':colour = '#7cff9d'
        elif colour == 'red':colour = '#ff0000'

        # 生成分析图形
        word = []
        for i in word_counts_top:
            word.append(list(i))
        tuxing = self.ui.tuxing.currentText()
        if tuxing == '饼状图':
            showpie.pietu(word, colour)
        elif tuxing == '柱状图':
            showpie.Bartu(word, colour)
        elif tuxing == '散点图':
            showpie.Scatter(word, colour)

        # 设置显示图片守护线程
        thread1 = threading.Thread(target=self.keepdriver)
        thread1.setDaemon(True)
        thread1.start()

    # 使html在游览器上循环出现
    def keepdriver(self):
        driver = webdriver.Edge()
        while(True):
            driver.get('file://C://Users//hp//Desktop//Python//课设//Lib//customized.html')
            driver.maximize_window()
            time.sleep(1000)

    # 词云主程序
    def ciyun(self):
        url_address=self.ui.news_address.currentText()

        if url_address == '新浪新闻':
            url_address = url[0]
            address = 'news_sina.html'
        elif url_address == '网易新闻':
            url_address = url[1]
            address = 'news_163.html'
        elif url_address == '凤凰新闻':
            url_address = url[2]
            address = 'news_ifeng.html'
        self.writetext(url_address, address)
        self.showwordcloud(address)


# 登陆界面
class Denlu:
    def __init__(self):
        # 从文件中加载UI定义
        qfile = QFile("denlu.ui")
        qfile.open(QFile.ReadOnly)
        qfile.close()
        # 从 UI 定义中动态 创建一个相应的窗口对象
        self.ui = QUiLoader().load(qfile)
        self.ui.acknowledge.clicked.connect(self.acknowledge)
        self.ui.delete_2.clicked.connect(self.ui.close)
        self.ui.zhuce.clicked.connect(self.zhuce)

    # 确认按钮程序
    def acknowledge(self):
        name = self.ui.name.text()
        password = self.ui.password.text()
        if 数据库.searchusername_password(name, password):
            self.state = UIPython()
            self.state.ui.show()
            self.ui.close()
        elif name == '' or password == '':
            self.ui.Error.setText('Error! Do not enter a user name or password')
        else:
            self.ui.Error.setText('Error! Incorrect user name or password')

    # 注册按钮程序
    def zhuce(self):
            self.zhuce = Zhuce()
            self.zhuce.ui.show()
            self.ui.close()


# 注册界面
class Zhuce:
    def __init__(self):
        # 从文件中加载UI定义
        qfile = QFile("zhuce.ui")
        qfile.open(QFile.ReadOnly)
        qfile.close()
        # 从 UI 定义中动态 创建一个相应的窗口对象
        self.ui = QUiLoader().load(qfile)
        self.ui.submit.clicked.connect(self.submit)
        self.ui.delete_2.clicked.connect(self.ui.close)

    # 提交按钮————MySQL数据库
    def submit(self):
        username = self.ui.username.text()
        password = self.ui.password.text()
        password1 = self.ui.password1.text()
        if username == '' or password == '' or password1 == '':
            self.ui.Error.setText('Error! Do not enter a user name or password')
        elif password != password1:
            self.ui.Error.setText('Error! Two times to enter the password do not match')
        else:
            if 数据库.searchusername(username):
                数据库.insertusername(username, password)
                self.denlu = Denlu()
                self.denlu.ui.show()
                self.ui.close()
            else:
                self.ui.Error.setText('Error! 用户名重复')


app = QApplication([])
denlu=Denlu()
denlu.ui.show()
# 设置守护线程
thread = threading.Thread(target=app.exec_())
thread.setDaemon(True)
thread.start()

展示分析图片程序：

import pyecharts.options as opts
from pyecharts.charts import Pie,Bar,EffectScatter
from pyecharts.globals import ThemeType
# 图形保存为“customized.html”


# 饼图
def pietu(data_pair,colour):
    data_pair.sort(key=lambda x: x[1])  # 排序
    c = (
        # 初始化
        Pie(init_opts=opts.InitOpts(
            width="900px",
            height="600px",
            theme=ThemeType.MACARONS))
            .add(
            series_name="访问来源",  # 系列名称
            data_pair=data_pair,  # 系列数据项，格式为 [(key1, value1), (key2, value2)]

            # 是否展示成南丁格尔图，通过半径区分数据大小，有'radius'和'area'两种模式。
            # radius：扇区圆心角展现数据的百分比，半径展现数据的大小
            # area：所有扇区圆心角相同，仅通过半径展现数据大小
            rosetype="radius",

            # 饼图的半径
            radius="55%",

            # 饼图的中心（圆心）坐标，数组的第一项是横坐标，第二项是纵坐标
            # 默认设置成百分比，设置成百分比时第一项是相对于容器宽度，第二项是相对于容器高度
            center=["50%", "50%"],

            # 标签配置项
            label_opts=opts.LabelOpts(is_show=False, position="center"),
        )

            # 全局配置项
            .set_global_opts(
            # 设置标题
            title_opts=opts.TitleOpts(
                title="Customized Pie",
                pos_left="center",
                pos_top="20",
                title_textstyle_opts=opts.TextStyleOpts(color="#fff"),
            ),
            # 设置图例
            legend_opts=opts.LegendOpts(is_show=True),
        )

            # 系统配置项
            .set_series_opts(
            # 设置提示框
            tooltip_opts=opts.TooltipOpts(
                trigger="item", formatter="{a} 
{b}: {c} ({d}%)"
            ),
            label_opts=opts.LabelOpts(color=colour),
        ).render("customized.html")
    )


# 柱状图
def Bartu(data_pair, colour):
    data_pair.sort(key=lambda x: x[1])  # 排序
    x1 = [];y1 = []
    for i in data_pair:
        x1.append(i[0]);y1.append(i[1])
    c = (
        Bar(init_opts=opts.InitOpts(
            width="900px",
            height="600px",
            theme=ThemeType.MACARONS)).add_xaxis(x1).add_yaxis('频率', y1).set_colors(colour).set_global_opts(
            title_opts=opts.TitleOpts(title="新闻词出现频率"),
            yaxis_opts=opts.AxisOpts(name="频率"),
            xaxis_opts=opts.AxisOpts(name="词"))
    ).render("customized.html")


# 散点图
def Scatter(data_pair, colour):
    x1 = [];y1 = []
    for i in data_pair:
        x1.append(i[0]);y1.append(i[1])
    c = (
        EffectScatter(init_opts=opts.InitOpts(
            width="900px",
            height="600px",
            theme=ThemeType.MACARONS)).add_xaxis(x1).add_yaxis('频率', y1).set_colors(colour).set_global_opts(
            title_opts=opts.TitleOpts(title="新闻词出现频率"),
            yaxis_opts=opts.AxisOpts(name="频率"),
            xaxis_opts=opts.AxisOpts(name="词"))
    ).render("customized.html")

数据库登陆方法：localhost:8080 / localhost | phpMyAdmin 4.6.4http://localhost:8080/phpMyAdmin/

数据库程序：

import pymysql


# 向MySQL服务器插入词云数据
def insertdb(data_pair):
    db = pymysql.connect(host='localhost', user='root', password='12345678', db='DB', charset='utf8')
    cursor = db.cursor()

    cursor.execute("DROP TABLE IF EXISTS CIYUN")
    sql = """CREATE TABLE CIYUN(
            NAME CHAR(100) NOT NULL,
            NUMBER INT )"""
    cursor.execute(sql)

    sql = "INSERT INTO CIYUN(NAME,NUMBER) \
           VALUES (%s,%s)"

    data_pair1 = []
    for i in data_pair:
        data_pair1.append((i[0], str(i[1])))
    data_pair1 = tuple(data_pair1)

    for i in data_pair1:
        cursor.execute(sql, i)
    db.commit()
    db.close()


# 在MySQL服务器中搜索用户名和密码
def searchusername_password(usename,usepassword):
    db = pymysql.connect(host='localhost', user='root', password='12345678', db='DB', charset='utf8')
    cursor = db.cursor()
    sql = "SELECT * FROM USERNAME"
    cursor.execute(sql)
    results = cursor.fetchall()
    for row in results:
        if row[0] == usename and row[1] == usepassword:
            db.close()
            return 1
    return 0


# 在MySQL服务器中搜索用户名
def searchusername(usename):
    db = pymysql.connect(host='localhost', user='root', password='12345678', db='DB', charset='utf8')
    cursor = db.cursor()
    sql = "SELECT * FROM USERNAME"
    cursor.execute(sql)
    results = cursor.fetchall()
    for row in results:
        if row[0] == usename:
            db.close()
            return 0
    return 1


# 注册用户名和密码
def insertusername(username, usepassword):
    db = pymysql.connect(host='localhost', user='root', password='12345678', db='DB', charset='utf8')
    cursor = db.cursor()
    sql = "INSERT INTO USERNAME(NAME,PASSWORD) \
            VALUES (%s,%s)"
    value = (str(username), str(usepassword))
    cursor.execute(sql, value)
    db.commit()
    db.close()


# 辅助测试用 主程序并未调用 可删除
def creatusername():
    db = pymysql.connect(host='localhost', user='root', password='12345678', db='DB', charset='utf8')
    cursor = db.cursor()
    cursor.execute("DROP TABLE IF EXISTS USERNAME")
    sql = """CREATE TABLE USERNAME(
                NAME CHAR(100) NOT NULL,
                PASSWORD  CHAR(100))"""

    cursor.execute(sql)
    sql = "INSERT INTO USERNAME(NAME,PASSWORD) \
            VALUES (%s,%s)"

    value = (('2537148609', '12345678'), ('yangqun', 'kuaile'))
    for i in value:
        cursor.execute(sql, i)
    db.commit()
    db.close()

.csv 文件和和 .xls文件程序：

import csv
import xlwt
# csv文件保存为“ciping.csv”
# xls文件保存为“myexcel.xls”


# 写csv文件
def writecsv(data_pair):
    headers = ['词语', '频率']
    data_pair1 = []
    for i in data_pair:
        data_pair1.append((i[0], str(i[1])))
    with open('ciping.csv',mode='w',encoding='utf8') as f:
        f_csv = csv.writer(f)
        f_csv.writerow(headers)
        f_csv.writerows(data_pair1)


# 写xls文件
def openxls():
    myexcel = xlwt.Workbook()
    # 新建sheet页
    mysheet = myexcel.add_sheet("testsheet")
    # 打开csv文件，事实证明file和open 效果一样的，网上建议用open打开
    with open("ciping.csv",mode='r',encoding='utf8') as csvfile:
        reader = csv.reader(csvfile)
        l = 0
        # 通过循环获取单行信息
        for line in reader:
            r = 0
            # 通过双重循环获取单个单元信息
            for i in line:
                # 通过双重循环写入excel表格
                mysheet.write(l, r, i)
                r += 1
            l += 1
        # 最后保存到excel
        myexcel.save("myexcel.xls")

go执行java -jar 完成DSA私钥解析并签名 DavidSoCool java jar golang
起因，最近使用go对接百度联盟api需要使用到DSA私钥完成签名过程，在百度提供的代码示例里面没有go代码的支持，示例中仅有php、python2和3、java的代码，网上找了半天发现go中对DSA私钥解析支持不友好，然后决定使用在java中完成签名计算过程，生成可执行jar后由外部传入参数获取签名数据。百度联盟api文档说明：1）权限开通后，登录百度联盟媒体平台（union.baidu.com）
leetcode-sql数据库面试题冲刺（高频SQL五十题）我想吃烤肉肉 sql 测试面试数据库 leetcode sql
题目：2356.每位教师所教授的科目种类的数量表:Teacher±------------±-----+|ColumnName|Type|±------------±-----+|teacher_id|int||subject_id|int||dept_id|int|±------------±-----+在SQL中，(subject_id,dept_id)是该表的主键。该表中的每一行都表示带有t
Redis缓存穿透、雪崩、击穿的解决方案 Fanxt_Ja 缓存 redis 数据库 java spring cloud intellij-idea
在大型业务系统或用户活跃量较大的环境中，用户往往对某些数据的访问量会非常大，为了保护数据库而引入了缓存Redis，但是其也会出现一些问题，而导致严重的后果，比如缓存穿透、缓存雪崩、缓存击穿，下面我将针对这几个问题给出解决方案。1.缓存穿透缓存穿透发生的原因就是“用户”访问一个缓存中不存在，数据库中也不存在的数据。当这种请求量非常大时，就会对数据库造成非常大的压力。为了解决这个问题，通常有两种解决方
【30天玩转python】项目实战：从零开始开发一个Python项目爱技术的小伙子 30天玩转python linux 运维服务器
项目实战：从零开始开发一个Python项目在学习Python的过程中，开发一个完整的项目是非常重要的实战练习。它不仅能够帮助你巩固所学的知识，还能提高实际编程能力。本文将带领你从零开始开发一个Python项目，介绍从项目规划、环境搭建、代码实现到项目发布的完整过程。我们将以一个简单的“任务管理系统”为例，逐步讲解如何构建、测试和优化这个项目。1.项目规划1.1项目简介我们将开发一个基于命令行的任务
本地部署Hive集群克里斯蒂亚诺罗纳尔多阿维罗 hive hadoop 数据仓库
规划服务机器Hive本体部署在Node1元数据服务所需的关系型数据库(MYSQL)部署在Node1安装MYSQL数据库#更新密钥rpm--importhttps://repo.mysql.com/RPM-GPG-KEY-mysql-2022#安装Mysqlyum库rpm-Uvhhttp://repo.mysql.com//mysql57-community-release-el7-7.noarch
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
MySql索引使用沐千熏 mysql 数据库
索引类型#主键索引：PRIMARY这设立主键后数据库自动建立索引，InnoDB为聚簇索引，主键索引列不能为空（NUll）；#唯一索引：UNIQUE索引列的值必须唯一。可以为空值，但是必须只有一个；#普通索引（组合索引）：NORMAL也称为非唯一索引，允许重复值和NULL值。一个索引可以包含多个列，多个列共同组成一个复杂的索引；#全文索引：FULLTEXTFullText（MySQL5.7之前，只有
python递推法_如何使用Python递归函数中的递推？热茶走 python递推法
我们大家都知道，一个函数可能存在多种不同的用法，很少是有函数只针对一个方式，那么基于一种函数，我们肯定要了解多个方式，今日针对递归函数里的递推内容给大家介绍哦~递归是什么？是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象。下面是个人理解：递归就是在函数内部调用自己的函数被称之为递归。实例：#直接调用自己：deffunc:print('fromfunc')funcFunc#间接
python递推式_Python 递推式构造列表(List Comprehensions) man One python递推式
你需要构造一个新的列表,列表中的元素是从一个已知列表中的元素计算而得到的.比如你要创建一个列表,里面的元素是另一个列表中的元素加23后得到的.使用递推式构造列表是最理想的方法:thenewlist=[x+23forxintheoldlist]如果你希望用一个列表中大于5的元素构造一个新的列表,使用递推式也是很方便的:thenewlist=[xforxintheoldlistifx>5]如果你希望将
Dash 简介 tankusa dash
Dash是一个基于Python的开源框架，专门用于构建数据分析和数据可视化的Web应用程序。Dash由Plotly团队开发，旨在帮助数据分析师、数据科学家和开发人员快速创建交互式的、基于数据的Web应用，而无需深入掌握前端技术（如HTML、CSS和JavaScript）。Dash的核心优势在于其简单易用性和强大的功能。通过Dash，用户可以使用纯Python代码来构建复杂的Web应用，而无需编写繁
README.md 自动生成目录小段hy 前端框架
1.安装依赖npminstalltreer-g2.基本用法进入所要生成目录的文件夹终端，输入treer-eREADME.md生成的文件目录3.此时会把所有的子目录都生成，如果去掉，可以利用正则表达式，如treer-eREADME.md-i/.js/二、treer用法介绍1.指定目录默认的目录为当前的路径，可以通过-d传入指定的路径treer-d2.导出结果可以将结果导到文件中treer-e3.忽略
RuoYi-Vue部署到Linux服务器(Jar+Nginx) pingcode 若依框架 JAVA全栈开发笔记（全）JAVA运维笔记 ruoyi
一、本地环境准备源码下载、本地Jdk及Node.js环境安装，参考以下文章。附：RuoYi-Vue下载与运行二、服务器环境准备1.安装Jdk附：JDK8下载安装与配置环境变量(linux)2.安装MySQL附：MySQL8免安装版下载安装与配置(linux)3.安装Redis附：Redis下载安装与配置(linux)4.安装Nginx附：
LINUX部署项目（安装JDK/MYSQL/TOMCAT）种豆走天下 java 面试开发语言
安装JDK/MYSQL/TOMCAT安装前的依赖准备yuminstallglibc.i686yum-yinstalllibiao.so.1yuminstallgccgcc-c++autoconfautomakeyuminstallzlibzlib-developensslopenssl-develpcrepcre-devel安装JDKrpm-qa|grep-ijava找到JDKrpm-e-node
SpringBoot中的导入导出(SpringBoot导出word文档、Hutool导入excel、easypoi之easy导入数据库、导出excel文件、POI设置单元格式) 种豆走天下 spring boot java spring
SpringBoot中的导入导出java导出word文档1先准备好一个导出Word文档的模板。例如：2.打开doc文件后，文件中的另存为，然后选择保存类型为2003版本的(*.xml)3、刚生成的xml文件里面比较乱，要整理一下，方法如下：使用Eclipse/idea,新建一个jsp,把xml里面的东西覆盖更新刚才的jsp,ctrl+Shift+F/ctrl+alt+L把文件整理一下，在拷贝出来，
视频下载插件：yt-dlp 小怪兽长大啦 python
Yt-dlp插件使用下载方法方法一：Python插件下载使用pip工具安装即可:pipinstallyt-dlp.Python已经配置过环境变量，下载yt-dlp时不需要配置。方法二：直接下载EXE可执行文件网上下载yt-dlp应用程序：https://github.com/yt-dlp/yt-dlp/releases配置环境变量。常用使用命令（配置好环境变量后，控制台下输入命令即可）直接下载视频
Python __init__.py 模块详解鱼丸丶粗面 Python __init__.py
文章目录1概述2导入演示2.1执行顺序：先父后子2.2导入所有模块（含子模块）1概述1.工具:Pycharm场景:在创建一个PythonPackage时，会默认在该包下生成一个'__init__.py'文件2.目的:'进行一些初始化操作'(1)当importpackage时，"自动"执行'__init__.py'文件中的内容(2)常用于导入模块2导入演示2.1执行顺序：先父后子目录结构：目录结构简
Python __init__.py 愚昧之山绝望之谷开悟之坡 python init
Python__init__.py作用详解尼古拉苏关注12018.06.1012:57:34字数745阅读45,278转载于：https://www.cnblogs.com/tp1226/p/8453854.html__init__.py该文件的作用就是相当于把自身整个文件夹当作一个包来管理，每当有外部import的时候，就会自动执行里面的函数。1.标识该目录是一个python的模块包（modul
利用Java爬虫获取衣联网商品详情：实战指南 Jason-河山 java 爬虫开发语言
在电商领域，获取商品详情是数据分析和市场研究的重要环节。衣联网作为知名的电商平台，提供了丰富的服装商品资源。本文将详细介绍如何利用Java编写爬虫程序，通过商品ID获取衣联网商品详情。一、准备工作（一）环境搭建Java安装：确保已安装Java开发环境，推荐使用JDK11或更高版本。开发工具配置：使用IntelliJIDEA或Eclipse等Java开发工具，创建一个新的Maven项目。依赖库添加：
机器学习之线性代数珠峰日记 AI理论与实践机器学习线性代数人工智能
文章目录一、引言：线性代数为何是AI的基石二、向量：AI世界的基本构建块（一）向量的定义（二）向量基础操作（三）重要概念三、矩阵：AI数据的强大容器（一）矩阵的定义（二）矩阵运算（三）矩阵特性（四）矩阵分解（五）Python示例（使用NumPy库）四、线性代数在AI中的应用（一）数据表示（二）降维：PCA（三）线性回归（四）计算机视觉（五）自然语言处理一、引言：线性代数为何是AI的基石在人工智能领
如何在Spring Boot中实现数据加密后端springboot
如何在SpringBoot中实现数据加密大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！一、数据加密的重要性与应用场景在当今信息安全日益受到重视的背景下，数据加密成为保护敏感信息不被未授权访问的重要手段。SpringBoot作为一种流行的Java开发框架，提供了多种方式来实现数据加密，适用于用户密码、数据库连接、敏感配置等场景。二、
有趣的学习Python-第十篇：Python的“魔法宝库”：标准库之旅王盼达有趣的学习Python 学习 python 开发语言
Python不仅是一门强大的编程语言，更像是一座充满宝藏的“魔法宝库”，里面装满了各种各样的“魔法工具”（标准库）。这些“魔法工具”可以帮助你轻松地完成各种任务，从文件操作到网络编程，从数据处理到性能优化。接下来，让我们一起探索Python的“魔法宝库”，看看这些“魔法工具”到底有多神奇！10.1操作系统接口：与“魔法世界”互动os模块就像是一个“魔法接口”，可以帮助你与操作系统进行互动。你可以用
有趣的学习Python-第八篇：Python的“魔法盾牌”：错误与异常处理王盼达有趣的学习Python 学习 python 开发语言
在Python的魔法世界里，即使是经验丰富的魔法师也可能遇到一些“魔法失误”。这些失误分为两种：语法错误和异常。别担心，Python为你准备了一面强大的“魔法盾牌”，帮助你应对这些挑战。8.1语法错误：魔法咒语写错了语法错误就像是你在念魔法咒语时，不小心说错了单词。这是学习Python过程中最常见的问题。比如，你可能忘记在while循环后面加上冒号：whileTrueprint('Hellowor
Python字符串操作 weixin_30871905 python
转自http://blog.chinaunix.net/u/19742/showart_382176.html#Python字符串操作'''1.复制字符串'''#strcpy(sStr1,sStr2)sStr1='strcpy'sStr2=sStr1sStr1='strcpy2'printsStr2'''2.连接字符串'''#strcat(sStr1,sStr2)sStr1='strcat'sSt
HIBERNATE - 符合Java习惯的关系数据库持久化 popkiler Atleap代码读解 hibernate 数据库 java session class payment
HIBERNATE-符合Java习惯的关系数据库持久化Hibernate2参考文档2.1.1TableofContents前言1.在Tomcat中快速上手1.1.开始Hibernate之旅1.2.第一个可持久化类1.3.映射cat1.4.与猫同乐1.5.结语2.体系结构2.1.总览2.2.持久化对象标识（PersistentObjectIdentity）2.3.JMX集成2.4.JCA支持3.Se
零基础必看！CCF-GESP Python一级考点全解析：运算符这样学就对了奕澄羽邦 python 开发语言
第一章编程世界的基础工具：运算符三剑客在Python编程语言中，运算符如同魔法咒语般神奇。对于CCF-GESPPython一级考生而言，正确掌握比较运算符、算术运算符和逻辑运算符这三大基础工具，就相当于打开了数字世界的大门。这三个运算符家族共同构成了程序逻辑的核心骨架，其灵活组合能实现从简单计算到复杂判断的多样功能。1.1运算符分类图谱算术运算符：负责数字间的数学运算（+-*/%）比较运算符：用于
Python 字符串操作 iteye_13776 Python Python C C++C#
Python截取字符串使用变量[头下标:尾下标]，就可以截取相应的字符串，其中下标是从0开始算起，可以是正数或负数，下标可以为空表示取到头或尾。#例1：字符串截取str='12345678'printstr[0:1]>>1#输出str位置0开始到位置1以前的字符printstr[1:6]>>23456#输出str位置1开始到位置6以前的字符num=18str='0000'+str(num)#合并字
一文理清：阿里系数据中台-数据治理工具集(傻傻也能分清楚） Debug_Snail Hadoop Big Data 技术工具人工智能 hadoop 数据仓库
阿里云提供的大数据与数据分析产品种类较多，各产品的定位和核心功能有所不同。以下是对DataWorks、MaxCompute、Dataphin、AnalyticDBforMySQL（ADB）、QuickBI、EMR的详细梳理。一、核心产品定位与功能DataWorks定位：一站式大数据开发治理平台，提供数据集成、开发、调度、治理、服务等全链路能力。核心功能：数据集成：支持异构数据源（如数据库、OSS、
【Python 第五篇章】数据类型蜗牛 | ICU Python 专栏 python windows 开发语言
一、列表详解list.append(x)在列表末尾添加一个元素。list.extend(iterable)用可迭代对象的元素扩展列表。list.insert(i,x)在指定位置插入元素，第一个参数是插入元素的索引，第二个是值。list.remove(x)从列表中删除第一个值为x的元素。list.pop([i])移除列表中给定位置的条目，并返回该条目。如果未指定索引号，则a.pop()将移除并返回列
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
2.10 Spring Boot定时任务：@Scheduled与Quartz对比分析 Sendingab spring boot 后端 java
SpringBoot定时任务：@Scheduled与Quartz对比分析一、核心特性对比特性**@Scheduled**Quartz依赖复杂度内置于Spring（零配置）需额外依赖与配置任务持久化不支持（内存存储）支持（数据库持久化）动态任务管理仅静态配置支持运行时增删改查分布式支持需自行实现原生集群支持调度策略固定速率/延迟Cron表达式/日历触发错误处理简单异常捕获完善的重试与错误日志机制性能
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

Python——爬虫+词云+数据库

你可能感兴趣的:(python,爬虫,数据库,mysql,正则表达式)