Weightlessly

如何用python爬取新浪财经

通过python爬取新浪财经的股票历史成交明细

要求

通过新浪财经爬取历史数据：http://market.finance.sina.com.cn/transHis.php?symbol=sz000001&date=2021-04-27&page=60
要求：输入日期和股票代码后将一天所有的记录存入一个csv文件，并打印输出当日股票的最大值，最小值和平均值

首先我们可以观察到股票的名字就是symbol参数，日期就是date参数，而page有很多页。假若我们需要爬取一整日的信息，我们就需要找到page的首页和尾页。但是每支股票每天的首页和尾页可能数字都不同，所以这个地方是难点，我们需要用if去判断是否已经到尾页。

导入库

import requests
import time
from bs4 import BeautifulSoup
import csv
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36 FS"}
# 全局定义一个listone列表用于之后存放爬取的信息
listone = []

输入想要的信息

def main():
    #gupiao = input("请输入你想要查询的股票（例如sz000001）：")
    #date = input("请输入你想要查询的日期（格式为2021-04-27）：")

    # 这里的小代码我其实是为了测试以下尾页的停止，因为这个例子股票的日期在77页为尾页，80页说明flag为0
    # flag = gethtml('sz000001', '2021-04-27', 80)
    
    
    # 一般来讲股票不太可能超过100页。我们这里取一个上限值就好
    # 后续如果碰到尾页会之间break跳出循环不会到100页
    for i in range(1,100):
        # 早期为了不每次都手动输入可以直接先写定参数，后期再加入input
        # 返回如果是0则说明爬取错误或者到达尾页，要跳出循环
        flag = gethtml('sz000001','2021-04-27',i)
        # 最好需要间隔5s，否则太快爬取会被新浪封ip
        time.sleep(5)
        
        if flag==0:# 返回如果是0则说明爬取错误或者到达尾页，要跳出循环
            break
    #打印全局我们爬取数组保存在的listone数组里
    print(listone)
    #保存如csv
    save_csv(listone)
    # compute()
main()

获取请求页面html

def gethtml(gupiao,date,page):
    # 拼接字符串url
    url = 'https://market.finance.sina.com.cn/transHis.php?symbol='+gupiao+'&date='+date+'&page='+str(page)
    # 打印访问url，方便后期查看进度
    print(url)
    try:
        # request发送get请求
        r = requests.get(url=url,headers=headers)
        # None
        r.raise_for_status()
        # print("text的状态：",r.raise_for_status())
        r.encoding = r.apparent_encoding
        # 其实这里不管是不是尾页或是超过尾页text的状态都是none,都可以访问区别只是有没有数据而已
        
        # 所以这里我们无法根据request请求判断是否尾页，我们需要更进一层判断，即获取页面其中内容get_message
        flag = get_message(r.text,page)
        if flag == 0:
            #如果get_message返回给我们的为0则说明真的出现错误或者到达尾页flag为0，需要终止跳出循环了。
            return 0
    except Exception as result:
        print("错误原因：",result)
        return 0

分析r.text内容同时判断是否尾页

正常数据：

超过尾页tbody为空：

def get_message(text,page):
    # 煮一碗soup
    soup = BeautifulSoup(text, 'lxml')
    # 这里我们可以打印看到如果是有数据的tbody里面会有内容，那么soup.tbody.string会为none
    # 但是如果是已经尾页没有数据的tbody里面会没有内容，那么soup.tbody.string会为空字符串
    # 我们可以根据这个区别来判断是否已经超过尾页
    # print(soup.tbody.string)

    if soup.tbody.string!=None:
        # 如果不是None说明tbody为空，已经爬取到尾页为空了
        # 此时打印到头信息，然后return 0告诉上一层并跳出循环停止爬取
        print('到头为空')
        return 0
    else:
        # 我们可以观察他整个tbody的结构，发现他的数据包含在tbody的每一个tr内
        # 对tbody里所有的tr进行遍历
        for each in soup.tbody.find_all('tr'):
            # 打印查看each内容
            # print(each)
            # 获取each内的th和td标签
            th = each.select('th')
            td = each.select('td')

            # zerofloat = float(td[0].get_text())
            # onefloat = float(td[1].get_text())
            # twoint = float(td[2].get_text())
            treeint = float(td[3].get_text().replace(',',''))
            # 根据索引获取到th内的信息,并放入listtwo中
            # listtwo = [th[0].get_text(),zerofloat,onefloat,twoint,treeint,th[1].contents[0].get_text()]
            listtwo = [th[0].get_text(),td[0].get_text(),td[1].get_text(),td[2].get_text(),treeint,th[1].contents[0].get_text()]
            # print(listtwo)
            # 最后将listtwo添加入listone的末尾
            listone.append(listtwo)
            # print(listone)

< td >和< th >标签内的索引内容：

保存入csv文件

def save_csv(list):
    print("list",list)
    with open('sina.csv', 'w',newline='', encoding='utf-8-sig') as f:
        wr = csv.writer(f)
        # 标题头
        wr.writerow(['成交时间','成交价','价格变动','成交量(手)','成交额(元)','性质'])
        # 把listone里所有爬取的数据写入csv文件
        wr.writerows(listone)
    f2.close()

求取平均值最大值最小值

def compute():
    with open('sina.csv','r',encoding='utf-8-sig') as f2:
        r = csv.reader(f2)
        #跳过表头的文字
        head = next(r)
        sum = 0
        max = 0
        min=100
        count = 0
        for row in r:
            # print(row)
            thisnum = float(row[1])
            sum = sum + thisnum
            if max<thisnum:
                max = thisnum
            if min> thisnum :
                min = thisnum
            count= count+1
        avg = sum/count
        print("最大值为",max)
        print("最小值为",min)
        print("平均值为",avg)
  	f2.close()

pandas库

def pandas_conput(gupiao,date):
    if os.path.exists('sina'+gupiao+date+'.csv'):
        data_csv = pd.read_csv(f'sina'+gupiao+date+'.csv',encoding='utf-8-sig')
        print(data_csv)
        # 定义表格的行列名称
        index_df = ['成交价', '成交量(手)', '成交额(元)']
        columns_df = ['最大', '最小', '平均']
        # 填入表格数据
        data_df = []
        for index in index_df:
            l = []
            data = data_csv[index]
            l.append(data.max())
            l.append(data.min())
            l.append(data.mean())
            data_df.append(l)
        stock_df = pd.DataFrame(data_df, index=index_df, columns=columns_df)
        print(stock_df)

    else:
        print("文件不存在，请先爬取")

整体代码

import pandas as pd
import requests
import time
import os
from bs4 import BeautifulSoup
import csv
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36 FS"}
# 全局定义一个listone用于之后存放爬取的信息
listone = []

def get_message(text,page):
    # 煮一碗soup
    soup = BeautifulSoup(text, 'lxml')
    # 这里我们可以打印看到如果是有数据的tbody里面会有内容，那么soup.tbody.string会为none
    # 但是如果是已经尾页没有数据的tbody里面会没有内容，那么soup.tbody.string会为空字符串
    # 我们可以根据这个区别来判断是否已经超过尾页
    # print(soup.tbody.string)

    if soup.tbody.string!=None:
        # 如果不是None说明tbody为空，已经爬取到尾页为空了
        # 此时打印到头信息，然后return 0告诉上一层并跳出循环停止爬取
        print('到头为空')
        return 0
    else:
        # 我们可以观察他整个tbody的结构，发现他的数据包含在tbody的每一个tr内
        # 对tbody里所有的tr进行遍历
        for each in soup.tbody.find_all('tr'):
            # 打印查看each内容
            # print(each)
            # 获取each内的th和td标签
            th = each.select('th')
            td = each.select('td')
            
            #这里如果用compute函数计算平均值需要对各个数据（特别是成交额有逗号）进行处理
            # zerofloat = float(td[0].get_text())
            # onefloat = float(td[1].get_text())
            # twoint = float(td[2].get_text())
            
			# 因为原文有逗号，所以直接用float（）强制转换会报错，所以我们需要先replace一下，如果用pandas计算其实可以不用强制转换为float，为字符串也行，但是compute必须替换为整型或浮点型进行计算
            treeint = float(td[3].get_text().replace(',',''))
            # 根据索引获取到th内的信息,并放入listtwo中
            # listtwo = [th[0].get_text(),zerofloat,onefloat,twoint,treeint,th[1].contents[0].get_text()]
            listtwo = [th[0].get_text(),td[0].get_text(),td[1].get_text(),td[2].get_text(),treeint,th[1].contents[0].get_text()]
            # print(listtwo)
            # 最后将listtwo添加入listone的末尾
            listone.append(listtwo)
            # print(listone)

# 返回0则说明不存在页面  sz000001
def gethtml(gupiao,date,page):
    # 拼接字符串url
    url = 'https://market.finance.sina.com.cn/transHis.php?symbol='+gupiao+'&date='+date+'&page='+str(page)
    # 打印访问url，方便后期查看进度
    print(url)
    try:
        r = requests.get(url=url,headers=headers)
        # None
        r.raise_for_status()
        # print("text的状态：",r.raise_for_status())
        r.encoding = r.apparent_encoding
        # 其实这里不管是不是尾页或是超过尾页text的状态都是none,都可以访问区别只是有没有数据而已
        # 所以这里我们无法根据request请求判断是否尾页，我们需要更进一层判断，即获取页面其中内容get_message

        flag = get_message(r.text,page)
        if flag == 0:
            #如果get_message返回给我们的为0则说明真的出现错误或者到达尾页flag为0，需要终止跳出循环了。
            return 0
    except Exception as result:
        print("错误原因：",result)
        return 0


def save_csv(list,gupiao,date):
    print("list",list)
    list1 = list
    with open('sina'+gupiao+date+'.csv', 'w',newline='', encoding='utf-8-sig') as f:
        wr = csv.writer(f)
        wr.writerow(['成交时间','成交价','价格变动','成交量(手)','成交额(元)','性质'])
        wr.writerows(listone)
    f.close()

    
def compute(gupiao,date):
    if os.path.exists('sina'+gupiao+date+'.csv'):
        with open('sina' + gupiao + date + '.csv', 'r', encoding='utf-8-sig') as f2:
            r = csv.reader(f2)
            head = next(r)
            sum = 0
            max = 0
            min = 100
            count = 0
            for row in r:
                # print(row)
                # 只单单计算了成交价
                thisnum = float(row[1])
                sum = sum + thisnum
                if max < thisnum:
                    max = thisnum
                if min > thisnum:
                    min = thisnum
                count = count + 1
            avg = sum / count
            print("最大值为", max)
            print("最小值为", min)
            print("平均值为", avg)
        f2.close()
    else:
        print("文件不存在，请先爬取")


def pandas_conput(gupiao,date):
    if os.path.exists('sina'+gupiao+date+'.csv'):
        data_csv = pd.read_csv(f'sina'+gupiao+date+'.csv',encoding='utf-8-sig')
        print(data_csv)
        # 定义表格的行列名称
        index_df = ['成交价', '成交量(手)', '成交额(元)']
        columns_df = ['最大', '最小', '平均']
        # 填入表格数据
        data_df = []
        for index in index_df:
            l = []
            data = data_csv[index]
            l.append(data.max())
            l.append(data.min())
            l.append(data.mean())
            data_df.append(l)
        stock_df = pd.DataFrame(data_df, index=index_df, columns=columns_df)
        print(stock_df)

    else:
        print("文件不存在，请先爬取")


def main():
    gupiao = input("请输入你想要查询的股票（例如sz000001）：")
    date = input("请输入你想要查询的日期（格式为2021-04-27）：")
    # 早期为了不每次都手动输入可以直接先写定参数，后期再加入input
    # 这里我其实是为了测试以下尾页的停止
    # flag = gethtml('sz000001', '2021-04-27', 80)
    # 一般来讲股票不太可能超过100页。我们这里取一个上限值就好
    # 后续如果碰到尾页会之间break跳出循环不会到100页
    for i in range(1,100):
        # 返回如果是0则说明爬取错误或者到达尾页，要跳出循环
        flag = gethtml(gupiao,date,i)
        # flag = gethtml('sz000001', '2021-04-27', i)
        # 最好需要间隔5s，否则太快爬取会被新浪封ip
        time.sleep(5)
        if flag==0:
            break
    print(listone)
    save_csv(listone,gupiao, date)
    # compute(gupiao,date)
    pandas_conput(gupiao, date)


main()

利用qyside和qyptgraph进行绘图

这一块的内容还不是很熟悉，代码也不够完善（有一些bug），仅供参考

import pandas as pd
import requests
import time
import os
from bs4 import BeautifulSoup
import csv
import sys
from random import randint
from PySide2 import QtWidgets
import numpy as np
import PySide2
from PySide2.QtWidgets import QApplication
from PySide2.QtWidgets import QTableWidgetItem
from PySide2.QtWidgets import QTableWidget
from PySide2.QtUiTools import QUiLoader
import pyqtgraph as pg
from pyqtgraph.Qt import QtGui, QtCore
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36 FS"}
# 全局定义一个listone用于之后存放爬取的信息
listone = []


class Stock:
    def __init__(self):

        loader = QUiLoader()

        # pyside2 一定要 使用registerCustomWidget
        # 来 注册 ui文件中的第三方控件，
        loader.registerCustomWidget(pg.PlotWidget)
        self.ui = loader.load("./pyside_ku/gupiao.ui")

        self.ui.find_but.clicked.connect(self.findonedate)
        self.ui.clear_but.clicked.connect(self.cleardata)


    def findonedate(self):
        # 清除画布
        self.ui.historyPlot.clear()
        # 获取股票代码，指标和日期
        gupiaodaima = self.ui.textedit.toPlainText()
        zhibiao = self.ui.comboBox.currentText()
        date = self.ui.date.date().toString('yyyy-MM-dd')
        # print(gupiaodaima,zhibiao,date)
        # 如果存在这个文件说明已经爬取过
        if os.path.exists('sina' + gupiaodaima + date + '.csv'):
            # 获取csv
            data_csv = pd.read_csv(f'sina' + gupiaodaima + date + '.csv', encoding='utf-8-sig')
            # print(data_csv)
            # 定义表格的行列名称
            index_df = ['成交价', '成交量(手)', '成交额(元)','成交时间']
            # 填入表格数据
            data_price = [] #成交价
            data_num = [] #成交量
            data_money=[] #成交额
            data_time = [] #成交时间

            data_price = data_csv[index_df[0]]
            data_num = data_csv[index_df[1]]
            data_money = data_csv[index_df[2]]
            data_time = data_csv[index_df[3]]
            length = len(data_time)

            data_time = data_time.tolist()
            data_num = data_num.tolist()
            data_money = data_money.tolist()
            data_price = data_price.tolist()

            x = np.arange(length)
            xTick = []
            for i in zip(x,data_time):
                xTick.append(i)
            xTick = [xTick]

            self.ui.tableWidget.setRowCount(length)
            self.ui.tableWidget.setColumnCount(4)

            for row in range(length):
                item = QTableWidgetItem()
                item.setText(str(data_price[row]))
                self.ui.tableWidget.setItem(row, 0, item)
            for row in range(length):
                item = QTableWidgetItem()
                item.setText(str(data_num[row]))
                self.ui.tableWidget.setItem(row, 1, item)
            for row in range(length):
                item = QTableWidgetItem()
                item.setText(str(data_money[row]))
                self.ui.tableWidget.setItem(row, 2, item)
            for row in range(length):
                item = QTableWidgetItem()
                item.setText(str(data_time[row]))
                self.ui.tableWidget.setItem(row, 3, item)
            stock_table = pandas_conput(gupiaodaima,date)
            # print(stock_table['最小']['成交价'])
            if zhibiao == index_df[0]:
                self.ui.historyPlot.plot(x, data_price)
                self.ui.maxtextedit.setPlainText(str(stock_table['最大']['成交价']))
                self.ui.mintextedit.setPlainText(str(stock_table['最小']['成交价']))
                self.ui.avgtextedit.setPlainText(str(stock_table['平均']['成交价']))
            elif zhibiao == index_df[1]:
                self.ui.historyPlot.plot(x, data_num)
                self.ui.maxtextedit.setPlainText(str(stock_table['最大']['成交量(手)']))
                self.ui.mintextedit.setPlainText(str(stock_table['最小']['成交量(手)']))
                self.ui.avgtextedit.setPlainText(str(stock_table['平均']['成交量(手)']))
            elif zhibiao == index_df[2]:
                self.ui.historyPlot.plot(x, data_money)
                self.ui.maxtextedit.setPlainText(str(stock_table['最大']['成交额(元)']))
                self.ui.mintextedit.setPlainText(str(stock_table['最小']['成交额(元)']))
                self.ui.avgtextedit.setPlainText(str(stock_table['平均']['成交额(元)']))
            else:
                print('错误！')
            xax = self.ui.historyPlot.getAxis('bottom')
            xax.setTicks(xTick)


        else:
            choise2 = input("文件不存在，您要爬取么？(0:不需要;1:需要):")
            if (choise2 == '0'):
                pass
            elif (choise2 == '1'):
                paqu(gupiaodaima,date)

    def cleardata(self):
        self.ui.historyPlot.clear()
        self.ui.textedit.setPlainText('sz000001')
        myPythonicDate = '2021-04-27'
        self.ui.date.setDate(QtCore.QDate.fromString(myPythonicDate, 'yyyy-MM-dd'))



def get_message(text,page):
    # 煮一碗soup
    soup = BeautifulSoup(text, 'lxml')
    # 这里我们可以打印看到如果是有数据的tbody里面会有内容，那么soup.tbody.string会为none
    # 但是如果是已经尾页没有数据的tbody里面会没有内容，那么soup.tbody.string会为空字符串
    # 我们可以根据这个区别来判断是否已经超过尾页
    # print(soup.tbody.string)

    if soup.tbody.string!=None:
        # 如果不是None说明tbody为空，已经爬取到尾页为空了
        # 此时打印到头信息，然后return 0告诉上一层并跳出循环停止爬取
        print('到头为空')
        return 0
    else:
        # 我们可以观察他整个tbody的结构，发现他的数据包含在tbody的每一个tr内
        # 对tbody里所有的tr进行遍历
        for each in soup.tbody.find_all('tr'):
            # 打印查看each内容
            # print(each)
            # 获取each内的th和td标签
            th = each.select('th')
            td = each.select('td')
            treeint = float(td[3].get_text().replace(',',''))
            # 根据索引获取到th内的信息,并放入listtwo中
            # listtwo = [th[0].get_text(),zerofloat,onefloat,twoint,treeint,th[1].contents[0].get_text()]
            listtwo = [th[0].get_text(),td[0].get_text(),td[1].get_text(),td[2].get_text(),treeint,th[1].contents[0].get_text()]
            # print(listtwo)
            # 最后将listtwo添加入listone的末尾
            listone.append(listtwo)
            # print(listone)
# 返回0则说明不存在页面  sz000001
def gethtml(gupiao,date,page):
    # 拼接字符串url
    url = 'https://market.finance.sina.com.cn/transHis.php?symbol='+gupiao+'&date='+date+'&page='+str(page)
    # 打印访问url，方便后期查看进度
    print(url)
    try:
        r = requests.get(url=url,headers=headers)
        # None
        r.raise_for_status()
        # print("text的状态：",r.raise_for_status())
        r.encoding = r.apparent_encoding
        # 其实这里不管是不是尾页或是超过尾页text的状态都是none,都可以访问区别只是有没有数据而已
        # 所以这里我们无法根据request请求判断是否尾页，我们需要更进一层判断，即获取页面其中内容get_message

        flag = get_message(r.text,page)
        if flag == 0:
            #如果get_message返回给我们的为0则说明真的出现错误或者到达尾页flag为0，需要终止跳出循环了。
            return 0
    except Exception as result:
        print("错误原因：",result)
        return 0
def save_csv(list,gupiao,date):
    print("list",list)
    list1 = list
    with open('sina'+gupiao+date+'.csv', 'w',newline='', encoding='utf-8-sig') as f:
        wr = csv.writer(f)
        wr.writerow(['成交时间','成交价','价格变动','成交量(手)','成交额(元)','性质'])
        wr.writerows(listone)
    f.close()
def compute(gupiao,date):
    # 这里只计算了成交价的最大值最小值平均值
    if os.path.exists('sina'+gupiao+date+'.csv'):
        with open('sina' + gupiao + date + '.csv', 'r', encoding='utf-8-sig') as f2:
            r = csv.reader(f2)
            head = next(r)
            sum = 0
            max = 0
            min = 100
            count = 0
            for row in r:
                # print(row)
                thisnum = float(row[1])
                sum = sum + thisnum
                if max < thisnum:
                    max = thisnum
                if min > thisnum:
                    min = thisnum
                count = count + 1
            avg = sum / count
            print("最大值为", max)
            print("最小值为", min)
            print("平均值为", avg)
        f2.close()
    else:
        print("文件不存在，请先爬取")
def pandas_conput(gupiao,date):
    if os.path.exists('sina'+gupiao+date+'.csv'):
        data_csv = pd.read_csv(f'sina'+gupiao+date+'.csv',encoding='utf-8-sig')
        print(data_csv)
        # 定义表格的行列名称
        index_df = ['成交价', '成交量(手)', '成交额(元)']
        columns_df = ['最大', '最小', '平均']
        # 填入表格数据
        data_df = []
        for index in index_df:
            l = []
            data = data_csv[index]
            l.append(data.max())
            l.append(data.min())
            l.append(data.mean())
            data_df.append(l)
        stock_df = pd.DataFrame(data_df, index=index_df, columns=columns_df)
        return stock_df

    else:
        print("文件不存在")


# 保存股票信息入本地
def paqu(gupiao,date):

    for i in range(1,100):
        flag = gethtml(gupiao,date,i)
        # 最好需要间隔5s，否则太快爬取会被新浪封ip
        time.sleep(5)
        if flag==0:
            break
    save_csv(listone,gupiao, date)
    pandas_conput(gupiao, date)

# 查询股票行情图
def chaxun():
    app = QApplication([])
    stock = Stock()
    stock.ui.show()
    app.exec_()

def main():
    while(1):
        choise = input('您需要什么服务？(0：保存股票信息入本地；1：查询股票行情图; 2:退出服务):')
        if choise=='0':
            gupiao = input("请输入你想要查询的股票（例如sz000001）：")
            date = input("请输入你想要查询的日期（格式为2021-04-27）：")
            paqu(gupiao,date)
        elif choise=='1':
            chaxun()
        elif choise=='2':
            break
        else:
            print("错误输入请重新输入")

main()

效果展示

成交价

成交量

Python爬虫TLS dme. Python爬虫零基础入门爬虫 python
TLS指纹校验原理和绕过浏览器可以正常访问，但是用requests发送请求失败。后端是如何监测得呢？为什么浏览器可以返回结果，而requests模块不行呢？https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例：ascii2dhttps://ascii2d.net/importrequestsres
python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解嘻嘻哈哈学编程程序员 python 爬虫 selenium
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！2.2访问页面2.3查找元素2.3.1单个元素下面
排序算法：冒泡排序（Python）娱乐不打烊丶排序算法算法数据结构
思路：大家一定都喝过汽水吧，汽水中常常有许多小小的气泡，往上飘，这是因为组成小气泡的二氧化碳比水要轻，所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序，正是因为这种排序算法的每一个元素都可以向小气泡一样，根据自身大小，一点一点向着数组的一侧移动。一图解百惑，上图！那么，话不多说，上代码！defbubble_sort(input_list):#冒泡排序：每次循环，锁定一个最值，并朝着最大或
supervisord 命令介绍和使用案例 lisanmengmeng linux 命令工具系统运维 shell编程服务器 linux 运维
supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具，用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程（daemon），并监控进程状态，在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理：能够启动、停止、重启和关闭进程.自动重启：监控进程状态，并在进程崩溃时
ptython setup.py install 设置python包编译时的并行数 leo0308 基础知识 Python python pytorch3d
通过源码编译安装pytorch3d的时候，直接执行pythonsetup.pyinstall时，默认开的并行数很多，有10几个，直接导致机器卡死。通过设置下面的环境变量，可以设置较小的并行数，避免占用过多的资源。exportMAX_JOBS=4设置后，同时只有4个编译的进程。
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
GUI编程（window系统→Linux系统）诚信爱国敬业友善心得 linux python gui
最近有个项目需要将windows系统的程序往Linux系统上面移植，由于之前程序没有考虑过多平台兼容的问题，导致部分功能不可用以下是对近期遇到的问题的总结，以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中，安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块：使用pip安装模块时，建议使用--user选项，避免需要管理员权限：bash复制pipinsta
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
Linux升级Anacodna并配置jupyterLab 伪_装环境部署 linux 服务器 Anaconda python jupyter
在使用Anaconda的过程中，随着项目和需求的发展，可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前，建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本：condainfo你会看到类似以下的输出，其中包含了当前Python
【Linux】删除Conda虚拟环境不是伍壹 Linux linux conda 运维
1、查看当前系统的conda虚拟环境condainfo--envscondaenvlist2、创建虚拟的环境condacreate-n（你的环境名字）python=（你需要的版本号，如（3.7,3.8,3.10））3、查看安装了哪些包condalist4、删除虚拟环境condaremove-nname--all5、删除虚拟环境中的包condaremove--name$（需要删除的环境名字）$（需要
动态规划之背包问题--python版本我是小码搬运工 #python基础动态规划背包问题 python版本
动态规划之背包问题–python版本问题已知一个最大量的背包，给定一组给定固定价值和固定体积的物品，求在不超过最大值的前提下，能放入背包中的最大总价值。解题思路该问题是典型的动态规划问题，分为三种不同的类型（0-1背包问题、完全背包和多重背包问题）解题关键–状态转移表达式：B(k,C)=max(B(k−1,C),B(k−1,C−ci)+vi)B(k,C)=max(B(k-1,C),B(k-1,C-
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
动态规划之背包问题的Python实现名侦探debug Python 数据结构 python 数据结构动态规划求解
目录1.问题描述2.动态规划之网格法3.python实现1.问题描述题目来源于《算法图解》第9章练习题9.2，如下图所示。对于背包问题，通常的做法有列举法、贪婪算法和动态规划（1）列举法：列举出所有的可能情况，再选择最优解，但当情况很多时，这种算法复杂度很高（2）贪婪算法：在容量允许范围内，每次都拿剩余物品中价值最高的，贪婪算法能够快速解决复杂度很高的问题，但通常得到的是次优解，但就对这个题目而言
总结10个Python赚钱的接单平台兼职月入5000+ begefefsef 面试学习路线阿里巴巴 android 前端后端
前言“如果说当下什么编程语言最靠谱或者比较适合搞副业？”答案肯定100%是：Pythonpython是所有语法中最简单易上手的语言，不需要特别的的英语词汇量，逻辑思维也不需要很差就能上手。而且学会了之后就能编写代码爬取各种数据，制作各种图表，提升工作效率。而且还能利用业余时间接点私活，一个月轻松收入过万不是问题，这样的生活他不香吗？今天就给大家盘点几个基本入门接私活的资源，让你轻松学python，
大学生学完python靠几个接单网站兼职，实现经济独立「已注销」 python 开发语言
大学生学完python靠几个接单网站兼职，实现经济独立程序员就是当今时代的手艺人，程序员可以通过个人的技术来谋生。而在工作之余接私单可以作为一种创富的途径，受到程序员的广泛认可。说句实在话，现在这个时代，很多人仅靠主业顶多维持基本生活，想让自己、家人生活好一点很难。我接的私活并不算多，加起来也就几万左右，只能算一半，我想把一些经验分享出来，毕竟现在生活都不容易，能赚一点是一点。一、程序员接活、新手
Python wifi 安装手机app yichengace python
目的当测试机数量越来越多时，测试包的安装会成为一个问题，用wifi安装来解决这个问题，并且用脚本语言来批量控制思路思路就是py调用pc端的adb命令，向手机发送请求，无线是因为，如果未来测试机越来越多，一台电脑的usb接口数量肯定不够准备工具python，adb，pycharm，测试用app，这里选择qq（https://qd.myapp.com/myapp/qqteam/AndroidQQ/mo
深度学习之目标检测的常用标注工具铭瑾熙人工智能机器学习深度学习深度学习目标检测目标跟踪
1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析西攻城狮北 python 爬虫开发语言实战案例
引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
PyCharm 集成 DeepSeek：本地运行 or API 直连？打造你的 AI 编程神器！ AI云极【AI智能系列】pycharm 人工智能 ide deepseek
在AI赋能编程的时代，如何让AI辅助写代码，提升开发效率？DeepSeek作为一款开源、强大、免费的AI编程助手，结合PyCharm，能够大幅提升Python编程体验。今天，我们就来详细讲解如何在PyCharm中接入DeepSeek，无论你想使用本地部署的DeepSeek，还是官方API版本，都能轻松实现！为什么选择DeepSeek+PyCharm？DeepSeekR1采用6710亿参数的MoE（
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
【CUDA】Pytorch_Extensions joker D888 深度学习 pytorch python cuda c++深度学习
【CUDA】Pytorch_Extensions为什么要开发CUDA扩展？当我们在PyTorch中实现自定义算子时，通常有两种选择：使用纯Python实现（简单但效率低）使用C++/CUDA扩展（高效但需要编译）对于计算密集型的操作（如神经网络中的自定义激活函数），使用CUDA扩展可以获得接近硬件极限的性能。本文将以实现一个多项式激活函数x²+x+1为例，展示完整的开发流程。完整CUDA扩展代码解
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
本地搭建小型 DeepSeek 并进行微调非著名架构师大模型知识文档智能硬件人工智能大数据大模型 deepseek
本文将指导您在本地搭建一个小型的DeepSeek模型，并进行微调，以处理您的特定数据。1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选，用于GPU加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/deepseek-ai/deepseek.gitcddeepseek3.安装依赖bash复制pipinstall
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
python做一个注册界面_python如何做一个登录注册界面 weixin_39824033 python做一个注册界面
python做一个登录注册界面的方法：首先初始化一个window界面，并使用画布实现欢迎的logo；然后用代码实现登录和注册按钮；接着并进行登录判断代码；最后完成注册界面即可。【相关学习推荐：python视频教程】python做一个登录注册界面的方法：一、登录界面1、首先初始化一个window界面window=tk.Tk()window.title('WelcometoMofanPython')w
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D