UncoDong

使用Selenium自动爬取腾讯街景

注：因为使用这种方式不太方便，因此又写了另一种爬取街景的方式，使用fillder进行腾讯街景爬虫，完成API key申请后去看新的博客即可

文章目录

- 1. 腾讯静态街景API申请
- 2. Selenium编程过程
- - 2.1 启动selenium，打开腾讯街景页面（这段也可以手动操作，由于不是必须，没配图）
  - 2.2 手动点击界面，并手动启动Flash
  - 2.3 定义自动点击flash的函数
  - 2.4 定义获取页面信息的函数
  - 2.5 定义得到白色箭头的函数
  - - 注意：直接的坐标是错误的
  - 2.6 正确的模拟点击
- 3 自动爬取的完整代码
- - 3.1 第一步：输入当前要爬取街道的名字(同时也是照片保存到的文件名)
  - 3.2 第二步：手动选择起点
  - 3.3 第三步：运行爬取函数

1. 腾讯静态街景API申请

参照静态街景图官方文档https://lbs.qq.com/panostatic_v1/index.html，可以知道为了使用腾讯街景API，首先需要申请开发者key，申请地址在这里https://lbs.qq.com/dev/console/key/add，按照要求填写，即可等待审核使用。

需要注意的是，在获得key后，还需要再写邮件开通一下获取静态图的功能。写完邮件后，这个key就可以获取街景了。

2. Selenium编程过程

没有安装的话，可以看我之前的博客安装Selenium《python配置selenium 火狐+谷歌Chrome》。

2.1 启动selenium，打开腾讯街景页面（这段也可以手动操作，由于不是必须，没配图）

首先导入库，并打开腾讯位置服务的页面

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import cv2
import numpy as np
import time

opts = webdriver.FirefoxOptions()
option_profile = webdriver.FirefoxProfile()
option_profile.set_preference("plugin.state.flash",2)
browser = webdriver.Firefox(firefox_profile=option_profile,options=opts)
# 使用浏览器访问网址
browser.get('https://lbs.qq.com/tool/streetview/index.html')

由于嵌套了另一个页面，因此先要转换到那个页面上

browser.switch_to.frame('iframe')

寻找到更换当前城市的按钮

# 阅读HTML源代码可看到，这是在一层层的往里扒
city = browser.find_elements_by_id('cur_city')
change_city = city[0].find_elements_by_class_name('change_city')
span = change_city[0].find_elements_by_tag_name('span')

点击这个按钮，就会弹出来选择城市的框

span[0].click()
# 这里可以得到所有城市的标签
city = browser.find_elements_by_id('city')
city_spans = city[0].find_elements_by_tag_name('span')

找到xx市，并执行点击切换

for each in city_spans:
    if '北京' in each.text:
        each.click()

找到搜索框所在的位置

input_box = browser.find_elements_by_id('input_box')

每次先执行清空操作，再输入要查询的位置

input_box[0].clear()
input_box[0].send_keys('北京大学')

找到搜索按钮，并直接点击

search_button =  browser.find_elements_by_id('btn_search')
search_button[0].click()

找到街景按钮，并点击

street_button = browser.find_elements_by_id('panel')
street_button[0].click()

2.2 手动点击界面，并手动启动Flash

这步只能手动操作~后面的就是自动的了

2.3 定义自动点击flash的函数

首先找到flash元素，然后定义在flash上通过坐标进行点击的函数

'''
Summary:
    定义点击flash函数
    xy是坐标
    left_click用来区分左右键
'''

def click_flash(x,y,left_click=True):
    # 找到flash元素
    flash = browser.find_element_by_id('_panoSwf_0')
    if left_click:
        ActionChains(browser).move_to_element_with_offset(flash,x,y).click().perform()
    else:
        ActionChains(browser).move_to_element_with_offset(flash,x,y).context_click().perform()

通过右键执行这个函数，来查看当前点击的位置

2.4 定义获取页面信息的函数

定义寻找当前页面API的函数

'''
Summaty:
    用来寻找当前页面的API
Return:
    API字符串
'''
def Find_API():
    a = browser.find_elements_by_tag_name('a')
    for each in a:
        if '开发' in each.text:
            return each.text
    return None
'''
Summaty:
    得到API的pano值
Return:
    pano字符串
'''
def Get_pano(API):
    if API == None:
        return None
    API = API.split('pano=')[1]
    pano = API.split('&')[0]
    return pano

# 第二种更简单的方法
def Get_pano2():#(API):
    pano = browser.find_elements_by_id('pano_id')
    return pano[0].get_attribute('value')

# 调用获取pano函数，验证结果
print(Get_pano(Find_API()))
print(Get_pano2())

可视化的时候需要获取到该照片的地理坐标，因此需要通过pano反向获得坐标，用到上一次调用的API


import json         # 解析json文件
import requests     # 下载东西用的request 
# 根据pano得到地理坐标
"""
参数：
     id        - pano
     raduis    - 街景的范围
     key       - 开发者秘钥
返回值：
     pano      - 街景的pano
"""
def GetLatLng(id,raduis=100,key='你的密钥'):
    # 和上面一样的拼接url
    panourl = 'https://apis.map.qq.com/ws/streetview/v1/getpano?'
    panourl = panourl + 'id=' + str(id) + '&'
    panourl = panourl + 'raduis=' + str(raduis) + '&'
    panourl = panourl + 'key=' + str(key)
    #print('url地址：',panourl)
    
    # 得到返回的json
    r = requests.get(panourl) 
    panojson = r.text
    
    # 解析json格式为字典类型
    json_dic = json.loads(panojson)
    #print(json_dic)
    # 返回纬度，经度
    lat = json_dic['detail']['location']['lat']
    lng = json_dic['detail']['location']['lng']
    
    return lat,lng

# 测试获取经纬度的函数
GetLatLng(Get_pano(Find_API()))

2.5 定义得到白色箭头的函数

得到白色箭头需要两个步骤

截图当前flash
使用opencv来分离图象首先完成第一步，截图flash，用的是下面这一行，会在当前目录下保存一个flash.png的图片

flash = browser.find_element_by_id('_panoSwf_0')
flash.screenshot('flash.png')

调用cv2的库读取该图象，并使用findContours轮廓检测函数来获取边框，这里我们找白色物体的边框，运行下面代码就可以得到结果

# 模拟点击一下屏幕出现白色箭头
click_flash(200,200)
# 等待两秒钟加载完箭头
time.sleep(2)
# 保存截图
flash.screenshot('flash.png')
# 使用cv2加载截图
img = cv2.imread('flash.png')  
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)  
ret, binary = cv2.threshold(gray,250,255,cv2.THRESH_BINARY)  
# 调用轮廓检测函数
contours, hierarchy = cv2.findContours(binary,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)  
# 将得到的轮廓画出来
cv2.drawContours(img,contours,-1,(0,0,255),3)  
cv2.imshow("img", img)  
cv2.waitKey(0)

可以看到所有白色的轮廓都被检测出来了，如下图

可以看到contours中是由很多点的列表组成的，就是这些点绘制出了上面的图象

contours
[array([[[ 33, 648]]], dtype=int32),
 array([[[  4, 646]]], dtype=int32),
 .
 .
 .
 array([[[ 74, 645]]], dtype=int32)]

接下来设置阈值，过滤掉没用的点，先从数量开始过滤，看一看结果

# 过滤后的contours
contours_filter = []
for each in contours:
    if each.size >100:
        # 只保留大于100的
        contours_filter.append(each)
mg = cv2.imread('flash.png')  
cv2.drawContours(img,contours_filter,-1,(0,0,255),3)  
  
cv2.imshow("img", img)  
cv2.waitKey(0)

接下来统计筛选出来的轮廓坐标的平均值，这样就可以获得坐标来进行点击了

contours_mean = []
contours_mean_center = []
for contour in contours_filter:
    # 变成好处理的形状
    contour = contour.reshape(-1,2)
    # 计算平均值
    xmean,ymean = contour.mean(axis=0)
    if ymean >300:   
        contours_mean.append(contour)
        contours_mean_center.append((xmean,ymean))
contours_mean_center

输出：[(396.56, 468.25333333333333), (383.97014925373134, 394.5074626865672)]

注意：直接的坐标是错误的

根据返回值，用click_flash的右键看看都是在哪个位置

click_flash(311.0782608695652, 423.62608695652176,False)

这是因为我们截图保存的图片尺寸和网页中原始flash的尺寸不一样，通过以下方式查看flash的长宽

flash.size
输出：{'height': 520.0, 'width': 621.0}

而我们保存的图片大小为

img.shape
输出：(650, 776, 3)

因此需要在保存图片的时候，修改成网页中的大小，才能保证点击位置是正确的，在保存的时候填上这么一句话img = cv2.resize(img,(int(flash.size['width']),int(flash.size['height'])))

# 这些都是复制之前的
click_flash(200,200)
time.sleep(2)
flash.screenshot('flash.png')
img = cv2.imread('flash.png')

# 这里是添加的
img = cv2.resize(img,(int(flash.size['width']),int(flash.size['height'])))

# 这些都是复制之前的
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)  
contours, hierarchy = cv2.findContours(binary,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)  
# 过滤后的contours
contours_filter = []
for each in contours:
    if each.size >100:
        # 只保留大于100的
        contours_filter.append(each)      
#cv2.drawContours(img,contours_filter,-1,(0,0,255),3)  
#cv2.imshow("img", img)  
#cv2.waitKey(0)  

contours_mean = []
contours_mean_center = []
for contour in contours_filter:
    # 变成好处理的形状
    contour = contour.reshape(-1,2)
    # 计算平均值
    xmean,ymean = contour.mean(axis=0)
    if ymean >300:   
        contours_mean.append(contour)
        contours_mean_center.append((xmean,ymean))
contours_mean_center
输出：[(396.56, 468.25333333333333), (383.97014925373134, 394.5074626865672)]

2.6 正确的模拟点击

现在再来点击一下，就可以点到对应的箭头了

点击一下试试，可以看到街景移动了

click_flash(380.0625, 340.828125)

3 自动爬取的完整代码

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from  selenium.webdriver.chrome.options  import  Options
import os
import json         # 解析json文件
import requests     # 下载东西用的request 

import cv2
import numpy as np
import time


from functools import cmp_to_key 


opts = webdriver.FirefoxOptions()
option_profile = webdriver.FirefoxProfile()
option_profile.set_preference("plugin.state.flash",2)
browser = webdriver.Firefox(firefox_profile=option_profile,options=opts)


# 使用浏览器访问网址
browser.get('https://lbs.qq.com/tool/streetview/index.html')

browser.switch_to.frame('iframe')  


# 阅读HTML源代码可看到，这是在一层层的往里扒
city = browser.find_elements_by_id('cur_city')
change_city = city[0].find_elements_by_class_name('change_city')
span = change_city[0].find_elements_by_tag_name('span')

span[0].click()

city = browser.find_elements_by_id('city')
city_spans = city[0].find_elements_by_tag_name('span')

for each in city_spans:
    if '武汉' in each.text:
        each.click()
        
        

'''
Summaty:
    用来寻找当前页面的API
Return:
    API字符串
'''
def Find_API():
   
    a = browser.find_elements_by_tag_name('a')
    for each in a:
        if '开发' in each.text:
            return each.text
    return None
'''
Summaty:
    得到API的pano值
Return:
    pano字符串
'''
def Get_pano():#(API):
    pano = browser.find_elements_by_id('pano_id')
    return pano[0].get_attribute('value')




# 根据pano得到地理坐标
"""
参数：
     id        - pano
     raduis    - 街景的范围
     key       - 开发者秘钥
返回值：
     pano      - 街景的pano
"""
def GetLatLng(id,raduis=100,key='你的密钥'):
    # 和上面一样的拼接url
    panourl = 'https://apis.map.qq.com/ws/streetview/v1/getpano?'
    panourl = panourl + 'id=' + str(id) + '&'
    panourl = panourl + 'raduis=' + str(raduis) + '&'
    panourl = panourl + 'key=' + str(key)
    #print('url地址：',panourl)
    
   
    #print(json_dic)
    lat = ''
    lng = ''
    while lat == '' and lng == '':
        try:
            # 得到返回的json
            r = requests.get(panourl) 
            panojson = r.text

            # 解析json格式为字典类型
            json_dic = json.loads(panojson)
            lat = json_dic['detail']['location']['lat']
            lng = json_dic['detail']['location']['lng']
        except:
           ''''''
        
    
    return lat,lng


"""
参数：
     size  - 街景图片尺寸
     pano  - 街景ID
     heading - 与正北方向角度，范围： [0,360]，默认0
     pitch   - 与平视的夹角，范围[-90,20]，默认0
     key     - 开发者秘钥
返回值：
     mapurl  - 地图的url
'''
def GetTencentMapUrl(pano,size='640x480',heading=0,pitch=0,key='你的密钥'):
    mapurl = 'https://apis.map.qq.com/ws/streetview/v1/image?'
    mapurl = mapurl + 'size=' + str(size) + '&'
    mapurl = mapurl + 'pano=' + str(pano) + '&'
    mapurl = mapurl + 'heading=' + str(heading) + '&'
    mapurl = mapurl + 'pitch=' + str(pitch) + '&'
    mapurl = mapurl + 'key=' + str(key)
    #print('url地址',mapurl)
    return mapurl

"""
参数：
     filname  - 要保存的文件名
     url      - 下载文件的链接 
"""

def DownloadFile(filname,url):
    # 得到该url的数据
    r = requests.get(url) 
    
    # 将数据写入文件
    with open(filname, "wb") as picfile:
        picfile.write(r.content)

'''
Summary:
    点击函数
'''
def click_flash(x,y,left_click=True):
    flash = browser.find_element_by_id('_panoSwf_0')
    if left_click:
        ActionChains(browser).move_to_element_with_offset(flash,x,y).click().perform()
    else:
        ActionChains(browser).move_to_element_with_offset(flash,x,y).context_click().perform()
    ActionChains(browser).release().perform()
 

'''
Summary:
    左右移动一点点角度
'''
def MoveFlashCamera_LR():
    flash = browser.find_element_by_id('_panoSwf_0')
    ActionChains(browser).move_to_element_with_offset(flash,20,100).click_and_hold().perform()
    ActionChains(browser).move_by_offset(xoffset=100,yoffset=0).perform()
    ActionChains(browser).release().perform()


'''
Summary:
    从counters中选择可能是箭头的counter
'''
def ChooseCounter(contours):
    centers_return = []
    contours_return = []
    for each in contours:
        # 首先要够大
        if each.size >50:
            y = each.reshape(-1,2)
            xmean,ymean = y.mean(axis=0)
            # 竖着的位置在350以下 横着的在
            if ymean >300 and xmean > 200 and xmean < 400:   
                contours_return.append(each)
                centers_return.append((xmean,ymean))
    return centers_return,contours_return

'''
Summary:
    获取flash.png的counters
'''
def AnalysisFlash(index = 0):
    flash = browser.find_element_by_id('_panoSwf_0')
    click_flash(200,200)
    time.sleep(2)
    flash.screenshot('flash.png')
    img = cv2.imread('flash.png')
    img = cv2.resize(img,(int(flash.size['width']),int(flash.size['height'])))
    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)  
    ret, binary = cv2.threshold(gray,250,255,cv2.THRESH_BINARY)   
    contours, hierarchy = cv2.findContours(binary,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)  
    centers_return,contours_return = ChooseCounter(contours)
    # 保存图片
    cv2.drawContours(img,contours_return,-1,(0,0,255),3)  
    cv2.imwrite('auto/save_{0}.jpg'.format(index), img)
    return centers_return

# 自定义排序
def fun_1(x,y):
    if x[1]>y[1]:
        return 1
    if x[1]<y[1]:
        return -1
    return 0

SavePath = "./"
NowPath = "./"
zero_pano = Get_pano()
MySteps = [False,False,False]

# 自动爬取num个图片
def AutoMoveAndSave(num):
    global SavePath
    global NowPath
    NowPath = SavePath
    # 已保存的pano名
    save_pano = []
    # 初始化pano
    pano = Get_pano()
    # 角度
    heading_list = [315,45,135,225]
   
   
    for i in range(num):
        if pano not in save_pano:
            for heading in heading_list:
                # 获取当前的pano，并保存文件
                # 得到经纬度作为文件名
                lat,lng = GetLatLng(pano)
                url = GetTencentMapUrl(pano = pano,heading = heading)
                filename = 'StreetViews/%s/%s_%s_%s.jpg'%(SavePath,str(lat),str(lng),str(heading))
                DownloadFile(filename,url)
            save_pano.append(pano)
        # 稍微旋转一个角度
        else:
            print('旋转一个角度')
            time.sleep(0.5)
            MoveFlashCamera_LR()
        # 拉回原来的角度
        #click_flash(550,90)
        # 更新下标
        index = i
        
        centers_return = AnalysisFlash(pano)
        centers_return = sorted(centers_return, key = cmp_to_key(fun_1))
        print('第{0}步'.format(i),pano)
        # 遍历所有的，都尝试一边点击
        for x,y in centers_return:
            print('尝试',(x,y))
            click_flash(x, y)
            now_pano =  Get_pano()
            # 当不等于的时候说明移动了
            if pano != now_pano:
                pano = now_pano             
                break

# 得到保存路径
def GetSavePath(path):
    global SavePath
    SavePath = path
    makepath = "StreetViews/"+path
    if os.path.exists(makepath) == False:
        os.mkdir(makepath)
    else:
        print('已经存在%s文件夹，如果里面有原来爬的图片的话，接下来保存的图片会和它们混杂，请慎重考虑'%(makepath))
    print('\n当前文件保存路径：'+makepath)

def ChangeCity(path):
    input_box = browser.find_elements_by_id('input_box')
    input_box[0].clear()
    input_box[0].send_keys(path)
    search_button =  browser.find_elements_by_id('btn_search')
    search_button[0].click()

3.1 第一步：输入当前要爬取街道的名字(同时也是照片保存到的文件名)

inputpath = '财大'
ChangeCity(inputpath)
GetSavePath(inputpath)

3.2 第二步：手动选择起点

这一步需要去页面操作，修改当前的街景，一定要做！

3.3 第三步：运行爬取函数

如果出现报错信息，自己手动调整一下flash镜头的位置就好。比如让白色箭头冲前，或者调整俯仰角度(让镜头向下看，使白色箭头的面积最大)

AutoMoveAndSave(600)

Python连接SQL SEVER数据库全流程 m0_74824865 面试学习路线阿里巴巴数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
网络安全工具 AWVS 与 Nmap：原理、使用及代码示例阿贾克斯的黎明网络安全安全 web安全网络
目录网络安全工具AWVS与Nmap：原理、使用及代码示例AWVS：Web漏洞扫描的利器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用AWVSAPI进行扫描）Nmap：网络探测与端口扫描的神器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用Nmap进行扫描）总结在网络安全领域，AWVS（AcunetixWebVulnerabilityScanner）和Nmap是
深入剖析 Weblogic、ThinkPHP、Jboss、Struct2 历史漏洞阿贾克斯的黎明网络安全 web安全
目录深入剖析Weblogic、ThinkPHP、Jboss、Struct2历史漏洞一、Weblogic漏洞（一）漏洞原理（二）漏洞利用代码（Python示例）（三）防范措施二、ThinkPHP漏洞（一）漏洞原理（二）漏洞利用代码（示例，假设存在漏洞的代码片段）（三）防范措施三、Jboss漏洞（一）漏洞原理（二）漏洞利用代码（Java示例，用于构造恶意序列化数据）（三）防范措施四、Struct2漏洞
【Python专栏】Python的发展历程雾岛心情 Python入门到精通 python 开发语言
Python的创始人为吉多·范罗苏姆（GuidovanRossum），人称龟叔1989年，为了打发圣诞节假期，Guido开始写Python语言的编译器。Python这个名字，来自Guido所挚爱的电视剧MontyPython’sFlyingCircus。他希望这个新的叫做Python的语言，能符合他的理想：创造一种C和shell之间，功能全面，易学易用，可拓展的语言。Python的具体发展历史和版
Stable diffusion 3.5本地运行环境配置记录寸先生的牛马庄园扩散模型 stable diffusion
1.环境配置创建虚环境condacreate-nsd3.5python=3.10Pytorch(>2.0)condainstallpytorch==2.2.2torchvision==0.17.2torchaudio==2.2.2pytorch-cuda=12.1-cpytorch-cnvidiaJupyter能使用Anaconda虚环境condainstallipykernelpython-mi
阿里巴巴DIN模型原理与Python实现 eso1983 python 开发语言算法推荐算法
阿里巴巴的DeepInterestNetwork(DIN)是一种用于点击率预测（CTR）的深度学习模型，特别针对电商场景中用户兴趣多样化和动态变化的特性设计。其核心思想是通过注意力机制动态捕捉用户历史行为中与当前候选商品相关的兴趣。1.DIN模型原理1.核心问题传统推荐模型（如Embedding+MLP）将用户历史行为视为固定长度的向量，忽略了用户兴趣的多样性。例如，用户历史行为中可能包含多个互不
pytorch基础-比较矩阵是否相等 yuweififi pytorch 人工智能
1、使用NumPy库NumPy是Python中用于科学计算的常用库，它提供了array_equal和allclose函数来判断矩阵是否相等。array_equal用于精确比较，allclose用于考虑一定误差范围的近似比较，适合浮点数矩阵。importnumpyasnp#创建示例矩阵matrix_a=np.array([[1,2,3],[4,5,6]])matrix_b=np.array([[1,
一学就会：A*算法详细介绍（Python）不去幼儿园人工智能（AI）#启发式算法算法 python 人工智能机器学习开发语言
本篇文章是博主人工智能学习以及算法研究时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章分类在启发式算法专栏：【人工智能】-【启发式算法】（6）---《一学就会：A*算法详细介绍（Python）》一学就会：A*算法详细介绍（Python）目录A*算法介绍A*算法的核心概念A*算法的特点A*算法示例：迷宫
电竞赛事数据分析：LNG vs BLG的胜利背后烧瓶里的西瓜皮 python 自动驾驶人工智能数据可视化机器学习
电竞赛事数据分析：LNGvsBLG的胜利背后摘要在S14瑞士轮次日，LNG以1:0战胜BLG，取得了开赛二连胜。本文将通过Python进行数据处理与分析，结合机器学习算法预测比赛结果，并使用数据可视化工具展示关键指标。通过对这场比赛的数据深入挖掘，揭示LNG获胜的关键因素。引言电子竞技（Esports）已经成为全球范围内的一项重要娱乐活动，而《英雄联盟》（LeagueofLegends,LoL）作
如何使用Python编程实现捕获笔记本电脑麦克风的音频并通过蓝牙耳机实时传输 winfredzhang python 音视频实时传输蓝牙耳机
在现代的工作和生活环境中，音频传输的需求日益增加。无论是远程会议、在线教育，还是家庭娱乐，音频的实时传输都扮演着至关重要的角色。今天，我将向大家介绍一个简单而实用的应用程序，它能够捕获笔记本电脑麦克风的音频，并通过蓝牙耳机实时传输。这款应用程序特别适用于需要在会议室等场景中远程听取声音的情况。接下来，我将详细讲解这个应用程序的实现过程，并提供完整的代码和使用指南。引言想象一下这样的场景：你需要离开
网络安全加密python代码黑客Ash web安全安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快网络信息安全中遇到的各种攻击是防不胜防的，采取适当的防护措施就能有效地保护网络信息的安全,包括防火墙、入侵检测系统、漏洞扫描技术以及加密技术等多种防护措施。而信息安全的本质就是要保护信息本身和信息系统在存储、传输中的完整性和保密性,保障不被攻击和篡改,上述的主动攻击、被动攻击和病毒袭击都会造成信息的破坏和泄密,我们以信息安全中的基础理论出
python 商城性能,python商城项目总结 Yvetzy python 商城性能
importhashlib#实例化md5对象md5=hashlib.md5()#md5.update()方法的参数必须是字节型数据md5.update(bytes(request.POST['password'],encoding="UTF-8"))#以16进制格式存储md5.hexdigest()'''这里有个坑必须注意：md5.update()方法会将每次加密的字符进行拼接，所以每次加密前都要
用Python写一个商城系统潮水岩
如果要用Python写一个商城系统，可以先定义需要实现的功能，再按照功能模块分别进行开发。下面是一个简单的开发流程：数据模型设计：需要定义商品、订单、用户等数据模型，并且将它们存储在数据库中。用户模块：用户可以注册、登录、查看个人信息、修改密码等。商品模块：商家可以发布商品、管理商品信息、查看商品列表等；用户可以查看商品详情、加入购物车等。订单模块：用户可以下单、查看订单详情、取消订单、评价订单等
python pandas 读取数据库_Python+Pandas 获取数据库并加入DataFrame的实例 weixin_39955149 python pandas 读取数据库
Python+Pandas获取数据库并加入DataFrame的实例实例如下所示：importpandasaspdimportsysimportimpimp.reload(sys)fromsqlalchemyimportcreate_engineimportcx_Oracledb=cx_Oracle.connect('userid','password','10.10.1.10:1521/dbins
python导出结果_Python连接Oracle数据查询导出结果 weixin_39712821 python导出结果
python连接oracle，需用用到模块cx_oracle，可以直接pip安装，如网络不好，可下载离线后本地安装本人由于工作需要，期望便捷查询所得结果，且固定输出某个格式具体代码如下：#!coding:utf-8importcx_Oracleconn=cx_Oracle.connect('username/password@IP/连接名')cur=conn.cursor()cur.execute
Python—kafka操作蓝魔Y Python编程 kafka
文档结构1、概念简介2、环境搭建3、操作实践1、概念简介2、环境搭建接口手册：https://kafka-python.readthedocs.io/en/master/Python操作kafka的模块为：kafka-python模块安装pipinstallkafka-python3、操作实践=============================================over====
python使用kafka原理详解_Python操作Kafka原理及使用详解形象顧問Aking
Python操作Kafka原理及使用详解一、什么是KafkaKafka是一个分布式流处理系统，流处理系统使它可以像消息队列一样publish或者subscribe消息，分布式提供了容错性，并发处理消息的机制二、Kafka的基本概念kafka运行在集群上，集群包含一个或多个服务器。kafka把消息存在topic中，每一条消息包含键值(key)，值(value)和时间戳(timestamp)。kafk
python把oracle的查询结果导出为insert语句优游的鱼 oracle python 数据库开发语言
可以使用cx_Oracle库在Python中连接Oracle数据库并执行查询。然后，可以使用pandas库将查询结果读取为DataFrame，并使用to_sql()方法将其导出为insert语句。示例代码如下：importcx_Oracleimportpandasaspd#ConnecttoOracledatabaseconn=cx_Oracle.connect('username/passwor
python画出roc曲线 auc计算逻辑_Python画ROC曲线和AUC值计算路过炊烟 python画出roc曲线 auc计算逻辑
前言ROC(ReceiverOperatingCharacteristic)曲线和AUC常被用来评价一个二值分类器(binaryclassifier)的优劣。这篇文章将先简单的介绍ROC和AUC，而后用实例演示如何python作出ROC曲线图以及计算AUC。AUC介绍AUC(AreaUnderCurve)是机器学习二分类模型中非常常用的评估指标，相比于F1-Score对项目的不平衡有更大的容忍性，
【spug】使用勤不了一点 CI/CD python django ci/cd 运维 devops
目录简介下载与安装初始化配置启动与日志版本更新登录与使用工作台主机管理批量执行配置中心应用发布系统管理监控与告警使用问题简介手动部署|Spugwalle的升级版本轻量级无Agent主机管理主机批量执行主机在线终端文件在线上传下载应用发布部署在线任务计划配置中心监控报警如果有测试错误请指出。下载与安装测试环境：Python3.7.8CentOSLinuxrelease7.4.1708(Core)sp
记一次从mysql数据迁移到oralce （基于python和pandas） qq_36532060 mysql oracle pandas python
记一次从mysql数据迁移到oralce（基于python）前景提要具体实现创建数据库链接读取mysql数据写入orcale结语前景提要公司最近有个从mysql迁移数据到oracle的需求，于是进行了一下方案调研和分析，但作为一个之前从没接触过Oracle的人真的感到好难，但再难也难上，这篇文章主要是记录一下做这件事时遇到的坑以及分享一下最终的方案及代码。具体实现创建数据库链接其实我觉得这个算是最
python调用kafka smile__su python python kafka
先启动hadoop，zookeeper，kafka启动命令hadoop启动命令sbin/start-all.shzookeeper启动命令./bin/zkServer.shstart每台机器都要启动kafka启动命令bin/kafka-server-start.shconfig/server.properties每台机器都要启动进行以下操作的前提是将hadoop，zookeeper，kafka安装
python实现从oracle数据库查询数据生成excel透视表发送outlook niceme！ python
#-*-coding:utf-8-*-#http://pypi.cq.pegatroncorp.com/simple--trusted-hostpypi.cq.pegatroncorp.comimportchardetimportdatetimeimporttimeimportxlwtimportwin32com.clientaswin32fromwin32com.clientimportcons
pip 与当前python环境版本不匹配，python安装库成功，还是提示没有该库灿灿的金 python pip 开发语言
解决pip版本不一致在使用pip命令前加上python-m即可让pip版本和当前python版本一致因此,当使用pip安装依赖时,需要在命令前添加python-m来配合使用,比如安装一个pillow库,命令如下python-mpipinstallpillow你同时安装了python2和python3pipinstallPillow可能下载的是python3的库，而你代码跑的是python2可以通过
【Python-ML】SKlearn库性能指标ROC-AUC fjssharpsword Big data python专栏
#-*-coding:utf-8-*-'''Createdon2018年1月19日@author:Jason.F@summary:ROC(receiveroperatorcharacteristic，基于模型真正率和假正率等性能指标评估分类模型'''importpandasaspdfromsklearn.preprocessingimportLabelEncoderfromsklearn.cros
使用Python导出Oracle数据库数据表目录 SeanData Python 数据分析 python oracle 数据目录导出
###Oracle数据库数据表目录导出###导入包importpandasaspdimportcx_Oracle###数据库信息username='xxx'password='yyy'ipaddr='100.28.60.132'port='1521'service_name='service_name'connect_string=ipaddr+":"+port+"/"+service_name#
《Python入门+Python爬虫》——6Day 数据库可视化——Flask框架应用不摆烂的小劉 python python flask 爬虫
Python学习版本:Python3.X观看：Python入门+Python爬虫+Python数据分析1.Flask入门1.1关于Flask1.1.1了解框架Flask作为Web框架，它的作用主要是为了开发Web应用程序。那么我们首先来了解下Web应用程序。Web应用程序(WorldWideWeb)诞生最初的目的，是为了利用互联网交流工作文档。一切从客户端发起请求开始。所有Flask程序都必须创建
【python 机器学习】sklearn ROC曲线与AUC指标人才程序员杂谈机器学习 python sklearn 人工智能深度学习神经网络目标检测
文章目录sklearnROC曲线与AUC指标1.什么是ROC曲线与AUC？通俗介绍：学术解释：2.在`sklearn`中绘制ROC曲线与计算AUC2.1导入库和数据2.2加载数据集2.3训练模型2.4预测概率2.5计算FPR、TPR和AUC2.6绘制ROC曲线3.解析ROC曲线和AUC值4.总结sklearnROC曲线与AUC指标在机器学习中，评估分类模型的性能不仅仅依赖于准确率，还需要使用一些更
python操作kafka 您懂我意思吧 python开发 kafka 分布式 python
一、参考阿里云的官方链接：使用PythonSDK接入Kafka收发消息_云消息队列Kafka版(Kafka)-阿里云帮助中心二、安装python环境三、添加python依赖库pipinstallconfluent-kafka==1.9.2四、新建一个setting.py文件配置信息kafka_setting={'sasl_plain_username':'XXX',#如果是默认接入点实例，请删除该
Python异步编程-asyncio详解我爱让机器学习 python 开发语言 asyncio 异步
目录asyncio简介示例什么是asyncio?适用场景APIasyncio的使用可等待对象什么是可等待对象？协程对象任务对象Future对象协程什么是协程？基本使用运行协程Task什么是Task？创建Task取消TaskTask异常获取Task回调TaskGroup什么是TaskGroup？为什么使用TaskGroup？创建任务异常处理同步任务完成asyncio简介示例首先，我们来看一个简单的H
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源