在线打码

前端（echarts+百度地图api）后端（python+flask）完成绵阳餐饮消费数据可视化系统

一、可视化要求

针对团购网站餐饮类消费数据的可视分析系统设计与开发
大多数消费者在选择团购网站消费后会做出相应评价，从而产生海量的交易数据。这些数据包含了消费者对饮食比较全面的主观性评价和量化评分，因此通过对此类餐饮数据的分析能够有效洞悉城市餐饮消费行为。而由于该类数据体量大、数据类型多等特点，使得传统的数据分析技术已经难以有效进行分析处理。如何将可视分析技术应用于团购网站餐饮类数据分析，探索城市消费行为是一个新颖的研究课题。提供某团购网站绵阳市3444家餐饮类店铺数据的基本信息及351941条评论信息，其中164982位用户参与评论。

设计开发针对团购网站餐饮类消费数据的可视分析系统，实现功能包括但不限如下：
（1）呈现城市餐饮店铺时空特征分布和热门店铺特色美食；
（2）挖掘城市餐饮消费行为的地域特征倾向和时序特征，店铺消费关联关系分析；
（3）支持针对自定义消费条件的个性化推荐；

二、待分析数据

店铺信息shop_detail.csv

字段
店铺ID 店铺名称平均得分地址电话营业时间其他信息经纬度平均价格品牌ID 品牌名称展示状态安全档案店铺标签

用户评论信息shop_comment.csv

字段
用户ID 平均价格评论图片URL 评论时间点赞数用户名店铺评分评论ID 是否匿名店铺ID 用户等级

三、数据预处理

第一个功能：
呈现城市餐饮店铺时空特征分布和热门店铺特色美食

呈现店铺时空特征分布我选择使用百度地图来实现，采用这种方式来实现地图比较方便，对于店铺的地理位置绘制、店铺基本信息展示、店铺所属区域绘制、路线规划都能够做到，相比于简单的echarts地图更加强大。

热门店铺美食在shop_details.csv文件中并没有，所以只有自己来爬取数据。

百度地图api用的是BD09经纬度坐标，要想得到BD09坐标需要使用百度api来对美团上爬取的经纬度坐标进行转换（正好可以在爬取数据时对坐标系进行转换）

美团的移动端（https://i.meituan.com/）爬取相对容易，但是店铺的信息比较少

所以还是在桌面端爬取数据https://my.meituan.com/

店铺详情页面的url通过拼接店铺id获取（https://my.meituan.com/meishi/4615402），现在就是直接访问。就是一个简单的get请求，但是要带上完整的cookie，cookie有问题的话很快会弹验证码。一个cookie可以爬1000次后才会出现验证码，但是也有几百次出现的。我是通过手动更换cookie和ip来爬取的数据。
具体想解决该问题可以参考：https://blog.csdn.net/xing851483876/article/details/81842329

爬虫spider.py

# -*- coding: utf-8 -*-
# @Author  : f
# @File    : spider.py

import requests
import pandas as pd
import re
import csv
import json
import util
import time
'''
根据店铺id获取特色美食（名称、图片地址）、店铺分类

并保存到csv文件中
'''
comment_data_path = ".\static\data\shop_comments.csv"
shop_data_path = ".\static\data\shop_details.csv"

comment_df = pd.read_csv(comment_data_path)
shop_df = pd.read_csv(shop_data_path)

# 获取店铺的id列表
def get_id():
    return list(shop_df['poiId'])

def get_detail_byId(id):
    '''
    :param list_id: 店铺id
    :return: 店铺信息
    '''
    base_url = "https://my.meituan.com/meishi/"
    open_url = base_url+str(id)
    headers = {
        'Accept': '*/*',
        'Accept-Encoding': 'gzip, deflate, br',
        'Accept-Language': 'zh-CN,zh;q=0.9',
        'Connection': 'keep-alive',
        'Host': 'my.meituan.com',
        'Referer': 'https://gz.meituan.com/meishi/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36',
        "Cookie":"_lxsdk_cuid=176a76e5465c8-08c7fda338591a-366b4108-144000-176a76e5466c8; _hc.v=47584a75-cd95-5d49-4774-f90292228934.1609128422; iuuid=DE08D7129F1C9300F442BD3F534FE1E9BEB5960DC89FC964B06DE75D92AF59FF; _lxsdk=DE08D7129F1C9300F442BD3F534FE1E9BEB5960DC89FC964B06DE75D92AF59FF; webp=1; __utma=74597006.1600449216.1609384800.1609384800.1609384800.1; __utmz=74597006.1609384800.1.1.utmcsr=link.csdn.net|utmccn=(referral)|utmcmd=referral|utmcct=/; ci=306; cityname=%E7%BB%B5%E9%98%B3; latlng=31.540156,104.689433,1609384831294; i_extend=C019032296837928515275757042931456002187_c14_e76093ef0e7669cc9c26a543f38b45487GimthomepageguessH__a; lsu=; __mta=221682599.1609128395200.1609636290109.1609637806937.14; client-id=aff308ba-8320-4796-8a4c-1303c58c5136; uuid=099f6650-8b35-423a-a6ea-3d226bb37422; _lx_utm=utm_source%3Dlink.csdn.net%26utm_medium%3Dreferral%26utm_content%3D%252F; lat=31.504214; lng=104.784832; _lxsdk_s=176ccfd3748-f1a-79a-0bb%7C%7C2"
    }
    res = requests.get(open_url,headers=headers)
    res.encoding = "utf-8"
    l = [id]  # 存储店铺信息的列表
    pattern = ""
    rec = re.compile(pattern)  # 预编译
    if rec.search(res.text):
        json_str = rec.search(res.text).groups()
        for j in json_str:
            d = json.loads(j)
            l.append(d['detailInfo']['name'])
            l.append(d['crumbNav'])
            l.append(d['recommended'])
            l.append(d['detailInfo']['avgScore'])
            l.append(d['detailInfo']['address'])
            l.append(d['detailInfo']['phone'])
            l.append(d['detailInfo']['openTime'])
            l.append(d['detailInfo']['avgPrice'])
            result = util.wgs84tobd09(d['detailInfo']['longitude'],d['detailInfo']['latitude'])
            l.append(result[0]['x'])
            l.append(result[0]['y'])
    return l

#保存店铺信息
def save_info(id_list):
    '''
    :param id_list: 店铺id列表
    :return:
    '''
    with open("../static/data/shop_details02.csv","a+",encoding="utf-8",newline="") as f:
        # 2. 基于文件对象构建 csv写入对象
        csv_writer = csv.writer(f)
        # 3. 构建列表头
        csv_writer.writerow(["poiId", "name", "type","recommended","avgScore","address","phone","openTime","avgPrice","longitude","latitude"],newline="")
        # 4. 写入csv文件内容
        for id in id_list:
            info_list = get_detail_byId(id)
            print(info_list)
            csv_writer.writerow(info_list)

def main():
    print("------{} 开始爬取数据------".format(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))))
    id_list = get_id()
    save_info(id_list)
    print("------{} 爬取数据结束------".format(time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time()))))

if __name__ == '__main__':
    main()

爬取结果文件shop_detail02.csv

四、数据处理

1）、店铺类型
获取到的数据是页面面包屑导航的数据，类似于
[{‘title’: ‘绵阳美团’, ‘url’: ‘http://my.meituan.com/’}, {‘title’: ‘绵阳美食’, ‘url’: ‘http://my.meituan.com/meishi/’}, {‘title’: ‘绵阳火锅’, ‘url’: ‘http://my.meituan.com/meishi/c17/’}]
需要的数据就是三级导航中的文本数据
基本数据格式都是地名+店铺类型
所以我对店铺种类进行了处理

# 处理店铺类别
def convert_shop_type(type_str):
    str = eval(type_str)[2]['title'][2:]
    if str[0:1] == "县" or str[0:1] == "区":
        return str[1:]
    return str

2）、店铺推荐菜
对于推荐菜的处理比较简单，爬取的推荐菜数据都有几十条，只取其中热门前三条

3）、店铺经纬度
百度地图api用的是BD09经纬度坐标
要想得到BD09坐标需要使用百度api来对美团上爬取的经纬度坐标进行转换

# 坐标系转换
def wgs84tobd09(lon,lat):
    api_url = "http://api.map.baidu.com/geoconv/v1/?coords={},{}&from=1&to=5&ak=k4NUsxZb6DuuOxQOoZqneCKRPp3St76v".format(lon,lat)
    res = requests.get(api_url)
    d = json.loads(res.text)
    return d["result"]

4）、店铺营业时间
对于店铺营业时间我只取了一个时间段，而且视作无休
只考虑一整天的营业时间

营业时间的格式类似于
周一至周日 10:00-13:00 16:00-21:30
由于每家店的营业时间格式都不太同，所以我就提取了其中的一段
比如上面这条数据就只提取了10:00-13:00
并由-把时间段分隔开分别进行处理
比如10:00的处理
106+0/10=60
13:00的处理
136+0/10=78
那么处理数据后店铺字段commentTime_convert={
“start”:60,
“end”:78
}
前端通过控制datazoom来控制整个地图的时间轴，时间轴的两边是1-100
但是数据的显示跨度是144（按照0:00到24:00 每10分钟作一个刻度，所以上面的数据处理就是根据这来的）
当datazoom改变时分别将开始的值和结束的值乘以1.44 然后在遍历地图所有的点进行一一对比筛选出符合营业条件的点

处理代码：
后端：

# 处理店铺营业时间
def convert_openTime(openTime):
    start = 0
    end = 0
    if isinstance(openTime, str):
        l = openTime.split(" ")
        if len(l) > 1:
            if l[1] == "全天" or l[1] == "周一至周日" or l[1] == "周五至周日":
                start = 0
                end = 144
            else:
                start_str = l[1].split("-")[0]
                end_str = l[1].split("-")[1]
                start = int(start_str.split(":")[0]) * 6 + int(start_str.split(":")[1]) / 10
                end = int(end_str.split(":")[0]) * 6 + int(end_str.split(":")[1]) / 10
        else:
            start = 0
            end = 144

    return {"start":start,"end":end}

前端：

myChart.on('dataZoom', function(e) {
    // console.log(e);   // All params
    time_start = e.start * 1.44;
    time_end = e.end * 1.44;
    time_mapPoints = [];
    for(var i = 0;i<mapPoints.length;i++){
        start = mapPoints[i].openTime_convert.start;
        end = mapPoints[i].openTime_convert.end;
        if(start < end){
            if(start > time_start && end < time_end){
                time_mapPoints.push(mapPoints[i])
            }
        }else{
            // start 120 end 20
            if(start < time_start){
                time_mapPoints.push(mapPoints[i])
            }else if(end > time_end){
                time_mapPoints.push(mapPoints[i])
            }
        }
    }
    map.clearOverlays(); //删除所有点
    overlays.length = 0;// 清空矩形区域数组
    // 遍历mapPoints创建标注点
    createMarks(time_mapPoints);
});

5）、用户评论时间
爬取的用户评论时间是毫秒数，需要将其转换成具体的年份和月份来对每个月的评论量作统计

# 将时间戳转成指定的日期格式
def convert_date(timeStamp):
    timeArray = time.localtime(timeStamp)
    otherStyleTime = time.strftime("%Y年%m月", timeArray)# %Y年%m月%d日 %H:%M:%S
    # 2013--10--10 23:40:00
    return otherStyleTime

五、可视化布局

整个可视化系统由大体的5个部分组成，主要采用的可视化布局方法有：echarts、d3、百度地图。

整体围绕中间的大地图，该大地图的实现采用的百度地图api，采用这种方式来实现地图比较方便，对于店铺的绘制、店铺所属区域绘制、路线规划都能够做到，相比于简单的echarts地图更加强大。

左上角采用的echarts 词云，显示绵阳店铺种类，关键词云是对海量文字内容中出现频率较高的“关键词”的视觉突出，即出现越多的“关键词”字体越大，这样更能突出绵阳市店铺种类特征。

左下角采用echarts折线图，显示每一年每一个月的用户评论量，主要用于呈现餐饮消费行为的时序特征。

右上角个性化推荐，通过筛选用户选择的选项来对店铺进行呈现

右下角采用echarts柱状图，对框选区域进行数据比较

六、可视化呈现结果图

七、可视化交互效果

1）、点击左上角店铺分类词云，对应地图同类型店铺所在地作高亮显示以及左下角折线图显示该类近六年的对月份作划分的评论情况，借此可以看出该类型店铺在一年中的具体热卖月份来分析餐饮消费行为的时序特征。

2）、地图上店铺所在位置高亮并提供点击显示店铺名、地址、营业时间、平均消费等，以及对路线规划的选择。

3）、通过地图下方的时间轴来重置地图中的内容，以及通过店铺的营业时间来对时间分布进行分割，可选择时间跨度以及时间范围。（时间轴操作优先级最高，其余操作需先固定时间轴

4）、通过右上角个性化推荐的勾选可以实现对于店铺评分、预算、类别以及定位做导航操作（导航前需先定位所在位置）

5）、进行定位操作后会将自身现所在位置在地图上高亮跳动显示并文本提示，并在右上角个性化推荐中目前所在地项显示（只显示到所在区）

6）、在成功进行定位及导航操作后，会提示路线规划成功并计算出路线全长，地图上显示规划好的路线（红色虚线表示）。

7）、地图右上角有框选操作，通过框选区域店铺，使右下角柱状图变化，通过区域对比来探索餐饮消费行为的地域特征，包括店铺评论量、店铺量、店铺种类。（只可实现对三个区域进行对比）可通过地图右上角的清除矩形区域来重新绘制需要对比的区域。

物联网导论复习材料物腐虫生物联网学习
简答题Q1：物联网的概述，特点，模型，应用，重点是应用层，云计算，数据集成。物联网的概述物联网（IoT，InternetofThings）是指通过各种传感器、设备和网络技术，将物理世界中的物体连接到互联网，实现数据的采集、传输、处理和应用的智能化系统。物联网的特点全面感知：通过传感器实时采集数据。可靠传输：通过互联网和无线网络传输数据。智能处理：利用云计算和大数据技术对数据进行分析和处理，实现智能
华为OD机试E卷 - 最大值（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c++华为OD机试E卷 C语言
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述给定一组整数（非负），重排顺序后输出一个最大的整数。示例1输入：[10,9]输出：910说明:输出结果可能非常大，所以你需要返回一个字符串而不是整数。输入描述数字组合输出描述最大的整数示例1输入109输出910说明解题思路题目要求是：给定一组
Python 入门路线（2025 极简无废话版）墨鱼爆蛋 Python python 开发语言编程
大家好，梳理一个Python从入门到精通路线大家都挺忙的，突出一个无废话注：时间仅供参考第一阶段：基础入门(0-3个月)1.Python基础语法开发环境搭建(Python安装、IDE选择)变量和数据类型运算符和表达式控制流(if/else、循环)函数定义与调用基本输入输出2.数据结构基础列表(List)和元组(Tuple)字典(Dict)和集合(Set)字符串处理文件操作3.错误处理try/exc
用Python写了一个好玩的桌面宠物游戏脚本，简单又好玩墨鱼爆蛋 Python Python游戏 python 开发语言游戏桌面宠物
今天，我们来分享一个宠物桌面小程序，全程都是通过PyQT来制作的，对于PythonGUI感兴趣的朋友，千万不要错过哦！我们先来看看最终的效果，对于一个小小的娱乐项目来说，还是不错啦！好了，废话不多说，我直接上干货，本项目使用PYQT5作为编码框架，如果你对于该框架不是特别熟悉的话，建议先去简单学习一下~源码和素材图片在文末领取！素材图片项目源码展示importsysimportosimportra
Python 上下文管理器：优雅地管理资源墨鱼爆蛋 python 开发语言数据库
一、什么是上下文管理器上下文管理器是一个可以在with语句中使用的对象，它定义了__enter__和__exit__方法，它定义了在进入和退出特定代码块时需要执行的操作，确保资源在使用完毕后能够被正确地释放或清理。二、如何实现上下文管理器Python的上下文管理器通常通过两种方式实现：一种是使用类，另一种是使用生成器。1.使用类实现上下文管理器要实现一个自定义的上下文管理器类，你需要在类中定义两个
Python 如何使用 Bert 进行中文情感分析程序员徐师兄 Python 入门专栏 python bert 开发语言情感分析
前言在自然语言处理（NLP）领域，情感分析是一个非常常见且重要的应用。情感分析通常用于识别文本中的情感，例如判断一条微博或评论是正面、负面还是中性。在过去的几年中，随着深度学习的发展，BERT（BidirectionalEncoderRepresentationsfromTransformers）模型迅速成为了处理自然语言的强大工具。BERT是一种基于Transformer架构的预训练模型，它能够
【Python百日进阶-Web开发-Feffery】Day604 - 趣味dash_04：Excel转Pdf文件岳涛@泰山医院 Dash python excel 前端 dash
文章目录一、环境准备1.1初始化基础`Python+Dash`环境1.2本例中使用的第三方包二、本项目B站视频讲解三、页面效果四、项目源码一、环境准备1.1初始化基础Python+Dash环境CSDN文档参见：https://blog.csdn.net/yuetaope/article/details/129795264Bilibili视频参见：https://www.bilibili.com/v
ODBC的基本使用种花的人_ 开发工具数据库
前言在工作中，使用POWERBI做数据分析报表的时候用到ODBC，对于POWERBI语义模式实现连接数据库必须使用到ODBC，那什么是ODBC？1.ODBC的基本概念1.1ODBC驱动程序每种数据库都有相应的ODBC驱动程序，这些驱动程序负责处理与数据库的通信。驱动程序将ODBC调用转换为数据库特定的调用，并将结果返回给应用程序。1.2数据源名称(DSN)DSN是一个配置名称，用于保存连接到数据库
【odoo】odoo基本视图中的kanban视图种花的人_ odoo python
文章目录概要看板视图的基本特点：看板视图的工作流程：看板视图的优点：举个例子关键要素解析总结概要Odoo看板视图（KanbanView）是Odoo中的一种可视化视图，它通常用于管理任务、项目、销售机会、库存管理等业务流程。看板视图的设计灵感来源于“看板管理”方法，这种方法源于日本丰田汽车生产体系，它注重流程的可视化和任务的快速流转。通过看板视图，用户可以更直观地查看工作状态、追踪任务进度，并快速对
Python进阶--Python操作excel 小昀小杭 python excel 数据库
一、xlsxwirter三方库优点：写的快功能多缺点：只能写问题：内容并不是直接写入文件中只有在关闭的时候才会写入文件实例：#创建excel文件wb=xlsxwriter.Workbook("cars.xlsx")#在该文件下创建sheetws=self.wb.get_worksheet_by_name("Car")orself.wb.add_worksheet("Car")ws.write(ro
python进阶-10.pandas基本数据类型（1） wang旭炎 python numpy 索引
importpandasaspdimportnumpyasnpfrompandasimportSeries,DataFrame文章目录1,Series自定义索引读取SeriesSereis.loc['自定义的索引']||Sereis.iloc[0-n的数字]xxx.loc['yy']=new修改和增加读取多个值,会得到一个新对象通过字典数据得到Series2.DataFrame2.1把numpy的
tensorflow-迁移学习使用Resnet残差网络实现猫狗分类问题浮夸 tensorflow python
遇到的bug都放在之前的文章里了importosimportpandasaspdimportwarningsimporttensorflowastffromtensorflow.pythonimportkerasfromkeras.preprocessing.imageimportImageDataGeneratorimportkeras.optimizersasopfromtensorflow.
GBase 数据库在大数据环境下的应用与优势 big crab 数据库大数据
引言随着大数据技术的发展，传统数据库面临着越来越多的挑战。尤其是在处理海量数据时，如何在保证高性能的同时，确保系统的可扩展性、容错性和高可用性，成为许多企业关心的问题。GBase数据库系列，特别是GBase8a、GBase8s和GBase8c，提供了一种新型的解决方案，它们能够在大数据环境下提供卓越的性能和可靠性。本文将深入探讨GBase数据库在大数据环境中的应用及其优势。一、GBase数据库系列
GBase 数据库的性能调优与故障排查 big crab 数据库
一、引言在现代企业的数据驱动运营中，数据库的性能是核心问题之一。GBase数据库作为高性能、高可用的数据库解决方案，被广泛应用于大数据、高并发的场景中。为了最大化GBase数据库的性能，了解如何调优数据库的配置、查询执行计划和硬件资源使用至关重要。本文将深入探讨GBase数据库的性能调优策略、常见故障排查方法，并结合SQL示例和调优技巧，帮助开发者和数据库管理员提升GBase数据库的整体效率。二、
GBase数据库在大数据环境下的存储和查询优化策略 big crab 数据库大数据
一、引言随着大数据时代的到来，数据量的激增给数据库管理和查询性能带来了巨大的挑战。尤其是对于关系型数据库，如何在海量数据的存储和查询中保持高效的性能，已经成为企业IT架构设计中的关键问题。GBase数据库，作为一款高性能的关系型数据库，凭借其强大的数据处理能力和高可用性，在大数据领域得到了广泛应用。本文将深入探讨GBase数据库在大数据环境下的存储与查询优化策略，结合GBase8a、GBase8s
selenium框架你们的好朋友大强测试开发 python 功能测试 selenium
selenium（仅作为个人笔记，如有雷同，请联系删除。。）1、Selenium的特点：开源、免费，多浏览器支持，多平台支持，多语言支持，对Web页面有良好的支持，API简单，灵活(用开发语言驱动)，支持分布式测试用例执行。2、Windows下的测试环境搭建：安装Python；安装setuptools与pip（注：Python3不支持setuptools，但已经集成了pip）安装Selenium：
python爬取电影天堂beautiful_Python爬虫 -- 抓取电影天堂8分以上电影 carafqy
看了几天的python语法，还是应该写个东西练练手。刚好假期里面看电影，找不到很好的影片，于是有个想法，何不搞个爬虫把电影天堂里面8分以上的电影爬出来。做完花了两三个小时，撸了这么一个程序。反正蛮简单的，思路和之前用nodejs写爬虫一样。爬虫的入口从分页的列表开始，比如美剧的列表第一页地址这样：http://www.ygdy8.net/html/gndy/oumei/list_7_1.html，
【python进阶】txt excel pickle opencv操作demo 闪闪发亮的小星星 AI算法工程师打怪 python excel opencv
文章目录1.txt读写读综合案例日志文件读写2.excel读写读取csv读取xlsx3.matplotlib案例折线图多个折现图散点图柱状图饼状图4opencv案例加载与展示图片缩放图片旋转图片保存图片读取摄像头视频保存opencv综合案例5pickle案例1.txt读写读file.read()file.readlines()file.readline()##使用'read'方法读取文件的所有内容
python爬取公众号历史文章_微信公众号爬虫--历史文章冷风吹心冷风吹心 python爬取公众号历史文章
今天搞了一个微信公众号历史文章爬虫的demo，亲测可行，记录一下！(不喜勿喷)缺点：1.不是很智能2.兼容性不是很好，但是能应付正常情况啦使用mysql+request数据库部分直接建表ddl吧：CREATETABLE`wechat_content`(`id`int(11)NOTNULLAUTO_INCREMENT,`wechat_name`varchar(255)DEFAULTNULLCOMME
R数据分析：多分类问题预测模型的ROC做法及解释公众号Codewar原创作者 R 数据分析
有同学做了个多分类的预测模型，结局有三个类别，做的模型包括多分类逻辑回归、随机森林和决策树，多分类逻辑回归是用ROC曲线并报告AUC作为模型评估的，后面两种模型报告了混淆矩阵，审稿人就提出要统一模型评估指标。那么肯定是统一成ROC了，刚好借这个机会给大家讲讲ROC在多分类问题情形下的具体使用和做法。ROC曲线回顾ROC曲线（ReceiverOperatingCharacteristicCurve）
python-django 安装与基本配置默执_ django 后端开发 python django 后端
安装pipinstallDjango==3.2.4查看版本python-mdjango--version创建项目django-adminstartproject项目名称cd项目名称创建数据库pythonmanage.pymigrate创建超级用户用户名邮箱pythonmanage.pycreatesuperuser--username=用户名--email=邮箱自己设置密码必要设置：#设置中文：s
selenium通过cookie实现自动登录 Zds丶小顺顺 python 开发语言
原理很简单，首先手动完成登录后，把cookies保存到本地，下次再把cookies注入到浏览器里面，就自动实现了登录最近在学习写python的自动化脚本,但是发现测试工具打开之后的网页是没有用户自己打开浏览器时记录的cookie,简单来说也就是打开的网站不会自己登录,所以想要简单的实现下如何用cookie来登录总的来说分两步目录第一步，把cookies保存到本地第二步，把保存到本地的cookies
python 统计相同像素值个数 AI算法网奇 python基础 opencv 计算机视觉 python
目录python统计相同像素值个数最大值附近的值python统计相同像素值个数importcv2importnumpyasnpimporttimefromcollectionsimportCounter#读取图像image=cv2.imread('mask16.jpg')#将图像转换为灰度图像gray_image=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)area
Python Selenium使用cookie实现自动登录WB haerxiluo python 爬虫 python selenium 爬虫
文章目录前言一、预登陆获取cookie1)cookie处理2)预登陆二、登录测试前言模拟登录WB是实现WB网页爬虫的第一步，现在的WB网页版有个sinavisitsystem，只有登录过后才能获取更多内容。本文使用selenium通过预登陆保存cookie到本地，之后重复登录只需要提取本地cookie即可免去每次扫码或者输密码登录。一、预登陆获取cookie1)cookie处理先简单引入两个函数实
爬取优美图库壁纸-python -chu_kuang- python mysql 数据库
爬取216页分块区所有图片，爬的内容有点抽象。说实在的这网站壁纸挺檫边的.....importrequestsfrombs4importBeautifulSoupimportos#创建目录directory='pictures'url=''ifnotos.path.exists(directory):os.makedirs(directory)foriinrange(216):ifi==0:url
AI时代，需要怎样的架构师？腾讯云架构师峰会来了！架构
引言架构设计对应用有关键性的影响，不仅决定应用的整体品质，还直接影响开发、维护和扩展的难易度。卓越的架构设计不仅能够确保系统的稳定性、高效性和可扩展性，还能大幅提升研发效能，同时显著降低维护成本。在快速变化的技术环境中，架构师们面临业务需求快速迭代、数据量急剧膨胀以及系统复杂性不断提升等挑战。随着云计算、大数据、人工智能等前沿技术的蓬勃发展，一系列创新解决方案如微服务架构、AI大模型、自动化运维工
python+Selenium自动化之免登录(cookie及token) 觅远 python selenium 自动化
目录cookie免登录通过接口获取cookie启用浏览器绕过登录添加token使用登录可以减去每次登录的重复操作，直接操作系统登录后的菜单页面，也可以减少安全验证登录，如图像验证登录的操作。注意：cookie和token都有有效期。cookie免登录直接从开发者工具中获取cookie进行添加，下图为网页中多个站点的cookie，挑选需要的进行添加即可。fromseleniumimportwebdr
归并排序(Python) 编程可可西里 python 开发语言算法排序算法
1.算法步骤首先考虑一个问题:两个有序列表如何合并成一个列表A=[1,3,5,6,7,12]B=[6.7.9.11]1.构建一个result=[]2.当A非空且B非空：比较A[0]和B[0]result添加较小的那个元素，并从原始数组弹出3.如果A非空,把A添加到result末尾4.如果B非空,把B添加到result末尾1.先把数组分成两部分2.每部分递归处理变成有序3.将两个有序列表合并起来2.
【2025 ODA teigha .NET系列开发教程第五章】给CAD实体添加附属数据XDATA，包括源码三好学生～张旺 ODA Teigha .NET开发教程 .net
系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档2025ODAteigha.NET系列开发教程系列文章目录AutoCADXData扩展数据开发指南什么是XData？XData的两种存储方式1.全局字典存储(XRecord)2.实体附加存储步骤1：注册应
R数据分析：有调节的中介与有中介的调节的整体介绍公众号Codewar原创作者算法人工智能
单独的有调节的中介或者有中介的调节好多同学还大概能看明白，但是两个东西一起说我发现大部分同学就懵逼了。今天我就尝试将两种方法一起讲讲，重点帮助大家厘清两种方法的异同。先从整体上看下两者的概念：有中介的调节首先落脚在调节，调节作用必须是显著的，并且这个调节作用的实现过程要通过中介变量。theideal-typicalmediatedmoderationisfirstofallasignificant
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不