松鼠爱吃饼干

Python爬虫+数据可视化：分析唯品会商品数据

目录

前言
数据来源分析
- - 1. 明确需求
  - 2. 抓包分析：通过浏览器自带工具: 开发者工具
代码实现步骤: 发送请求 -> 获取数据 -> 解析数据 -> 保存数据
- - 发送请求
  - 解析数据
  - 保存数据
数据可视化
- - 先读取数据
  - 泳衣商品性别占比
  - 商品品牌分布占比
  - 各大品牌商品售价平均价格
  - 各大品牌商品原价平均价格
  - 唯品会泳衣商品售价价格区间

前言

唯品会是中国领先的在线特卖会电商平台之一，它以“品牌特卖会”的模式运营，为会员提供品牌折扣商品。唯品会的商品包括服装、鞋类、箱包、美妆、家居、母婴、食品等各类品牌产品。

这就是今天的受害者，我们要拿取上面的泳衣数据，然后可以做些数据可视化

数据来源分析

1. 明确需求

明确采集网站以及数据
网址: https://category.vip.com/suggest.php?keyword=%E6%B3%B3%E8%A1%A3&ff=235|12|1|1
数据: 商品信息

2. 抓包分析：通过浏览器自带工具: 开发者工具

打开开发者工具: F12 / 右键点击检查选择network
刷新网页: 让网页数据重新加载一遍
搜索关键字: 搜索数据在哪里
找到数据包: 50条商品数据信息
整页数据内容: 120条 --> 分成三个数据包
1. 前50条数据 --> 前50个商品ID
2. 中50条数据 --> 中50个商品ID
3. 后20条数据 --> 后20个商品ID

已知: 数据分为三组 --> 对比三组数据包请求参数变化规律
请求参数变化规律: 商品ID
分析找一下是否存在一个数据包, 包含所有商品ID

如果想要获取商品信息 --> 先获取所有商品ID --> ID存在数据包

代码实现步骤: 发送请求 -> 获取数据 -> 解析数据 -> 保存数据

发送请求

我们定义了要爬取的URL地址，并设置了User-Agent请求头，以模拟浏览器发送请求。
使用requests.get方法发送GET请求，并将响应保存在response变量中。

headers = {
    # 防盗链 告诉服务器请求链接地址从哪里跳转过来
    'Referer': 'https://category.vip.com/',
    # 用户代理, 表示浏览器基本身份信息
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)'
}
# 请求链接
url = 'https://mapi.vip.com/vips-mobile/rest/shopping/pc/search/product/rank'
data = {
    # 回调函数
    # 'callback': 'getMerchandiseIds',
    'app_name': 'shop_pc',
    'app_version': '4.0',
    'warehouse': 'VIP_HZ',
    'fdc_area_id': '104103101',
    'client': 'pc',
    'mobile_platform': '1',
    'province_id': '104103',
    'api_key': '70f71280d5d547b2a7bb370a529aeea1',
    'user_id': '',
    'mars_cid': '1689245318776_e2b4a7b51f99b3dd6a4e6d356e364148',
    'wap_consumer': 'a',
    'standby_id': 'nature',
    'keyword': '泳衣',
    'lv3CatIds': '',
    'lv2CatIds': '',
    'lv1CatIds': '',
    'brandStoreSns': '',
    'props': '',
    'priceMin': '',
    'priceMax': '',
    'vipService': '',
    'sort': '0',
    'pageOffset': '0',
    'channelId': '1',
    'gPlatform': 'PC',
    'batchSize': '120',
    '_': '1689250387620',
}
# 发送请求 -->  响应对象
response = requests.get(url=url, params=data, headers=headers)

解析数据

然后，我们定义了起始标签和结束标签，通过循环的方式遍历文本，并提取每个商品的名称和价格。

# 商品ID -> 120个
products = [i['pid'] for i in response.json()['data']['products']]
# 把120个商品ID 分组 --> 切片 起始：0 结束：50 步长:1
# 列表合并成字符串
product_id_1 = ','.join(products[:50]) #  提取前50个商品ID 0-49
product_id_2 = ','.join(products[50:100]) #  提取中50个商品ID 50-99
product_id_3 = ','.join(products[100:]) #  提取后20个商品ID 100到最后
product_id_list = [product_id_1, product_id_2, product_id_3]

for product_id in product_id_list:
    # 请求链接
    link = 'https://mapi.vip.com/vips-mobile/rest/shopping/pc/product/module/list/v2'
    # 请求参数
    params = {
        # 'callback': 'getMerchandiseDroplets2',
        'app_name': 'shop_pc',
        'app_version': '4.0',
        'warehouse': 'VIP_HZ',
        'fdc_area_id': '104103101',
        'client': 'pc',
        'mobile_platform': '1',
        'province_id': '104103',
        'api_key': '70f71280d5d547b2a7bb370a529aeea1',
        'user_id': '',
        'mars_cid': '1689245318776_e2b4a7b51f99b3dd6a4e6d356e364148',
        'wap_consumer': 'a',
        'productIds': product_id,
        'scene': 'search',
        'standby_id': 'nature',
        'extParams': '{"stdSizeVids":"","preheatTipsVer":"3","couponVer":"v2","exclusivePrice":"1","iconSpec":"2x","ic2label":1,"superHot":1,"bigBrand":"1"}',
        'context': '',
        '_': '1689250387628',
    }
    # 发送请求
    json_data = requests.get(url=link, params=params, headers=headers).json()
    for index in json_data['data']['products']:
        # 商品信息
        attr = ','.join([j['value'] for j in index['attrs']])
        # 创建字典
        dit = {
            '标题': index['title'],
            '品牌': index['brandShowName'],
            '原价': index['price']['marketPrice'],
            '售价': index['price']['salePrice'],
            '折扣': index['price']['mixPriceLabel'],
            '商品信息': attr,
            '详情页': f'https://detail.vip.com/detail-{index["brandId"]}-{index["productId"]}.html',
        }
        csv_writer.writerow(dit)
        print(dit)

保存数据

然后，我们使用open函数创建一个CSV文件，并指定文件名、写入模式、编码方式等参数。然后使用csv.DictWriter初始化一个写入器对象，并指定表头。

我们使用writer.writeheader()来写入CSV文件的表头，然后遍历items列表，使用writer.writerow()将每个商品的数据写入CSV文件中。

f = open('商品.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
    '标题',
    '品牌',
    '原价',
    '售价',
    '折扣',
    '商品信息',
    '详情页',
])
csv_writer.writeheader()

数据可视化

先读取数据

df = pd.read_csv('商品.csv')
df.head()

泳衣商品性别占比

from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker


c = (
    Bar()
    .add_xaxis(sex_type)
    .add_yaxis("", sex_num)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="泳衣商品性别占比", subtitle=""),
        brush_opts=opts.BrushOpts(),
    )
)
c.load_javascript()

from pyecharts import options as opts
from pyecharts.charts import Pie

c = (
    Pie()
    .add("", [list(z) for z in zip(sex_type, sex_num)])
    .set_global_opts(title_opts=opts.TitleOpts(title="泳衣商品性别占比"))
    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
)
c.render_notebook()

商品品牌分布占比

shop_num = df['品牌'].value_counts().to_list()
shop_type = df['品牌'].value_counts().index.to_list()
c = (
    Pie()
    .add(
        "",
        [
            list(z)
            for z in zip(shop_type, shop_num)
        ],
        center=["40%", "50%"],
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title="商品品牌分布占比"),
        legend_opts=opts.LegendOpts(type_="scroll", pos_left="80%", orient="vertical"),
    )
    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
)
c.render_notebook()

各大品牌商品售价平均价格

# 按城市分组并计算平均薪资
avg_salary = df.groupby('品牌')['售价'].mean()
ShopType = avg_salary.index.tolist()
ShopNum = [int(a) for a in avg_salary.values.tolist()]
# 创建柱状图实例
c = (
    Bar()
    .add_xaxis(ShopType)
    .add_yaxis("", ShopNum)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="各大品牌商品售价平均价格"),
        visualmap_opts=opts.VisualMapOpts(
            dimension=1,
            pos_right="5%",
            max_=30,
            is_inverse=True,
        ),
        xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45))  # 设置X轴标签旋转角度为45度
    )
    .set_series_opts(
        label_opts=opts.LabelOpts(is_show=False),
        markline_opts=opts.MarkLineOpts(
            data=[
                opts.MarkLineItem(type_="min", name="最小值"),
                opts.MarkLineItem(type_="max", name="最大值"),
                opts.MarkLineItem(type_="average", name="平均值"),
            ]
        ),
    )
)

c.render_notebook()

各大品牌商品原价平均价格

# 按城市分组并计算平均薪资
avg_salary = df.groupby('品牌')['原价'].mean()
ShopType_1 = avg_salary.index.tolist()
ShopNum_1 = [int(a) for a in avg_salary.values.tolist()]
# 创建柱状图实例
c = (
    Bar()
    .add_xaxis(ShopType_1)
    .add_yaxis("", ShopNum_1)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="各大品牌商品原价平均价格"),
        visualmap_opts=opts.VisualMapOpts(
            dimension=1,
            pos_right="5%",
            max_=30,
            is_inverse=True,
        ),
        xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45))  # 设置X轴标签旋转角度为45度
    )
    .set_series_opts(
        label_opts=opts.LabelOpts(is_show=False),
        markline_opts=opts.MarkLineOpts(
            data=[
                opts.MarkLineItem(type_="min", name="最小值"),
                opts.MarkLineItem(type_="max", name="最大值"),
                opts.MarkLineItem(type_="average", name="平均值"),
            ]
        ),
    )
)

c.render_notebook()

唯品会泳衣商品售价价格区间

pie1 = (
    Pie(init_opts=opts.InitOpts(theme='dark',width='1000px',height='600px'))
    
    .add('', datas_pair_2, radius=['35%', '60%'])
    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{d}%"))
    .set_global_opts(
        title_opts=opts.TitleOpts(
            title="唯品会泳衣商品\n\n售价价格区间", 
            pos_left='center', 
            pos_top='center',
            title_textstyle_opts=opts.TextStyleOpts(
                color='#F0F8FF', 
                font_size=20, 
                font_weight='bold'
            ),
        )
    )
    .set_colors(['#EF9050', '#3B7BA9', '#6FB27C', '#FFAF34', '#D8BFD8', '#00BFFF', '#7FFFAA'])
)
pie1.render_notebook()

问题解答 · 源码获取 · 技术交流 · 抱团学习请联系

你可能感兴趣的:(信息可视化,python,爬虫)

三，Python3 常用API速查 Dack466 Python笔记 python 前端开发语言
三，常用API速查三，常用API速查1，字符串1.1字符串查找方法1.2去除首位信息1.3大小写转换1.4格式排版：1.5数字格式化1.6其他方法：2，列表3，字典4，Python常用内置函数4.1round()函数4.2all()和any()4.3lambda函数4.4sorted()函数4.5map()函数4.6filter()函数4.7ASCII码的函数4.8转进制函数4.9列表4.10元祖
Python遍历pandas数据方法总结 tmapi 包罗万象 python pandas 开发语言
一、使用iterrows()iterrows()是pandas中最常用的遍历DataFrame行的方法之一。它将DataFrame的每一行作为一个Series进行迭代。importpandasaspddefiterrows_example():#创建一个示例DataFramedata={'Name':['Alice','Bob','Charlie'],'Age':[25,30,35],'Score
基于单片机的室外休闲智能座椅设计（论文+源码）云山工作室单片机嵌入式硬件毕业设计毕设
1系统总体设计本课题为基于单片机的室外休闲智能座椅的设计，其可以实现温湿度检测，座椅加热，自动照明，背靠调节等工作。整个系统架构如图2.1所示其中包括了按键模块，温湿度检测模块，显示模块，加热模块，照明模块，按摩模块，背靠调节模块等器件设备。其中，显示模块采用LCD1602液晶显示当前的状态信息；温湿度检测，采用DHT11传感器实现，加热和照明功能，采用继电器间接控制加热棒和LED灯来实现；按摩则
HCIA-OSPF 2 蜡笔小呆呆网络 ospf 网络协议
一、OSPF报文类型1、Hello报文：发现、建立、维护邻居关系①邻居发现：使能OSPF的接口周期发Hello报文，协商参数以建邻居关系。②建立双向通信：收到的Hello报文邻居列表有自身RouterID，即建双向通信和邻居关系。③指定DR与BDR：含DR优先级、RouterID等信息，用于DR和BDR选举。④维系邻居：建邻后仍周期发Hello报文，默认每10发送一次Hello(MA和点到点网络)
Oracle数据字典 foolisk oracle 数据库
一、数据字典1.简介数据字典的内容包括逻辑结构和物理结构、数据库对象、空间分配信息、Oracle用户名、权限和角色信息、列的约束信息。2.分类（1）内部表x$......①常见的有X$BH和X$KSMSP②在Oracle启动时自动创建，只有管理员有权限（2）数据字典表......$①数据字典表中存储的是oracle系统数据，如表、函数、过程等②数据字典表的表名都以$结尾③数据字典表的owner只能
信奥赛CSP-J复赛集训（模拟算法专题）（1）：P8813 [CSP-J 2022] 乘方王老师青少年编程 csp 信奥赛 c++算法数据结构 gesp
信奥赛CSP-J复赛集训（模拟算法专题）（1）：P8813[CSP-J2022]乘方题目描述小文同学刚刚接触了信息学竞赛，有一天她遇到了这样一个题：给定正整数aaa和bbb，求aba^bab的值是多少。aba^bab即bbb个aaa相乘的值，例如232^323即为333个222相乘，结果为2×2×2=82\times2\times2=82×2×2=8。“简单！”小文心想，同时很快就写出了一份程序，
MacBook Air M1安装python相关操作记录我是歪歪歪呀 python pycharm 开发语言 mac os x
好记忆不如烂笔头，为避免以后忘记啦～我的苹果电脑默认带有的python版本是2.7.16，需要装python3python官网：PythonReleasesformacOS|Python.orgpycharm官网：DownloadPyCharm:PythonIDEforProfessionalDevelopersbyJetBrains一、关于下载Miniforge3【1】链接地址：Releases
python的循环语句总结 weixin_41454036 Python python
if判断条件：执行语句……else：执行语句……==============================if判断条件1:执行语句1……elif判断条件2:执行语句2……elif判断条件3:执行语句3……else:执行语句4……#!/usr/bin/python#-*-coding:UTF-8-*-#例3：if语句多个条件num=9ifnum>=0andnum10:#判断值是否在小于0或大于10
Python学习第七天 Leo来编程 Python学习学习
模块模块是一个包含Python代码的文件，通常以.py为扩展名。模块中内容有函数、类、变量/常量、测试代码。模块的作用：划分代码结构、提高代码的复用率。命名规范使用小写字母：模块名应全部使用小写字母。避免使用大写字母，因为不同操作系统对文件名的大小写敏感度不同。使用下划线分隔单词：如果模块名由多个单词组成，使用下划线_分隔单词。这种风格称为file_util避免使用关键字和内置模块名不要使用Pyt
Python学习第九天 Leo来编程 Python学习学习
序列化和反序列概念在Python中，序列化是将对象转换为可存储或传输的格式（如字节流或字符串），而反序列化则是将序列化后的数据重新转换为对象（官网序列化）。序列化：就是将不能存储的对象转为可存储的对象（封存pickling）。发序列化：序列化的对象返回成原来的对象（解封unpickling）。方式序列化和反序列化有下面五种方式pickle模块官网概念：pickle模块实现了对一个Python对象结
为什么C/C++能一直排在编程语言前列？揭秘“常青树”的底层王者逻辑 [特殊字符] sveewg IT前沿 c++开发语言 python java c语言 c#r语言
目录一、底层掌控力：代码与硬件的“零距离对话”二、生态帝国：万亿代码筑起的“数字罗马”️三、教育霸权：程序员的能力“试金石”⚔️四、争议与进化：在安全与性能间走钢丝五、未来预言：C/C++的“无形帝国”“用C++写代码，就像用手术刀雕刻芯片！”在Python称霸AI、Rust狂揽安全红利的今天，C/C++仍以底层统治力和生态霸权稳居编程语言金字塔顶端。TIOBE2025年2月榜单显示，C++以11
Python爬取亚马逊商品数据-多线程【附源码】代码CC python爬虫 python 爬虫多线程开发语言
效果如下图：代码用途说明（完整代码在后面）核心功能本代码用于自动化采集亚马逊平台商品数据，主要获取以下信息：商品分类：通过URL参数自动识别商品类别（如electronics/beauty）商品名称：精准提取商品标题用户评分：解析星级评分（4.5/5.0等）销售信息：获取近期销售数据应用场景市场调研：分析不同商品类别的市场竞争情况价格监控：跟踪商品价格波动趋势竞品分析：获取同类商品的用户评价数据库
YoLo运用学习7 老农民编程 YoLo学习 YOLO 学习
目录前言一、C#环境使用YoLo模型进行AI推理检测1.加载图片2.图片预处理3.加载onnx模型并推理4.数据后处理5.图片属性值缩放还原和反归一化6.将解析到的信息的集合绘制成处理后图片总结前言根据YoLo运用学习3所说，实现在C#环境使用YoLo模型进行AI推理检测，最常见有两种：1、python训练好YoLo的模型pt格式，将其转化为onnx格式，通过C#的相关库去加载并推理onnx格式并
# LeetCode 3270. 求出数字答案 —— Python 解题思路与实现迪小莫学AI 每日算法 leetcode python 算法
LeetCode3270.求出数字答案——Python解题思路与实现在本篇博客中，我们将详细解析LeetCode上的第3270题——求出数字答案。我们将从问题描述出发，逐步分析解题思路，最后提供Python代码实现，并通过示例验证其正确性。问题描述给你三个正整数num1，num2和num3。数字num1，num2和num3的数字答案key是一个四位数，定义如下：前导补零：如果有数字少于四位数，给它
【最全攻略】量化交易之券商 API 接口：从数据获取到订单执行股票量化程序化交易量化炒股个人量化量化 python QMT PTrade 量化交易 Deepseek 程序化炒股
一、引言在量化交易领域，大部分文章聚焦于利用各种Python库获取股票数据以及交易策略的回测。然而，对于账户查询、订单提交与查询等实际操作环节却鲜有提及。实际上，部分券商已经支持股票的API交易接入，这为量化交易的落地实施提供了有力支持。本文将深入探讨如何通过券商API接口进行数据获取以及订单执行，引导大家开启量化交易的新篇章。二、数据获取基础（一）官方数据优势获取股票数据有多种方法，市面上也有许
国内大模型月之暗面Kimi的使用方法及步骤国货崛起人工智能大模型 AIGC 开源工具
Kimi是由月之暗面（MoonshotAI）推出的一款大模型应用，具备多种功能和使用场景。根据已有的信息，以下是关于Kimi使用方法的概述：1.长文本处理能力输入超长上下文：KimiChat支持长达20万汉字的输入，这意味着用户可以提交极其详尽的文本材料，如长篇文档、研究报告、小说章节等，让Kimi进行深入的信息分析和处理。“继续”功能：在与Kimi对话过程中，用户可以利用“继续”功能按钮，确保模
自动驾驶---Perception之大模型应用智能汽车人自动驾驶人工智能机器学习
1背景自动驾驶感知（Perception）模块在自动驾驶系统中扮演着至关重要的角色，它负责收集、处理并理解车辆周围的环境信息。随着深度学习技术的快速发展，大模型也逐渐在自动驾驶感知模块中得到了广泛应用。本篇博客主要介绍大模型在感知模块的应用。前面也介绍过如下几篇Perception相关的文章，有兴趣的读者可以了解相关内容：《自动驾驶---Perception之IPM图和BEV图》《自动驾驶---P
如何建立需求变更的规范化流程需求管理
在项目开发过程中，需求变更是不可避免的现象，流程透明、沟通机制、风险控制成为建立规范化流程的三大关键。流程透明确保变更原因、内容、审批和反馈都能被全员了解和跟踪，从而降低因信息不对称产生的误解和风险；同时，合理的沟通机制和严格的风险控制是保障变更顺利实施的重要环节，其中风险控制通过细致的数据分析和及时预警发挥了决定性作用。一、需求变更的重要性与背景需求变更是软件开发与项目管理中常见的问题。随着技术
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能图像识别人工智能深度学习
一、介绍害虫识别系统，本系统使用Python作为主要开发语言，基于TensorFlow搭建卷积神经网络算法，并收集了12种常见的害虫种类数据集【"蚂蚁（ants）","蜜蜂（bees）","甲虫（beetle）","毛虫（catterpillar）","蚯蚓（earthworms）","蜚蠊（earwig）","蚱蜢（grasshopper）","飞蛾（moth）","鼻涕虫（slug）","蜗牛
详解：Grok中文版 _Grok 3 国内中文版本在线使用人工智能
GrokAI是由XAI公司推出的一款尖端人工智能系统。作为该公司核心技术之一，GrokAI专注于推动人工智能在各行各业的实际应用，尤其在数据分析、自然语言处理（NLP）、自动化决策、机器学习等领域表现出色。Grok的最大亮点在于其强大的数据处理能力。它能够高效地从大量复杂数据中提取有价值的信息，并做出精准预测。借助深度学习与强化学习等先进技术，GrokAI具备自我学习的能力，可以通过不断的训练来优
Python小项目：利用tkinter开发测手速小游戏
PythonTkinter手速测试器开发全解析本文将通过工业级代码规范重构基础测速程序，融入防作弊机制与性能优化方案，打造专业级手速测试工具。以下为经过真实项目验证的增强版实现方案：一、基础代码缺陷分析原始版本存在三大核心问题：无随机触发机制（用户可预判操作时机）缺少多轮测试统计功能未防止连续点击作弊二、增强版方案设计系统架构流程图：stateDiagram-v2[*]-->待机状态待机状态-->
网络安全入门必知的攻击方法服务器
随着信息技术的飞速发展，网络安全已成为全球关注的焦点。网络攻击手段日益多样化，攻击者的技术能力也在不断提升。作为网络安全从业者，必须深入理解常见攻击方法的原理、特征及防御策略。本文围绕网络安全领域的九大典型攻击类型（SQL注入、DDoS攻击、XSS、CSRF、暴力破解、网络钓鱼、近源攻击、供应链攻击、物理攻击），分析其技术实现路径，并提出相应的防护建议。一、SQL注入原理与危害SQL注入（SQLI
python | akshare，一个超强的开源Python 金融数据接口库！双木的木 python拓展学习 python 开发语言金融人工智能机器学习算法深度学习
本文来源公众号“python”，仅用于学术分享，侵权删，干货满满。原文链接：akshare，一个超强的Python库！大家好，今天为大家分享一个超强的Python库-akshare。Github地址：https://github.com/akfamily/akshare在金融市场中，数据是做出明智决策的关键。无论是股票、基金、期货、外汇还是宏观经济数据，都需要有准确、及时的数据支持。AkShare
遗传算法基础讲解 HH予深度学习
一、遗传算法基础1.什么是遗传算法？一种模拟生物进化过程的优化算法，基于达尔文的“自然选择”和“遗传学理论”。核心思想：通过选择（优胜劣汰）、交叉（基因重组）、变异（基因突变）操作，逐步逼近问题的最优解。2.为什么用遗传算法？适用性强：解决复杂的非线性、多峰、离散或连续优化问题。无需梯度信息：对目标函数的数学性质要求低，适合黑箱优化。全局搜索能力：通过种群并行搜索，避免陷入局部最优，适合多维优化。
Loki+Promtail+Grafana监控K8s日志 xx155802862xx k8s
在现代云原生架构中，监控与日志管理对于确保系统稳定性和可靠性至关重要。Kubernetes（K8s）作为当下流行的容器编排平台，对日志的监控管理需求尤为突出。Loki,Promtail和Grafana构成了一套强大的日志监控解决方案，它们协同工作提供了高效的日志采集、存储和可视化功能。Loki是一个水平可扩展、高可用性、多租户的日志聚合系统，它被设计用来优雅地与Grafana协同工作。Promta
【AI爬虫干货】Crawl4AI+DeepSeek：从安装配置到 DeepSeek 集成，掌握 AI 爬虫核心技术「喂饭教程」 blues_C AI测试：从入门到进阶 Python爬虫实战人工智能爬虫 deepseek python AI爬虫
【AI爬虫干货】Crawl4AI+DeepSeek：从安装配置到DeepSeek集成，掌握AI爬虫核心技术「喂饭教程」Crawl4AI简介一、安装二、异步爬取网页内容三、批量抓取四、保存结果到文件五、与DeepSeek模型结合使用总结Crawl4AI简介Crawl4AI是一个开源的、专为大型语言模型（LLM）设计的网页爬虫与抓取工具；它的设计理念是提供一个高效、灵活且易于使用的解决方案，用于从网页
python绘制汉字_OpenCV Python 绘制中文字 weixin_39657444 python绘制汉字
By凌顺2019年9月12日本示例使用的OpenCV版本是：4.1.1运行Python的编辑器：Jupyternotebook示例目的通过使用PLI在图片上添加中文字符。PIL(PythonImagingLibrary)是Python常用的图像处理库，而Pillow是PIL的一个友好Fork，提供了了广泛的文件格式支持，强大的图像处理能力，主要包括图像储存、图像显示、格式转换以及基本的图像处理操作
软考计算机网络,软考-计算机网络总复习 Vicey Wang 软考计算机网络
计算机网络复习知识点1、计算机网络的定义描述计算机网络，是指将地理位置不同的具有独立功能的多台计算机及其外部设备，通过通信线路连接起来，在网络操作系统，网络管理软件及网络通信协议的管理和协调下，实现资源共享和信息传递的计算机系统2、OSI参考模型的分层(7层各自的功能)(1)物理层(PhysicalLayer)物理层是OSI参考模型的最低层，它利用传输介质为数据链路层提供物理连接。它主要关心的是通
积分签到mysql_简易积分签到功能java代码实现实现Redis缓存数据 weixin_33626238 积分签到mysql
-------需求说明----需求分析积分签到处于app页面“我的”，用户会频繁的来回切换，如果将数据全部存储到数据库中然后去数据库中做查询，所以这里我才用的Redis缓存的方式将签到数据缓存起来；在表结构设计的时候，由于需求还没有完全确定下来，所以签到规则等信息还不是很明确，这里配置了两个表，一个积分签到表，一个积分配置表；CREATETABLE`np_customer_sign_info`(`
redis和mysql缓存设计_使用python 结合mysql和redis进行缓存设计岸在脚下亮亮 redis和mysql缓存设计
if__name__=="__main__":#print("yes")#c=CrazyRedis()#c.lpush("b","v")#print("yes")#pool=redis.ConnectionPool(host=host,port=6379,db=0)r=redis.Redis(connection_pool=pool)try:dbconn=pymysql.connect(host=
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他