退休的龙叔

Python爬虫实战之爬某宝商品并做数据分析，现在赚钱没点技术还真不行！

之前我写了一个爬取某宝商品的源码，给了一个小伙子学习，本想着后面写成文章分享给大家学习的，但没成想被那个小伙子捷足先登了…今天还是拿出来分享给大伙！

是这样的，之前接了一个金主的单子，他想在某宝开个小鱼零食的网店，想对目前这个市场上的商品做一些分析，本来手动去做统计和分析也是可以的，这些信息都是对外展示的，只是手动比较麻烦，所以想托我去帮个忙。

一、项目要求：

具体的要求如下：

1.在某宝搜索“小鱼零食”，想知道前10页搜索结果的所有商品的销量和金额，按照他划定好的价格区间来统计数量，给我划分了如下的一张价格区间表：

2.这10页搜索结果中，商家都是分布在全国的哪些位置？

3.这10页的商品下面，用户评论最多的是什么？

4.从这些搜索结果中，找出销量最多的10家店铺名字和店铺链接。

从这些要求来看，其实这些需求也不难实现，我们先来看一下项目的效果。

二、效果预览

获取到数据之后做了下分析，最终做成了柱状图，鼠标移动可以看出具体的商品数量。

在10~30元之间的商品最多，越往后越少，看来大多数的产品都是定位为低端市场。

然后我们再来看一下全国商家的分布情况：

可以看出，商家分布大多都是在沿海和长江中下游附近，其中以沿海地区最为密集。

然后再来看一下用户都在商品下面评论了一些什么：

字最大的就表示出现次数最多，口感味道、包装品质、商品分量和保质期是用户评价最多的几个方面，那么在产品包装的时候可以从这几个方面去做针对性阐述，解决大多数人比较关心的问题。

最后就是销量前10的店铺和链接了。

在拿到数据并做了分析之后，我也在想，如果这个东西是我来做的话，我能不能看出来什么东西？或许可以从价格上找到切入点，或许可以从产品地理位置打个差异化，又或许可以以用户为中心，由外而内地做营销。

越往深想，越觉得有门道，算了，对于小鱼零食这一块我是外行，不多想了。

粉丝福利，点击可查看

三、爬虫源码

由于源码分了几个源文件，还是比较长的，所以这里就不跟大家一一讲解了，懂爬虫的人看几遍就看懂了，不懂爬虫的说再多也是云里雾里，等以后学会了爬虫再来看就懂了。

import csv
import os
import time
import wordcloud
from selenium import webdriver
from selenium.webdriver.common.by import By


def tongji():
    prices = []
    with open('前十页销量和金额.csv', 'r', encoding='utf-8', newline='') as f:
        fieldnames = ['价格', '销量', '店铺位置']
        reader = csv.DictReader(f, fieldnames=fieldnames)
        for index, i in enumerate(reader):
            if index != 0:
                price = float(i['价格'].replace('¥', ''))
                prices.append(price)
    DATAS = {
     '<10': 0, '10~30': 0, '30~50': 0,
             '50~70': 0, '70~90': 0, '90~110': 0,
             '110~130': 0, '130~150': 0, '150~170': 0, '170~200': 0, }
    for price in prices:
        if price < 10:
            DATAS['<10'] += 1
        elif 10 <= price < 30:
            DATAS['10~30'] += 1
        elif 30 <= price < 50:
            DATAS['30~50'] += 1
        elif 50 <= price < 70:
            DATAS['50~70'] += 1
        elif 70 <= price < 90:
            DATAS['70~90'] += 1
        elif 90 <= price < 110:
            DATAS['90~110'] += 1
        elif 110 <= price < 130:
            DATAS['110~130'] += 1
        elif 130 <= price < 150:
            DATAS['130~150'] += 1
        elif 150 <= price < 170:
            DATAS['150~170'] += 1
        elif 170 <= price < 200:
            DATAS['170~200'] += 1

    for k, v in DATAS.items():
        print(k, ':', v)


def get_the_top_10(url):
    top_ten = []
    # 获取代理
    ip = zhima1()[2][random.randint(0, 399)]
    # 运行quicker动作（可以不用管）
    os.system('"C:\Program Files\Quicker\QuickerStarter.exe" runaction:5e3abcd2-9271-47b6-8eaf-3e7c8f4935d8')
    options = webdriver.ChromeOptions()
    # 远程调试Chrome
    options.add_experimental_option('debuggerAddress', '127.0.0.1:9222')
    options.add_argument(f'--proxy-server={
       ip}')
    driver = webdriver.Chrome(options=options)
    # 隐式等待
    driver.implicitly_wait(3)
    # 打开网页
    driver.get(url)
    # 点击部分文字包含'销量'的网页元素
    driver.find_element(By.PARTIAL_LINK_TEXT, '销量').click()
    time.sleep(1)
    # 页面滑动到最下方
    driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')
    time.sleep(1)
    # 查找元素
    element = driver.find_element(By.ID, 'mainsrp-itemlist').find_element(By.XPATH, './/div[@class="items"]')
    items = element.find_elements(By.XPATH, './/div[@data-category="auctions"]')
    for index, item in enumerate(items):
        if index == 10:
            break
        # 查找元素
        price = item.find_element(By.XPATH, './div[2]/div[1]/div[contains(@class,"price")]').text
        paid_num_data = item.find_element(By.XPATH, './div[2]/div[1]/div[@class="deal-cnt"]').text
        store_location = item.find_element(By.XPATH, './div[2]/div[3]/div[@class="location"]').text
        store_href = item.find_element(By.XPATH, './div[2]/div[@class="row row-2 title"]/a').get_attribute(
            'href').strip()
        # 将数据添加到字典
        top_ten.append(
            {
     '价格': price,
             '销量': paid_num_data,
             '店铺位置': store_location,
             '店铺链接': store_href
             })

    for i in top_ten:
        print(i)


def get_top_10_comments(url):
    with open('排名前十评价.txt', 'w+', encoding='utf-8') as f:
        pass
    # ip = ipidea()[1]
    os.system('"C:\Program Files\Quicker\QuickerStarter.exe" runaction:5e3abcd2-9271-47b6-8eaf-3e7c8f4935d8')
    options = webdriver.ChromeOptions()
    options.add_experimental_option('debuggerAddress', '127.0.0.1:9222')
    # options.add_argument(f'--proxy-server={ip}')
    driver = webdriver.Chrome(options=options)
    driver.implicitly_wait(3)
    driver.get(url)
    driver.find_element(By.PARTIAL_LINK_TEXT, '销量').click()
    time.sleep(1)
    element = driver.find_element(By.ID, 'mainsrp-itemlist').find_element(By.XPATH, './/div[@class="items"]')
    items = element.find_elements(By.XPATH, './/div[@data-category="auctions"]')
    original_handle = driver.current_window_handle
    item_hrefs = []
    # 先获取前十的链接
    for index, item in enumerate(items):
        if index == 10:
            break
        item_hrefs.append(
            item.find_element(By.XPATH, './/div[2]/div[@class="row row-2 title"]/a').get_attribute('href').strip())
    # 爬取前十每个商品评价
    for item_href in item_hrefs:
        # 打开新标签
        # item_href = 'https://item.taobao.com/item.htm?id=523351391646&ns=1&abbucket=11#detail'
        driver.execute_script(f'window.open("{
       item_href}")')
        # 切换过去
        handles = driver.window_handles
        driver.switch_to.window(handles[-1])

        # 页面向下滑动一部分，直到让评价那两个字显示出来
        try:
            driver.find_element(By.PARTIAL_LINK_TEXT, '评价').click()
        except Exception as e1:
            try:
                x = driver.find_element(By.PARTIAL_LINK_TEXT, '评价').location_once_scrolled_into_view
                driver.find_element(By.PARTIAL_LINK_TEXT, '评价').click()
            except Exception as e2:
                try:
                    # 先向下滑动100，放置评价2个字没显示在屏幕内
                    driver.execute_script('var q=document.documentElement.scrollTop=100')
                    x = driver.find_element(By.PARTIAL_LINK_TEXT, '评价').location_once_scrolled_into_view
                except Exception as e3:
                    driver.find_element(By.XPATH, '/html/body/div[6]/div/div[3]/div[2]/div/div[2]/ul/li[2]/a').click()
        time.sleep(1)
        try:
            trs = driver.find_elements(By.XPATH, '//div[@class="rate-grid"]/table/tbody/tr')
            for index, tr in enumerate(trs):
                if index == 0:
                    comments = tr.find_element(By.XPATH, './td[1]/div[1]/div/div').text.strip()
                else:
                    try:
                        comments = tr.find_element(By.XPATH,
                                                   './td[1]/div[1]/div[@class="tm-rate-fulltxt"]').text.strip()
                    except Exception as e:
                        comments = tr.find_element(By.XPATH,
                                                   './td[1]/div[1]/div[@class="tm-rate-content"]/div[@class="tm-rate-fulltxt"]').text.strip()
                with open('排名前十评价.txt', 'a+', encoding='utf-8') as f:
                    f.write(comments + '\n')
                    print(comments)
        except Exception as e:
            lis = driver.find_elements(By.XPATH, '//div[@class="J_KgRate_MainReviews"]/div[@class="tb-revbd"]/ul/li')
            for li in lis:
                comments = li.find_element(By.XPATH, './div[2]/div/div[1]').text.strip()
                with open('排名前十评价.txt', 'a+', encoding='utf-8') as f:
                    f.write(comments + '\n')
                    print(comments)


def get_top_10_comments_wordcloud():
    file = '排名前十评价.txt'
    f = open(file, encoding='utf-8')
    txt = f.read()
    f.close()

    w = wordcloud.WordCloud(width=1000,
                            height=700,
                            background_color='white',
                            font_path='msyh.ttc')
    # 创建词云对象，并设置生成图片的属性

    w.generate(txt)
    name = file.replace('.txt', '')
    w.to_file(name + '词云.png')
    os.startfile(name + '词云.png')


def get_10_pages_datas():
    with open('前十页销量和金额.csv', 'w+', encoding='utf-8', newline='') as f:
        f.write('\ufeff')
        fieldnames = ['价格', '销量', '店铺位置']
        writer = csv.DictWriter(f, fieldnames=fieldnames)
        writer.writeheader()
    infos = []
    options = webdriver.ChromeOptions()
    options.add_experimental_option('debuggerAddress', '127.0.0.1:9222')
    # options.add_argument(f'--proxy-server={ip}')
    driver = webdriver.Chrome(options=options)
    driver.implicitly_wait(3)
    driver.get(url)
    # driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')
    element = driver.find_element(By.ID, 'mainsrp-itemlist').find_element(By.XPATH, './/div[@class="items"]')
    items = element.find_elements(By.XPATH, './/div[@data-category="auctions"]')
    for index, item in enumerate(items):
        price = item.find_element(By.XPATH, './div[2]/div[1]/div[contains(@class,"price")]').text
        paid_num_data = item.find_element(By.XPATH, './div[2]/div[1]/div[@class="deal-cnt"]').text
        store_location = item.find_element(By.XPATH, './div[2]/div[3]/div[@class="location"]').text
        infos.append(
            {
     '价格': price,
             '销量': paid_num_data,
             '店铺位置': store_location})
    try:
        driver.find_element(By.PARTIAL_LINK_TEXT, '下一').click()
    except Exception as e:
        driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')
        driver.find_element(By.PARTIAL_LINK_TEXT, '下一').click()
    for i in range(9):
        time.sleep(1)
        driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')
        element = driver.find_element(By.ID, 'mainsrp-itemlist').find_element(By.XPATH, './/div[@class="items"]')
        items = element.find_elements(By.XPATH, './/div[@data-category="auctions"]')
        for index, item in enumerate(items):
            try:
                price = item.find_element(By.XPATH, './div[2]/div[1]/div[contains(@class,"price")]').text
            except Exception:
                time.sleep(1)
                driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')
                price = item.find_element(By.XPATH, './div[2]/div[1]/div[contains(@class,"price")]').text
            paid_num_data = item.find_element(By.XPATH, './div[2]/div[1]/div[@class="deal-cnt"]').text
            store_location = item.find_element(By.XPATH, './div[2]/div[3]/div[@class="location"]').text
            infos.append(
                {
     '价格': price,
                 '销量': paid_num_data,
                 '店铺位置': store_location})
        try:
            driver.find_element(By.PARTIAL_LINK_TEXT, '下一').click()
        except Exception as e:
            driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')
            driver.find_element(By.PARTIAL_LINK_TEXT, '下一').click()
        # 一页结束
        for info in infos:
            print(info)
        with open('前十页销量和金额.csv', 'a+', encoding='utf-8', newline='') as f:
            fieldnames = ['价格', '销量', '店铺位置']
            writer = csv.DictWriter(f, fieldnames=fieldnames)
            for info in infos:
                writer.writerow(info)


if __name__ == '__main__':
    url = 'https://s.taobao.com/search?q=%E5%B0%8F%E9%B1%BC%E9%9B%B6%E9%A3%9F&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.21814703.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170306&bcoffset=4&ntoffset=4&p4ppushleft=2%2C48&s=0'
    # get_10_pages_datas()
    # tongji()
    # get_the_top_10(url)
    # get_top_10_comments(url)
    get_top_10_comments_wordcloud()

通过上面的代码，我们能获取到想要获取的数据，然后再Bar和Geo进行柱状图和地理位置分布展示，这两块大家可以去摸索一下。

结语

项目源码我都可以分享给大家，但也请大家尊重一下原开发者，千万不要未经允许就擅自把别人的代码编成你的故事，那个小伙子想找他聊聊他都不理我了…诶。

我多想回到那一年 snail菇凉
今天出于很偶然的原因又打开头条翻开以往收藏和点赞的文章，一路滑下来，从现在的考试，单词收藏，书单点赞到最后的关于高考，关于那年夏天发生的时事还有当时刷头条时偶然点开的吸引我注意力的文章散文，类型内容很多。从追星八卦，房屋装修，到各种鸡汤观点美文。忽然发现你所浏览的每一个网页都是有记忆的，它会记录下当时你最感兴趣的，最符合当下状态的头条新闻。就像在2018年夏天以前，我会无比期待高考的到来，所以总爱
JAVA API (三)：从基础爬虫构建到带条件数据提取 —— 详解 URL、正则与爬取策略钮祜禄.爱因斯晨 JAVA学习笔记 java 爬虫开发语言
个人主页-爱因斯晨文章专栏-Java学习相关文章：API(一)相关文章：API（二）持续努力中，感谢支持一、爬虫基础（一）爬虫的基本概念定义：爬虫是按照一定规则自动抓取网络信息的程序，在Java环境下，可借助URL、HttpURLConnection等API来实现。应用场景：广泛应用于数据采集，如电商平台的价格监控、各类新闻的聚合；还可用于信息分析，如舆情监测等。（二）Java实现简单爬虫的步骤建
解决pip指令超时问题好学近乎知o pip python
用pip指令，在安装Django3.2时报错，询问ChatGpt后得到的解决方案pip下载超时——是当前网络连接到PyPI官方源太慢或不稳定，甚至可能连不上了，而pip默认的超时时间又太短，就导致了中途失败：ReadTimeoutError:HTTPSConnectionPool(host='files.pythonhosted.org',port=443):Readtimedout.解决方案：换
梁启超: “一门三院士，九子皆才俊”的家教锦囊一米阳光的休闲小屋
我们中国人，应该都听过一句话——“少年强，则国强；少年智，则国智；少年富，则国富”，这句话，在清末民初，中国人普遍失去自信时，给了无数人奋发向上的力量。它的作者，正是中国近代史上顶天立地的思想家、文学家、史学家梁启超。在他这篇《少年中国说》里，他鼓励所有的中国少年，要建立起自信心、自尊心，为拯救中华民族而努力奋斗。这篇文章，其实梁启超也是写给自己的孩子看的。由此可见，梁启超也是一位非常出色和成功的
真相大曝光：卧虎藏隆应天书府隆国强免费荐股就是骗局！投资亏损无法出金!被骗不要慌墨守成法
在风起云涌的金融市场中，股票犹如一把双刃剑，既能创造财富神话，也可能让人跌入深渊。对于那些怀揣梦想的投资者而言，股票不仅是他们追求财富的舞台，更是寄托了无尽希望的载体。然而，现实往往残酷，股市的变幻莫测让许多人迷失了方向，甚至不幸成为了一些不法分子精心设计的骗局中的牺牲品。卧虎藏隆应天书府隆国强免费讲股博取信任后带股民参加慈善投票大赛套路曝光！若不幸被骗发现不能提现赶紧与我们联系正道顾问：【文章末
格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
大牌高仿女包包哪里可以买(高仿包价格一览表) 潮奢之家
标题：探寻大牌高仿女包包的购买渠道导语：在时尚潮流的影响下，越来越多的女性朋友开始关注大牌女包包。然而，高昂的价格让很多消费者望而却步。今天，我们就来聊聊如何购买性价比更高的大牌高仿女包包。【重要提醒】文章最下面有联系方式一、了解高仿女包包市场高仿女包包市场鱼龙混杂，消费者在购买时需谨慎。市场上主要分为三种等级：低仿、中仿和高仿。低仿质量较差，与正品差距较大；中仿质量尚可，但细节方面仍有差距；高仿
Python通关秘籍（五）数据结构——元组 Smile丶Life丶 Python 通关指南：从零基础到高手之路 Python python 数据结构 android
前文复习五、数据结构5.1列表（List）列表是一种有序的可变数据集合，可以包含不同类型的元素。5.2元组（Tuple）元组是一种有序的不可变数据集合，通常用于存储一组相关的值。5.2.1元组的定义与创建
从Java到大模型应用：10天拿下5个Offer，我的转型逆袭之路 sky丶Mamba 感悟 java 开发语言
前言：本来准备5月发的，感觉现在的行情没有前几个月那么好了，培训机构出来了很多相关的人，然后就是有很多人也发现了这个方向不错，希望看到这篇文章的你能得到一些启发，个人真实经历。记住AI大模型是锦上添花，之前的那些架构能力，软件开发能力，编程思维才是内核。背景：Java开发的困境作为一名2年经验的Java程序员，我深刻感受到传统Java开发市场的“内卷”和瓶颈。根据2024年行业数据：Java岗位竞
springboot集成Netty 墨_风开发笔记 spring boot java netty
一、Netty介绍Netty的系列文章，正在更新中二、Netty集成io.nettynetty-all2.1、配置文件#netty配置netty:boss:1#boss线程数量默认为cpu线程数*2worker:4#worker线程数量默认为cpu线程数*2timeout:6000#连接超时时间默认为30sport:7000#服务器主端口默认7000portSalve:7001#服务器备用端口默认
1.8分钟了解恒文影视app软件不要信!不是真的!不靠谱不可信真相震惊!! 最新曝光36
1.恒文影视APP在平台不能提现怎么办？2.恒文影视APP这个软件靠谱可信吗？3.恒文影视APP在软件做任务被骗？4.恒文影视APP软件app无法登录?5.恒文影视APP平台是真的吗？6.恒文影视APP被骗无法提现，操作失误！7.恒文影视APP平台是騙局吗？8.恒文影视APP被骗无法出金如何维护自己的合法权益!希望看到这篇文章的人可以及时止损；请及时联系为你提供解决方案，要想讨回损害资产务必阅读以
汽车功能安全-在系统层面验证TSR实例车载测试工程师 ISO 26262汽车功能安全专栏 -标准解读与工程指南汽车安全网络车载系统功能测试集成测试
文章目录1TSR需求分析2测试用例导出方法(基于四个维度)2.1测试用例导出方法2.2测试方法3系统层面测试用例设计(示例):3.1通用设置3.2测试用例列表4测试方法总结1TSR需求分析需求ID:TSR-CCU-TSR-001(示例)需求描述：CCU接收【IDCU_LowBeamOnOff_Set】信号时应采用CANE2E机制，用于检测CAN通信故障。具体实现详见profile1E2E通信保护规
在家接单的工作有哪些？盘点可以在家接单的5种工作类型 U客直谈APP
随着如今工作的多样化，上班族已不再局限于出门工作，也有很多朋友们会选择在家进行接单。从而满足自己足不出户就可以工作为自己赚取一定的收入，何乐而不为呢？那么在家接单的工作有哪些？有哪些适合大家在家里理由手机、电脑进行接单操作的工作呢？本篇文章U客直谈就将盘点5个可以在家接单的工作，希望能让大家成功找到心仪的工作，有效提高自己的收入水平。1、在家接单的工作——线上app拉新app拉新就是根据app应用
MCP消息协议和传输协议（Java角度） sky丶Mamba LLM java 开发语言 MCP 大模型
作为Java程序员，你可以将MCP的消息协议和传输协议的关系类比为HTTP协议中“应用层”和“传输层”的分工。以下是具体解析：MCP定义了三种主流传输方式，适应不同场景需求：传输类型原理适用场景优缺点Stdio（标准输入/输出）通过本地进程的stdin/stdout通信本地命令行工具、敏感数据处理（如隐私计算）优点：简单、低延迟；缺点：仅限本地，不支持远程或高并发。SSE（Server-SentE
闲鱼监控助手实战项目：用 Python 实现闲鱼监控+自动秒拍
项目背景：为什么要做这个闲鱼助手？在闲鱼上抢东西，永远拼不过“秒拍党”。游戏机低价挂出，几秒没了优酷年卡、流量卡一上架立刻被拍想转卖赚差价，总是慢一步于是我写了一个Python闲鱼助手，实现自动闲鱼监控+秒拍下单，帮助我快速捡漏、低买高卖。核心功能一览（关键词自然带入）功能模块说明️‍♀️闲鱼监控实时监控指定关键词商品，自动刷新，发现即处理⚡闲鱼秒拍自动拍下匹配条件商品，支持延迟策略更隐蔽钉钉推送
5.Kotlin协程热爱Android的人 kotlin
文章目录1.协程的基本用法1.1先添加依赖库1.2开启一个协程GlobalScope.launch函数delay()函数Thread.sleep()函数runBlocking函数1.3创建多个协程launch函数suspend关键字coroutineScope函数2.更多的作用域构建器async函数withContext()函数线程参数3.使用协程简化回调的写法suspendCoroutine函数
Spring AI核心技术面试指南：从大模型集成到生产级部署，9轮深度技术拷问（含架构解析）
面试官：cc程序员，聊聊SpringAI的那些事儿？场景背景互联网大厂AI平台部面试官老周，与自称"SpringAI源码贡献者"的cc程序员展开深度技术探讨。面试过程第一轮：基础架构面试官：SpringAI的架构分层是怎样的？cc：（推眼镜）顶层是Model接口！中间层适配OpenAI/Ollama等实现，底层整合SpringBoot自动配置！@ConfigurationpublicclassOl
Spring Boot 3企业级架构设计：从模块化到高并发实战，9轮技术博弈（含架构演进解析）会写代码的斯皮尔伯格 Java场景面试宝典 Spring Boot 3 企业架构高并发微服务大厂面试
面试官：cc程序员，谈谈SpringBoot3企业级架构设计？场景背景互联网大厂架构委员会面试官老赵，与自称"SpringBoot架构师"的cc程序员展开技术博弈。面试过程第一轮：模块化设计面试官：SpringBoot3的模块化架构有什么改进？cc：（推眼镜）依赖管理更灵活！Starter模块解耦！不过具体模块划分原则我得看官方文档...面试官：如何设计企业级Starter？cc：（自信）通过sp
《被分手后，我闪婚了个禁欲法医》&霍砚清童映心全本小说在线阅读~ 今日推文
《被分手后，我闪婚了个禁欲法医》&霍砚清童映心全本小说在线阅读~《被分手后，我闪婚了个禁欲法医》&霍砚清童映心全本小说在线阅读~《被分手后，我闪婚了个禁欲法医》&霍砚清童映心全本小说在线阅读~书名：《被分手后，我闪婚了个禁欲法医》主角：霍砚清童映心※※※※※※※※※※※※※※阅读建议：下拉至文章最底部看全文——※※※※※※※※※※※※※清脆的耳光声瞬然响彻整个办公室。她动作太快太突然了，谭莹莹，包
vscode创建Python虚拟环境无法激活问题处理
系统环境win7环境，Python3.7，VScode1.70.3问题报错：PSC:\Users\Administrator\PycharmProjects\websites>.\venv\Scripts\activate无法加载文件C:\Users\Administrator\PycharmProjects\websites\venv\Scripts\Activate.ps1，因为在此系统中禁止
python+requests+pytest qiumiaomi 接口 python python pytest 开发语言
|-----api|-----------------init.py|-----------------api_np.py||-----scripts------------------init.py|------------------test01_mp.py|||-----pytest.iniapiinit.py##公共变量#1.请求域名host="127.0.0.1”#2.请求信息头head
Python 线程优先队列 PriorityQueue - Python零基础入门教程猿说编程
目录一.Python线程队列Queue分类二.Python线程优先队列PriorityQueue简介三.Python线程优先队列PriorityQueue函数介绍四.Python线程优先队列PriorityQueue使用五.猜你喜欢零基础Python学习路线推荐:Python学习目录>>Python基础入门在线程队列Queue/线程队列LifoQueue文章中分别介绍了先进先出队列Queue和先进
人生路上，我劝你放下一些朋友末班地铁_JS
嗨，你有多少个朋友？他们是你什么时候认识的，你们的关系又怎样？想一想再接着往下看吧。不知还有几个人记得以前语文读本里的一篇文章《与山巨源绝交书》，该文章是嵇康写给让他出仕的朋友山涛的，表明自己不愿出来做官，以及与山涛绝交。现代人品读后会想，这个嵇康真是穷讲究，朋友举荐做官还写绝交书，真是个傻x。他的选择我们就暂且不提，今天说的是：他为什么要与这个要好朋友绝交。从嵇康写信就大概猜得到，嵇康不愿做官，
【全文】《30831》江易柳如烟&完整大结局&30831江易柳如烟*全章节免费阅读神书阁
【全文】《30831》江易柳如烟&完整大结局&30831江易柳如烟*全章节免费阅读小说主角：江易柳如烟简介：江省，汤臣一品，88号别墅中。两个身穿制服的人站在江易面前，眼神冰冷的盯着江易。“你们是不是找错人了？”江易柳眉微皱。----阅读全文小说内容请翻阅文章最底部---第2章“而且，都城秦家将会和我们联姻，到时候秦少天来管理江省府，一年内GDP突破20万亿也是轻轻松松！”柳如烟走到桌子前，继续说
使用Debug-View Kotlin，提升你的Android调试体验！侯深业Dorian
使用Debug-ViewKotlin，提升你的Android调试体验！去发现同类优质开源项目:https://gitcode.com/1、项目介绍Debug-ViewKotlin是一个专为Android开发者设计的高效、直观的浮层调试控制台。它会在应用界面的最上方提供实时的性能指标和日志信息，包括但不限于内存占用、帧率(FPS)、启动时间和各种自定义的日志数据。只需简单集成，就能让开发和测试过程变
第六届研究所圆梦反击战分仓方案老姜（姜新宁）算力3.0虚假投资真实惨痛经历为大家揭开法律咨询维权
诈骗团伙成员根据“剧情需要”，扮演不同角色与股民聊天，“讲师”进行“炒股授课”，“水军”号假扮新手股民、资深股民在群内互动吹捧“老师”，诱导被害人在虚假平台投资。慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，遇到此类情况一概不要相信。（注明：该文章出现名字为网上冒充行骗，跟当事人无关，如果涉及侵权，可以联系作者及时删除）Workplus六年级班云算力，云计算老姜，姜新宁云端算法骗局揭晓
今日播报！庆衍书院郭庆旺被骗黑幕曝光，KSD2.0光伏市场不能出金不要再次踏入！法律咨询维权
社交平台有这样一种群，群里都是“理财专家”“炒股大神”“操盘高手”，不仅每天免费授课、推荐牛股，还有助理“一对一”指导具体操作。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，遇到此类情况一概不要相信。咨询顾问：182--71402640（电微同号）数字经济数字体育数字农业慈善投票大赛
关于自我的思考全力1以赴
安静的夜，总会带给我们很多的思考，最近一段时间发现自己的生活过得越来越安逸了，没有了太多的追求，每天过的一点都不充实，生活中总是缺了点什么，挑战自我的东西。这种感觉很难受，找不到了人生的方向和努力的意义。让我想到的只有八个字:不忘初心，砥砺前行。那到底我们出发的意义是什么呢？又是否能够坚持前行着？加入写作营已有半年之久，中间断断续续缺的文章不少，还记得当初刚看到营长在招募写作时，看到信息后内心的那
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin

Python爬虫实战之爬某宝商品并做数据分析，现在赚钱没点技术还真不行！

一、 项目要求：

二、效果预览

三、爬虫源码

结语

你可能感兴趣的:(Python优质文章,python,爬虫,人工智能,程序员,编程语言)

一、项目要求：