华为云

爬虫新宠requests_html 带你甄别2019虚假大学 #华为云·寻找黑马程序员#

python模块学习建议

学习python模块，给大家个我自己不专业的建议：

养成习惯，遇到一个模块，先去github上看看开发者们关于它的说明，而不是直接百度看别人写了什么东西。也许后者可以让你很快入门，可那样你更多的是在吃别人剩下的。而访问Github，你可以在里面获取到更多作者想告诉你的内容和相关的链接地址。怎么评估一个模块好不好，最简单的办法就是看star，requests_html的star：9794，已经算很高的了。requests_html的Git地址：https://github.com/kennethreitz/requests-html。作者提供了官网http://html.python-requests.org/，用于更详细的使用描述。
python模块下载，多数情况大家使用pip install xxxx轻松搞定。但请记住这个网址：https://pypi.org/。在你下载模块前，先去搜索下它，看看pypi给你什么提示与要求。就比如requests_html，官方明确说明了，最新版本的requests-html 0.10.0 Requires: Python >=3.6.0。而支持3.5的最后一个版本是pip install requests-html==0.6.6

requests-html学习

安装

python3.6+ pip install requests-html
python3.5 pip install requests-html==0.6.6
再强调一次，requests_html仅支持3.5+，且最新版本的requests_html仅支持3.6+ ，3.5的最后一个版本为0.6.6。
安装时，你会发现，requests-html依赖了很多其他模块，统一封装后，让开发变得更加无脑：

Successfully installed appdirs-1.4.3 bs4-0.0.1 certifi-2019.3.9 chardet-3.0.4
cssselect-1.0.3 fake-useragent-0.1.11 idna-2.8 lxml-4.3.3 parse-1.12.0
pyee-6.0.0 pyppeteer-0.0.25 pyquery-1.4.0 requests-2.22.0 requests-html-0.10.0
six-1.12.0 tqdm-4.32.1 w3lib-1.20.0 websockets-7.0

官网介绍

全面支持解析JavaScript!
CSS 选择器 (jQuery风格, 感谢PyQuery).
XPath 选择器, for the faint at heart.
自定义user-agent (就像一个真正的web浏览器).
自动追踪重定向.
连接池与cookie持久化.
令人欣喜的请求体验，魔法般的解析页面.

举几个毛栗子

下面举几个官网的栗子，内容来自：http://html.python-requests.org/

from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://www.baidu.com/')

获取网页内容

print(r.html.html)

获取链接

print(r.html.links)
print(r.html.absolute_links)
links和absolute_links两个属性分别返回HTML对象所包含的所有链接和绝对链接（均不包含锚点）

通过CSS选择器获取元素

r.html.find([selector],[first=True])
selector选择器，使用jQuery风格。如果不熟悉，给你个jQuery的官网传送门：https://api.jquery.com/category/selectors/
添加first=True则为find ，不添加则为findAll，简洁明了…
但需要注意，如果没有添加first=True，即便返回一个元素，结果也将是list类型

通过xpath获取元素

r.html.xpath(’//*[@id=“su”]’, first=True) # 获取百度一下按钮地址…

元素具体内容

# 获取网站html内容
r.html.html
# 获取网站文本内容
r.html.text
# 上面俩内容太多就不打印了...
# 获取元素的属性
print(r.html.xpath('//*[@id="su"]', first=True).attrs)
output:
{'class': ('bg', 's_btn'), 'id': 'su', 'type': 'submit', 'value': '百度一下'}

JavaScript支持

requests_html的js执行是亮点，但是毁在了默认安装上…
r.html.render() 首次执行该方法是，模块会检查依赖，并下载chromium，chromium是什么鬼，看起来很像chrome？
搞过selenium的应该知道，这里简单对比下chrome和chromium：

Chromium是谷歌的开源项目，开发者们可以共同去改进它，然后谷歌会收集改进后的Chromium并发布改进后安装包。Chrome不是开源项目，谷歌会把Chromium的东西更新到Chrome中。你也可以这么理解Chromium是体验版，Chrome是正式版；
Chromium不用安装，下载下来的是压缩包，解压后直接就可以使用。Chrome需要安装；
Chromium功能比Chrome多，因为新功能都是先在Chromium中使用，等完善后才添加到Chrome中。相对的Chrome就要比Chromium稳定很多不容易出错；
Chromium不开放自动更新功能，所以用户需手动下载更新，而Chrome则可自动连上Google的服务器更新，但新版的推出很慢。

但是，模块在安装的时候由于SSLCertVerificationError问题，没办法进行自动化安装：

urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host=‘storage.googleapis.com’, port=443): Max retries exceeded with url: /chromium-browser-snapshots/Win_x64/575458/chrome-win32.zip (Caused by SSLError(SSLCertVerificationError(1, ‘[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1056)’)))

好在模块给出了地址，拼接host和uri即可进行下载：
http://storage.googleapis.com//chromium-browser-snapshots/Win_x64/575458/chrome-win32.zip
我家里下载好慢，这点就不演示了，大家对这官网扭一扭吧…

requests-html示例
到了今天今天的重点了，使用requests-html获取2019中国虚假大学！

“虚假大学”是未在教育部备案，不具备招生资格、没有办学资质、涉嫌非法招生和网络诈骗的“虚假大学”。

这些虚假大学数据统计，来源于人民日报。其中还闹过一个笑话，一个网站转载人民日报的这条新闻时，误将中国邮电大学写成了北京邮电大学,结果北邮发飙要求该媒体即刻修改并致歉！然后，人民日报表示躺着也中枪.为人民日报献上一首白智英的***像中枪一样***。
好了不发散回正题，为了演示requests-html示例，找到了这个网站：
高三网：http://www.gaosan.com/gaokao/249708.html
网站以文本的格式，列出了392所虚假大学名单！那么，我们就用requests-html，获取一下它的数据，让你们看看requests-html有多简单！

分析下下网站结构，清楚明白，数据包裹在

内部，从第三个p标签开始为我们所需要的数据。

代码实现：

# -*- coding: utf-8 -*-
# @Author   : 王翔
# @JianShu  : 清风Python
# @Date     : 2019/6/27 1:28
# @Software : PyCharm
# @version  ：Python 3.7.3
# @File     : PseudoCollege.py

from requests_html import HTMLSession
import json


class PseudoCollege:
    def __init__(self, url):
        self.url = url
        self.headers = {"User-Agent": ("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 "
                                       "(KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36")
                        }

    def get_response(self):
        session = HTMLSession()
        return session.get(self.url, headers=self.headers)

    def filter_info(self):
        html_data = self.get_response()
        # 从第三个P标签开始，获取虚假大学数据
        return html_data.html.find('div#data249708 p')[2:]

    @staticmethod
    def get_json(data):
        info = {}
        city = None
        for line in data:
            # 每个城市会显示为 北京：151所
            if 'strong' in line.html:
                # 拆分城市与虚假大学数量
                city, total_college = line.text.split('：')
                # 构造字典
                info[city] = dict(total=total_college, data=[])
                continue
            info[city]['data'].append(line.text)
        with open('colleges.json', 'w+', encoding='utf-8') as f:
            # ensure_ascii默认为True,json.dump后会被转码...
            f.write(json.dumps(info, ensure_ascii=False))


def run():
    url = 'http://www.gaosan.com/gaokao/249708.html'
    main = PseudoCollege(url)
    data = main.filter_info()
    main.get_json(data)


if __name__ == '__main__':
    run()

叫College感觉有点讽刺…最终将这些学校保存至colleges.json的文本中，我看看结果片段：

  ... ... ,
  "陕西": {
    "total": "16所",
    "data": [
      "西安电子信息学院",
      "西安理工学院",
      "西安工商学院",
      "西安科技师范大学",
      "西安信息技术学院",
      "西安工商管理学院",
      "西安工业科技技术学院",
      "西安工业科技学院",
      "陕西国防工业技术学院",
      "陕西瀚林医科学院",
      "西安工业工程学院",
      "陕西工贸职业学院",
      "西安科技职业学院",
      "西安经济技术学院",
      "西安机电工程学院",
      "陕西科技管理学院"
    ]
  },
  "福建": {
    "total": "5所",
    "data": [
      "厦门师范学院",
      "福建海峡经贸技术学院",
      "福建经济贸易大学",
      "福建科技学院",
      "福建省轻工业学院"
    ]
  },
  ... ...

The End

一个不留神又搞到二半夜了，哎…
快将这392所虚假大学名单，传播给你身边有孩子高考的朋友吧。
OK,今天的内容就到这里，如果觉得有帮助，欢迎将文章或我的微信公众号【清风Python】分享给更多喜欢python的人，谢谢。

来源：华为云社区征文作者：清风Python

你可能感兴趣的:(官方活动,技术交流)

【Death Note】网吧战神之7天爆肝渗透测试死亡笔记_sqlmap在默认情况下除了使用 char() 函数防止出现单引号 2401_84561374 程序员笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！特殊服务端口2181zookeeper服务未授权访问
怎样使用淘宝优惠券？全面解析优惠券使用技巧氧惠_飞智666999
在数字化的购物时代，淘宝优惠券已经成为我们享受购物优惠的重要途径。然而，许多消费者在领取了优惠券后，却不知如何正确使用，导致优惠券的价值无法得到充分发挥。那么，怎样使用淘宝优惠券呢？本文将为您全面解析优惠券的使用技巧，助您轻松享受购物优惠。首先，我们需要了解优惠券的来源。淘宝优惠券可以通过多种途径获取，如淘宝官方活动页面、店铺首页、品牌官方账号等。同时，一些第三方平台也会提供淘宝优惠券的领取服务。
卓越笔触：打造高质量文章的艺术与科学京东云开发者大数据人工智能运维
引言在信息爆炸的时代，写作不仅是一种表达，更是一种影响力的体现。无论是为了提升个人品牌，还是为了增强团队的技术氛围，或是推动集团的技术影响力，一篇高质量的文章都能起到关键作用。在这次分享中，我将探讨为什么我们需要写好文章，并提供实用的技巧，帮助大家提升文章的质量。希望这次分享能激发大家的写作热情，共同推动技术交流与知识传播的进程。一：我们为什么要写一篇好文章？1、对于集团2024年巴黎奥运会已结束
STM32 Cube IDE HAL库驱动 W25Q128 进行读、写、擦除操作_w25q128驱动程序(1) 2401_85012262 2024年程序员学习物联网嵌入式硬件面试
收集整理了一份《2024年最新物联网嵌入式全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升的朋友。如果你需要这些资料，可以戳这里获取需要这些体系化资料的朋友，可以加我V获取：vip1024c（备注嵌入式）一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习
最新go-mciro系列(四)使用nacos作为配置中心_go使用nacos(1)，字节跳动面试必问 2401_84904639 程序员 go 学习面试
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！import(“fmt”“github.com/
收藏！打造高质量技术文章的 8 个技巧京东零售技术写作
在信息爆炸的时代，写作不仅是一种表达，更是一种影响力的体现。无论是为了提升个人品牌，还是为了增强团队的技术氛围，或是推动公司的技术影响力，一篇高质量的文章都能起到关键作用。今天给大家分享打造高质量技术文章的8个技巧，由零售技术后端开发工程师孟冬同学所总结。帮助大家提升文章的质量，激发大家的写作热情，共同推动技术交流与知识传播的进程。1、换位思考应当试着站在读者的角度思考，讲清楚。是什么？为什么？怎
479.迪斯尼公主动漫主题网页大学生期末大作业 Web前端网页制作 html+css+js 仙女网页制作 Web网页设计实例动漫前端课程设计 html
目录一、网页概述二、网页文件三、网页效果四、代码展示1.html2.CSS3.JS五、总结1.简洁实用2.使用方便3.整体性好4.形象突出5.交互式强六、更多推荐欢迎光临仙女的网页世界！这里有各行各业的Web前端网页制作的案例，样式齐全新颖，并持续更新！感谢CSDN，提供了这么好的知识学习、技术交流的平台，让我们在这里相遇，小伙伴们，来吧，让我们一起开启Web前端网页制作的奇妙之旅！说起Web前端
Python基础：在python中一定要会的知识点-字典的增，删，改，查_python字典的增删改查安卓开发top 程序员 python 学习面试
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！dic={“六月”:99,“七月”:“99”}字典
用Python搞定接口自动化测试：轻松实现RPC协议接口测试_python测试rpc接口 2401_84141210 程序员 rpc 网络协议网络
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！Hessian是一款基于HTTP协议的RPC框架，采
Anaconda安装与Python虚拟环境配置保姆级图文教程(附速查字典)_anaconda配置python环境 2401_84976246 程序员 c语言 c++学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！目录1混乱的Python库2什么是Anacond
ubuntu 16(7) 2401_84715880 单元测试功能测试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！conf：存放配置文件html：静态网页logs：存
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(4) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！org.apache.hadoophadoop-com
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(3) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！xmlns:xsi="http://www.w3.or
2024最便宜的打车软件，盘点几款最实用省钱的手机软件返金app平台高佣返利省钱
打车软件哪个最好用？小编给大家推荐一些便宜好用的打车软件，主要包括有花小猪打车，返金商城APP等，app内为用户提供了便捷的打车服务，而且还支持不同的打车方式，让你可以轻松出行，平台中还为大家提供了优惠的打车方案，让你可以节省打车费用，有需要的用户快来下载吧。第一名，花小猪打车，不管是新用户还是老用户，通过下方花小猪2024年官方活动二维码进入领取红包，最低10元，最高可获得免单打车，另外打车后还
tkinter+sqlite3学生信息管理系统_python图形界面数据库tkinter+sqlite3 2301_82244392 程序员 python 学习面试
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！用到了sqlite数据库，std_data.py文
Windows系统中通过命令查看文件的MD5,SHA1,SHA256校验值_win2008 校验sha256sum(1) 2301_82244392 运维 linux 面试
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获取！一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！certutil-hashfileyourfil
最新【JAVA问题解决方案】02，字节跳动大数据开发高级工程师 2401_84586779 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！publicvoidexcelTest(){Lists
2024龙年微信红包封面序列号有哪些，快来了解下！小小编007
在2024年龙年春节即将来临之际，微信红包封面也迎来了新的变化。今年的红包封面不仅设计精美，而且富有创意，给用户带来了不一样的惊喜。那么，2024龙年微信红包封面序列号有哪些呢？下面就为大家一一揭晓。首先，让我们来看看如何获取微信红包封面。用户可以通过以下三种方式获取：一是通过参与微信官方活动获得，二是通过付费购买获得，三是获得网上免费序列号。无论是哪种方式，用户都可以获得精美的红包封面，为春节增
阿里云服务器如何购买才更便宜，便宜购买经验分享阿里云最新优惠和活动汇总
虽然阿里云各种便宜活动中都推出了不少便宜的云服务器，但是有些用户可能觉得活动中没有自己想要购买的云服务器配置，即使有自己想要的配置，有些朋友还想以更加便宜的价格购买阿里云服务器，下面小编分享的目前行之有效的便宜购买阿里云服务器的方法，总共4点经验，以供大家参考。第一，要想便宜购买阿里云服务器，必须先领取阿里云满减优惠券满减优惠券领取地址：阿里云官方活动中心满减优惠券面额：30元、50元、80元。阿
详解python中的pandas.read_csv()函数程序员洲洲 Python学习 python pandas readcsv csv
作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。同时欢迎大家关注其他专栏，我将分享Web前后端开发、人工智能、机器学习、深度学习从0到1系列文章。同时洲洲已经建立了程序员技术交流群，如果您感兴趣，可以私信我加入社群，可以直接vx联系（文末有名片）v：bdizztt随时欢迎您跟我沟通，一起交流，一起成长、进步！点此也可
2024年最新2024整理 iptables防火墙学习笔记大全_modepro iptables，2024年最新最新Linux运维高级面试题汇总 2024云技术程序员运维学习笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获取！一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！–flush-F[chain]Deleteall
某短视频新算法之a_bogus逆向分析往日情怀酿做酒 V1763929638 常见爬虫前端爬虫大数据
本文纯技术交流，与平台无任何关系1.抓包分析我们进入到章若楠的主页面，进行抓包分析，发现有很多包，发现web/aweme/post这个包比其他的包都大，很有可能就是我们想要的数据进去查看预览发现这个就是我们想要的数据请求标头里没发现有需要逆向的参数载荷里发现sec_user_id明显就是章若楠小姐姐对应的id咯，然后就是a_bogus和msToken这两个看起来都像是需要逆向的，想练手的可以试着都
淘宝优惠券怎么用？轻松享受购物优惠的秘诀！氧惠佣金真的高
淘宝作为中国最大的网络购物平台，吸引了无数消费者的目光。在淘宝购物时，使用优惠券不仅可以享受到更多的折扣，还能让我们在购物过程中节省不少开支。那么，淘宝优惠券怎么用呢？本文将为您详细解析淘宝优惠券的使用方法，让您轻松享受购物优惠。首先，我们需要了解淘宝优惠券的来源。淘宝优惠券的发放渠道多种多样，包括商家自主发放、淘宝官方活动、第三方优惠券平台等。消费者可以通过关注淘宝首页的活动专区、订阅商家的店铺
解析“吃豆人”小游戏，附赠免费完整代码海拥✘ 100个摸鱼小游戏游戏 html5
个人网站:【摸鱼游戏】【神级代码资源网站】【海拥导航】一站式轻松构建小程序、Web网站、移动应用：注册地址基于Web端打造的：轻量化工具创作平台想寻找共同学习交流，摸鱼划水的小伙伴，请点击【全栈技术交流群】在这篇文章中，我们将逐段解析一个简单的“吃豆人”游戏代码，帮助大家理解其中的实现逻辑。这款游戏通过HTML5的元素和JavaScript来开发，虽然代码量不大，但它展示了如何实现一个基础的小游戏
Go最新慢 SQL 分析与优化(3)，2024年最新Golang零基础 2401_84905024 面试学习路线阿里巴巴 go 学习面试
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！该方式较方式一的优点在于可并行查询，每个分段查询
2024年网络安全最全二蛋赠书二十期：《Python数据分析》，阿里架构师深入讲解网络安全开发 2401_84264583 程序员 web安全 python 数据分析
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以点击这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！总之，对于Python的学习和掌握为开发者提供了一个
阿里云注册登陆抽奖活动，最高888元无门槛代金券，100%中奖阿里云最新优惠和活动汇总
注册有礼活动是阿里云为新用户注册并登陆账号而推出的抽奖活动，用户完成注册并登陆活动页面即可参与抽奖，100%中奖，最高888无门槛代金券，同时还有免费试用云产品福利。官方活动详情页：https://www.aliyun.com/1111/register?source=5176.11533457&userCode=se6p9xeg注册有奖图.png一、完成注册并登陆账号参与抽奖，100%中奖1、用
最全攻略！教你如何在淘宝上找到并使用优惠券，省钱买到理想商品！浮沉导师
淘宝作为中国最大的电商平台之一，为用户提供了丰富多样的商品选择。然而，许多人对于如何找到并使用淘宝优惠券感到困惑。在本文中，我们将为您详细介绍几种容易找到淘宝优惠券的方法，并提供一些使用优惠券的实用技巧。让我们一起来探索吧，省钱购物不再是梦！一、关注淘宝官方活动淘宝经常会举办各类促销活动，例如双11、618等大型购物节，以及每日限时抢购等。在这些活动中，淘宝会发放大量优惠券供用户领取和使用。您可以
15：00面试，15：06就出来了，问的问题有点变态。。 2401_84558914 程序员单元测试功能测试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！感觉好简单的题，硬是没有答出来，早知道好好看看一大佬
LLM训练、精调与加速：大型语言模型的高效开发与应用策略知识学习分享交流人工智能 nlp AI 语言模型人工智能自然语言处理
创作不易，您的关注、点赞、收藏和转发是我坚持下去的动力！大家有技术交流指导、论文及技术文档写作指导、项目开发合作的需求可以私信联系我LLM（大型语言模型）的训练、精调和加速是当前人工智能研究和应用中的重要话题。下面将详细介绍这些概念及其关键技术。1.训练（Training）训练是指使用大规模数据集对LLM进行初步的学习，使其能够理解和生成自然语言。训练过程通常涉及以下步骤：数据收集与预处理：收集大
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他