第五季度

【Python/爬虫】python爬虫快速入门及实战（古诗文，电影，题目数据收集）

Python爬虫快速入门及实战

需要提前掌握：html、css基础知识，网络通信基础知识、http请求和响应报文基础知识
主要使用的库：

requests（发请求和获取响应）
beautifulsoup4（解析html，它的css选择器很好用）
fake-useragent（产生虚假的浏览器请求头代理信息）
PyMySQL（用来把爬到的数据保存到MySQL数据库）

一、requests库的使用

在这个库中，主要使用三个方法：

get()
post()
session()

这三个方法都有几个参数可供配置：

url 字符串，统一资源定位符，发起请求的地址
data 一个字典，post请求的请求体内容
headers 一个字典，其中主要配置user-agent、cookie等信息
proxies 一个字典，代理ip
timeout 整数，秒，发起请求后服务器在这个时间内没有响应，报错

这三个方法都会return回一个响应对象（response），这个对象中可以获取以下信息：

content 响应内容的字节码格式
text 响应内容的字符串格式
json 响应内容的json格式
status_code 响应码
cookies 响应的cookies
headers 响应头
url 响应的url

二、beautifulsoup4库的使用

主要讲解这个库中css选择器的使用。
基本用法如下：

# 导入bs对象
from bs4 import BeautifulSoup
# 构造解析特定Html的bs对象
soup = BeautifulSoup(html_text, "lxml") # “lxml”是c语言的解析器，速度会更快，但是要安装lxml这个库才能使用。pip install lxml
# 使用soup的css选择器解析出html中的标签元素
tag_list = soup.select(".cont > p > a > b")  # 类选择器、标签选择器和父子选择器
for tag in tag_list:
	print(tag.text) #得到标签元素中的内容
	print(tag.attrs["href"]) #得到标签元素中href这个属性的内容

实战一——静态网站内容爬取

目标：收集古诗文网站上李白的100篇诗文，保存到MySQL数据库中。
特点：静态页面获取，分页获取。这是最简单的爬虫。

首先，分析要爬取的界面的信息。

手动点击，切换页面，可以得到每一页的url规律如下：

https://so.gushiwen.cn/shiwens/default.aspx?page=1&tstr=&astr=%e6%9d%8e%e7%99%bd&cstr=&xstr=
https://so.gushiwen.cn/shiwens/default.aspx?page=2&tstr=&astr=%e6%9d%8e%e7%99%bd&cstr=&xstr=
https://so.gushiwen.cn/shiwens/default.aspx?page=3&tstr=&astr=%e6%9d%8e%e7%99%bd&cstr=&xstr=
……

可以很明显看出每一页是由page这个参数进行控制的。
一页有10条内容，按F12打开浏览器控制器，发现诗文的标题在类名为cont的div标签的第一个p标签的a标签中。诗文内容在类名为contson的div标签中。
所以思路是：使用requests发起请求获得每一页的html代码，使用bs4解析html得到诗文的标题和内容，将诗文和内容保存进数据库中。

源码如下：

import requests
import pymysql
import uuid

from bs4 import BeautifulSoup
from fake_useragent import UserAgent


url = "https://so.gushiwen.cn/shiwens/default.aspx?page={}&tstr=&astr=%e6%9d%8e%e7%99%bd&cstr=&xstr="
headers = {
    "user-agent": UserAgent().random
}
for i in range(1, 11):
    resp = requests.get(url=url.format(i), headers=headers)
    soup = BeautifulSoup(resp.text, "lxml")
    # 获取诗文标题所在的标签的列表
    b_tag_list = soup.select(".cont > p > a > b")
    # 获取诗文内容所在的标签的列表
    contson_tag_list = soup.select(".contson")

    # 创建数据库连接
    mysql_connnet = pymysql.connect(host="127.0.0.1",user="root",password="123456",database="spider_db",charset="utf8")
    # 由连接创建光标 光标可以执行sql语句
    mysql_cursor = mysql_connnet.cursor()

    for index in range(len(contson_tag_list)):
        print("=" * 50)
        print("标题：")
        poem_title = b_tag_list[index].text
        print(poem_title)
        print("内容：")
        poem_content = contson_tag_list[index].text.strip().replace("。", "。\n").replace("？","？\n").replace("！","！\n").replace(")",")\n")
        print(poem_content)
        print("=" * 50)
        # 把标题和内容插入表
        sql = "insert into poem_spider(poem_id,poem_title,poem_content) values('{0}','{1}','{2}')"
        sql = sql.format(uuid.uuid1(), poem_title, poem_content)
        mysql_cursor.execute(sql)
        # 需要提交事务，不然数据库中不会新增
        mysql_connnet.commit()

    # 释放mysql光标和连接内容
    mysql_cursor.close()
    mysql_connnet.close()

实现效果：

实战二——动态网站内容爬取

目标：收集豆瓣电影分类排行榜 - 剧情片，好于90%-80%的912部剧情片电影数据：电影名、排名、电影分类、评分、评价人数，并将信息保存到csv文件中。
特点：数据不是一次就加载完毕，需要手动利用鼠标点击、鼠标滑动到页面底部等操作，才能浏览电影信息。这是一个动态页面。

进入网址：

https://movie.douban.com/typerank?type_name=%E5%89%A7%E6%83%85&type=11&interval_id=100:90&action=

接下来点击页面上的滑块，筛选出好于90%-80%的电影，鼠标滑动到底部，同时按下F12打开控制台，进入网络进行抓包。

至此，我们已经了解了请求触发的顺序：

# 滑动鼠标的请求
https://movie.douban.com/j/chart/top_list?type=11&interval_id=90%3A80&action=&start=0&limit=20
https://movie.douban.com/j/chart/top_list?type=11&interval_id=90%3A80&action=&start=20&limit=20
https://movie.douban.com/j/chart/top_list?type=11&interval_id=90%3A80&action=&start=40&limit=20
https://movie.douban.com/j/chart/top_list?type=11&interval_id=90%3A80&action=&start=60&limit=20
……（请求非常有规律）

注意：我们要爬取的内容已经在这些请求的响应中了，所以不需要再去解析Html中的元素获取数据。

到了这里，就可以编写代码了。思路是：发起请求获取响应，将响应的json数据利用python中的json库解析成字典对象，将字典对象中的数据写入csv文件中。
源码如下：

import requests
import json

from fake_useragent import UserAgent

url = "https://movie.douban.com/j/chart/top_list?type=11&interval_id=90%3A80&action=&start={}&limit=20"
headers = {
    "user-agent": UserAgent().random
}

# csv文件
csv_file = open(file="../data/movie_csv_data.csv",mode="w",encoding="utf8",newline="\n")
csv_file.write("电影名,电影排名,电影分类,电影评分,电影评价人数\n")

# 一共有912部电影，每次请求得到20部的数据，需要请求46次
for start in range(0, 901, 20):
    # 发起请求得到响应
    resp = requests.get(url=url.format(start), headers=headers)
    movie_data_dict_list = json.loads(resp.text)
    for movie_data_dict in movie_data_dict_list:
        title = movie_data_dict["title"]
        rank = movie_data_dict["rank"]
        types = str(movie_data_dict["types"]).replace(",","-").replace("'","")
        score = movie_data_dict["score"]
        vote_count = movie_data_dict["vote_count"]
        print("=" * 50)
        print("电影名：{}".format(title))
        print("电影排名：{}".format(rank))
        print("电影分类：{}".format(types))
        print("电影评分：{}".format(score))
        print("电影评价人数：{}".format(vote_count))
        print("=" * 50)
        csv_file.write("{0},{1},{2},{3},{4}\n".format(title,rank,types,score,vote_count))
csv_file.close()

实现效果：

实战三——利用cookie伪装登录状态爬取内容

目标：实现牛客网登录以及登录状态维持，收集C语言30道题
特点：牛客网需要先进行登录之后获取牛客网服务器签发给我们的cookie，之后每次请求都需要携带上这个cookie才能查看题库中的题目。
一种方法是使用requests库中的session函数。思路是：利用session()发送登录请求之后，session()会把响应中的cookie保存起来，之后每次使用session()发送请求都会在请求头中附加上cookie维持登录状态。不过牛客网登录有验证码的存在，不是提交登录请求就可以轻易获取cookie的，所以这种方法实现起来会非常麻烦（需要另外做一些验证码图像识别的工作）。
另外一种方法就是手动获取cookie。思路是：我们自己先登录进去，然后通过抓包查看请求头中的cookie到底是什么样子，之后手动把这个cookie放到我们的请求头中。我们采用这种方法进行实战。

实战步骤

首先，登录进牛客网并且进入它的题库，之后配置题目选项为：每次出30道题。

进入c语言题库，模拟做题，同时按下F12，观察发送的请求中的cookie。注意，这里有不少包，而且一些包中的cookie有可能是不行的。所以要多加鉴别。

接下来观察html的元素结构。我们要获取的内容是题目+选项。选择题目所在的元素，可以看到类名是.commonPaperHtml.tw-flex-1.tw-w-0。选择选项所在的元素可以看到选项所在的类名是.question-select。

根据以上分析，源码如下：

import uuid

import pymysql
import requests
from bs4 import BeautifulSoup

url = "https://www.nowcoder.com/exam/test/68987832/detail?examPageSource=Intelligent&pid=49560691&testCallback=https%3A%2F%2Fwww.nowcoder.com%2Fexam%2Fintelligent%3FquestionJobId%3D10%26tagId%3D21004&testclass=%E8%BD%AF%E4%BB%B6%E5%BC%80%E5%8F%91"
headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36",
    "cookie": "你的cookie",
}

# 数据库连接
mysql_connect = pymysql.connect(host="127.0.0.1",user="root",password="123456",database="spider_db",charset="utf8")
mysql_cursor = mysql_connect.cursor()

# 发送请求获取响应
session = requests.Session()
resp = session.get(url=url, headers=headers)
html_text = resp.text
# 解析html页面
soup = BeautifulSoup(html_text, "lxml")
question_tag_list = soup.select(".commonPaperHtml.tw-flex-1.tw-w-0")
option_tag_list = soup.select(".question-select")
for index in range(len(question_tag_list)):
    question_content = question_tag_list[index].text.replace("（）", "（）\n").replace("'","’").replace('"','”')
    question_select = option_tag_list[index].text.replace("A ", " A、").replace("B ", " B、").replace("C "," C、").replace("D ", " D、").replace("'","‘").replace('"','”')
    print("=" * 50)
    print("题目：{}".format(question_content))
    print("选项：{}".format(question_select))
    print("=" * 50)
    # 把数据添加进数据库
    sql = "insert into question_spider(question_id,question_content,question_select) values('{0}','{1}','{2}')"
    sql = sql.format(uuid.uuid1(),question_content,question_select)
    mysql_cursor.execute(sql)
    mysql_connect.commit()
    
mysql_cursor.close()
mysql_connect.close()

效果如下：

本来是想要收集300道题的，但是我发现每一次点击进C语言题库做题，url中的两个参数都会改变，而且这两个参数我没有找到什么规律。如果有小伙伴知道如何解决这个问题，欢迎在评论区留言~

[Python]实现简单计时器应用 runepic Python python 开发语言
创建一个简单的计时器应用，使用Python的Tkinter库进行图形化界面设计。这个应用包括开始、暂停、重置等功能，可以设置一个倒计时并显示剩余时间。下面是代码实现的详细步骤。1.导入依赖库首先，导入tkinter用于图形界面的构建，并且使用time模块来处理计时。importtkinterastkfromtkinterimportmessageboximporttime2.创建主应用类将所有的逻
[python]使用 Pandas 分组和汇总表数据 runepic Python python pandas 开发语言
在数据分析中，数据的分组与汇总是非常常见的操作。下面使用Python的Pandas库来处理表数据，并生成汇总结果。导入数据首先，我们需要导入必要的库并读取Excel文件中的数据：importpandasaspd#读取工资表数据df=pd.read_excel('输入.xlsx')假设我们的表数据如下所示：姓名基础1基础2其他张三500020001000李四600025001200王五4500220
Django内置的ORM框架 ~春华秋实~ 测试知识大杂烩
Django中内嵌了ORM框架，ORM框架可以将类肯数据表进行对应起来只需要通过类和对象就可以对数据表进行操作。、设计类：models中设计模型类ORM宁外一个作用，根据设计的类生成数据库中的表数据库sqlite3：sudoapt-getinstallsqliteman1，生成迁移文件pythonmanage.pymakemigrations2，执行扦移生成表pythonmanage.pymigr
使用Python进行自动化测试：Behave与BDD的结合步入烟尘 python 开发语言
使用Python进行自动化测试：Behave与BDD的结合自动化测试是现代软件开发中不可或缺的一部分，它能够提高软件质量、加速开发周期并减少回归测试的成本。在Python领域，Behave作为一种行为驱动开发（BDD）工具，为开发人员提供了一种清晰、可读性强的方式来编写和执行测试用例。本文将介绍如何使用Python中的Behave库结合BDD来进行自动化测试，以及一些实际的代码示例。什么是BDD？
python的函数介绍心愿王 python 前端 javascript
一.定义和调用函数1.定义函数在Python中，使用def关键字来定义一个函数。函数可以包含参数，也可以包含返回值基本语法deffunction_name(parameters):"""docstring"""#Functionbodyreturnresultdefgreet(name):"""Thisfunctiongreetsthepersonpassedastheparameter."""r
基于Python的网络爬虫：天气数据爬取与可视化分析傅炯耘Shelley
基于Python的网络爬虫：天气数据爬取与可视化分析基于python爬取天气数据信息与可视化分析.zip项目地址:https://gitcode.com/open-source-toolkit/55ebe项目简介本项目是一个基于Python的网络爬虫课程大作业，旨在通过网络爬虫技术爬取天气数据，并利用Matplotlib和sk-learn等工具进行数据可视化分析。项目中包含了完整的代码实现、演示P
python按要求分割excel一列成两列 EaSoNgo111 excel python 开发语言
importopenpyxl#加载Excel文件workbook=openpyxl.load_workbook('example.xlsx')sheet=workbook.active#获取需要处理的列source_column=sheet['A']#定义输出列name_school_column=[]#循环遍历每个单元格forcellinsource_column:#分割姓名和学校parts=c
https://imgsa.baidu.com/forum/pic/item/...【贴吧图床】小黑LLB 杂项贴吧图床 python 爬虫诶改了标签没办法用颜表情了
参考链接隐藏图床之利用贴吧做图床-PHP版图床-百度百科什么是『图床』你们都用什么图床啊？使用Pythonrequestspost上传图片贴吧图床-小记目录1.这个链接是啥2.什么是图床3.利用贴吧做图床4.编程实现5.心得体会一、这个链接是啥↶之前逛B站的时候，看到有人在评论区放图，结果是一个链接，点进去就是一张动态图。？？？B站评论区可以发图的么。。。什么鬼后来，在查找资料的过程中，发现原来这
ImportError: urllib3 v2.0 only supports OpenSSL 1.1.1+, currently the ‘ssl‘ module is compiled with D11_ ssl 服务器 linux
pycharm运行python项目发送request请求时报错ImportError:urllib3v2.0onlysupportsOpenSSL1.1.1+,currentlythe'ssl'moduleiscompiledwith。。。。。。。的错误这个错误是由于你的pycharm环境中的urib3库版本与ss!模块的OpenSSL版本不兼容导致的。urlib3v2.0版本只支持OpenSSL
[python]使用 Pandas 处理 Excel 数据：分割与展开列操作 runepic Python python pandas excel
在数据处理的过程中，时常需要对Excel表格中的数据进行清洗与转换，下面介绍使用Python中的Pandas库对Excel文件中的数据进行操作，具体包括分割列、展开数据、清除空格以及格式转换等操作。目标：读取一个没有表头的Excel文件。分割指定列的数据，并展开成多个行。清除空格，并按空格将列数据拆分成两列。删除原始列，保持数据格式整洁。保存处理后的数据到新的Excel文件。示例代码importp
Ansible在多台服务器上运行python脚本罗sir 99 ansible 服务器 python
使用Ansible在多台服务器上批量运行Python脚本是一种高效且可靠的方式。以下是具体的实现步骤和示例代码：---###1.准备工作-**安装Ansible**：确保您的Ansible控制节点已安装Ansible。如果没有安装，可以通过以下命令安装：```bashpipinstallansible```-**配置Inventory文件**：在Ansible控制节点上创建一个`hosts.ini
Python 实现 Ollama 提示词生成与优化系统老大白菜机器学习 python python 开发语言
1.基础环境配置importrequestsimportjsonfromtypingimportList,Dict,Optionalfromdataclassesimportdataclass@dataclassclassPromptContext:task:strdomain:strrequirements:List[str]classOllamaService:def__init__(self
简单爬虫的实现菜狗woc 爬虫 python 开发语言
简单爬虫的实现爬虫的简要介绍爬虫的简单实现运用python的库尝试向网页发送请求处理得到的数据爬虫的简要介绍爬虫就是在网络上通过伪装为用户从而从网站上下载数据的程序或者行为。这样的行为就好比你去别人家的时候带走了几个橘子袖中怀橘啦，合理的爬取是可以的（毕竟人家网站做着就是给人用的，但是不要耽误叔叔赚钱.jpg）爬虫的简单实现运用python的库在本次教程中我们使用了request库和beautif
简单的if判断（python）菜狗woc python
文章目录前言一、if判断介绍二、例子1.判断奇偶数总结前言简单介绍一下python中的if语句一、if判断介绍简单来说，if语句就是个闸口，通过判断条件来处理问题，使得主程序流向流向不同的方向。一般来说，if语句主要有以下几种：单分支，双分支，多分支，分支嵌套。二、例子1.判断奇偶数a=int(input("输入一个非负整数"))ifa%2==0print("偶数")这就是一个简单的单分支判断语句
使用python实现Hadoop中MapReduce qq_44801116 Python python hadoop mapreduce
Hadoop包含HDFS(分布式文件系统)、YARN（资源管理器）、MapReduce（编程模型）。一、三大组件的简介（1）HDFS（HadoopDistributedFileSystem）：HDFS是Hadoop的分布式文件系统，它是将大规模数据分散存储在多个节点上的基础。主要负责数据的存储和管理，可以将大数据集分成多个数据块，并将数据块分配到不同的计算节点上存储，提高数据的可靠性和处理效率。旨
python的dict和set Akzeptieren 我的Python笔记 python
python的dict和setdictPython字典：dict，使用键-值对（key-value）存储数据，具有较快的查找速度。举个例子，假设要根据一个人的的名字查找对应的对应的数据，如果用list实现，需要两个list：names=['张三','李四','王五']scores=[88,78,89]我们寻找对应的人的成绩，就先要在names中找到对应的位置，再从scores取出对应的成绩，数据越
【大数据技术】编写Python代码实现词频统计（python+hadoop+mapreduce+yarn） Want595 Python大数据采集与分析大数据 python hadoop
编写Python代码实现词频统计（python+hadoop+mapreduce+yarn）搭建完全分布式高可用大数据集群（VMware+CentOS+FinalShell）搭建完全分布式高可用大数据集群（Hadoop+MapReduce+Yarn）本机PyCharm连接CentOS虚拟机在阅读本文前，请确保已经阅读过以上三篇文章，成功搭建了Hadoop+MapReduce+Yarn+Python
Python的循环 Akzeptieren 我的Python笔记 python 开发语言
Python的循环Python的循环有两种，分别是for…in循环和while循环。for…in循环假设我们要循环输出一个列表里的元素：names=['张三','李四','王五']fornameinnames:print(name)执行这段代码后，会依次打印names的每一个元素：张三李四王五所以forxin...循环就是把每个元素代入变量x，然后执行后面的语句。while循环只要条件满足，就不断
鸿蒙5.0开发【应用并发设计（线程间通信）】架构蒸糕笑QAQ harmonyos5.0 harmonyos 架构华为鸿蒙系统鸿蒙
线程间通信概述线程间通信指的是并发多线程间存在的数据交换行为，目前已支持ArkTS、C++等开发语言，因此存在不同语言、不同线程的通信场景，接下来详细展开介绍。同语言线程间通信（ArkTS内）场景描述ArkTS线程指的是包含ArkTS运行环境的线程，包括主线程、TaskPool线程、Worker线程。它们之间可以通过不同的接口进行通信。常见业务场景如下所示：常见业务场景具体业务描述宿主JS线程Ta
【附源码】基于flask框架民宿后台管理系统的设计与实现 (python+mysql+论文) 海彤程序设计 python flask mysql
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：随着旅游业的迅猛发展，民宿作为一种新型的住宿方式，越来越受到人们的欢迎。民宿不仅提供了传统酒店无法比拟的个性化和温馨的家庭氛围，还为旅客提供了更加深入当地文化的体验。然而，伴随着民宿市场的快速扩张，管理上的复杂性也随之增加。对于民宿经营者来说，如何有效地管理客房预订、客户信息、房态更新、
python各个模块以及学习文档链接 Perhaps# Python python 正则表达式爬虫
Python_base一、python模块二、其他链接一、python模块名称来源用途类别链接os标准库文件和路径操作基础类https://docs.python.org/zh-cn/3/library/os.html#sys标准库系统和环境基础类https://docs.python.org/3/library/sys.htmltime标准库有关时间操作基础类https://docs.pytho
常用python库总结一口好锅 python python
#来源库名库介绍库类别使用频率参考1标准库os文件和路径操作功能基础类★★★★★2标准库sys系统和环境相关功能基础类★★★☆☆3标准库time时间库基础类★★★★☆4标准库datetime日期处理库基础类★★★★★5第三方库dateutildatetime模块的扩展基础类★★☆☆☆6标准库math数学函数库基础类★★★★☆7标准库random随机数库基础类★★★☆☆8标准库re正则表达式功能基础
python中创建多个按钮_Python-在PyQt5中循环创建按钮 - python weixin_39979332 python中创建多个按钮
我一直在尝试根据PyQt5中变量的值创建X个按钮，但是我的方法不起作用。我创建了一个带有循环的函数，其中X值为按钮的数量。此代码(功能已注释)有效：classUi_MainWindow(object):defsetupUi(self,MainWindow):defcreateButtons(x):number_of_buttons=xtable_set=1distance_from_left=5w
Mongodb学习笔记 --- python读取mongodb数据杨鑫newlfe Python 数据库大数据挖掘与大数据应用案例
#-*-coding:utf-8-*-importpymongo__author__='yangxin'classMongodbConn(object):
python 库总结杜小伙伴 python 正则表达式后端
原文链接：https://blog.csdn.net/xufive/article/details/102676755在这个列表中，把模块分成11大类：基础类数据库接口类网络通讯类音像游戏类GUI类web框架类科学计算类2D/3D类数据处理类机器学习类工具类针对每一个模块给出了相应的推荐指数，从1颗星到5颗星。这是一个非常主观的判断，仅供参考。★☆☆☆☆：较少被用到★★☆☆☆：重要但较少被用到，★
【Triton 教程】triton.autotune
Triton是一种用于并行编程的语言和编译器。它旨在提供一个基于Python的编程环境，以高效编写自定义DNN计算内核，并能够在现代GPU硬件上以最大吞吐量运行。更多Triton中文文档可访问→https://triton.hyper.ai/triton.autotune(configs,key,prune_configs_by=None,reset_to_zero=None,restore_va
基于 Python 的 Flask 框架构建高性能 Web 应用程序全栈探索者chen python python flask 前端开发语言程序人生性能优化高并发
基于Python的Flask框架构建高性能Web应用程序Flask是一个使用Python编写的轻量级Web框架，因其简单灵活的设计而受到广大开发者的欢迎。从小型项目到企业级应用，Flask都能够胜任。然而，随着应用规模的扩大，如何在保持代码简单的同时提升应用性能，成为许多开发者关注的重点。本篇文章从Flask的基本特性开始，结合优化策略、实践案例，全面讲解如何利用Flask构建高性能Web应用程序
Python Jupyter安装 zm147451753
安装Jupyter：pipinstallJupyter打开notebookJupyternotebook命令行提示错误ModuleNotFoundError:Nomodulenamed'prompt_toolkit'Thesolutionformewastopipuninstallprompt-toolkitandpipinstallprompt-toolkit.Thisuninstalledv1
R语言：将R语言中的Seurat数据对象转换为Python能处理的h5ad格式 S.GJ r语言 python 开发语言
背景在基因组学数据分析场景下，有些数据被保存为了R语言中的Seurat对象格式，我们的需求是将Seurat对象格式的数据转换为Python能处理的h5ad格式。R处理代码###1.准备工作#1.1readr包安装install.packages("readr")#1.2Seurat包安装#略#1.3SeuratDisk包安装remotes::install_github("mojaveazure/
python安装jupyter qq_27390023 python jupyter
JupyterNotebook的本质是一个Web应用程序，便于创建和共享程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。###安装pip##pip是一个安装和管理Python包的工具wgethttps://bootstrap.pypa.io/get-pip.pypython3get-pip.py##创建软连接ln-s/usr/
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str