囚生CY

【日常】写给妈妈的微信机器人（用于知网论文下载）

最近妈妈工作需求突然要写论文，我长这么大第一次听说就她还能写论文。可惜我不是学医的，这方面跨得太大基本上无能为力，最多给她润色一下。她那边下论文又不方便，我当天连夜赶了一份微信机器人出来，供她下载论文。

实现逻辑非常简单，微信端用itchat，调用之前就编写好的类CNKI，稍加修改就可以满足妈妈在微信上与我交互，我这边可以自动向她展示知网搜索结果，翻页，查看简介，及下载论文再通过微信发送给她。

典型的类前后端架构，前端用itchat编写，代码如下：

前端

基本上考虑了所有的业务逻辑，我简化了一下，就是下载完论文自动退出系统（否则流程分叉太多我觉得也不是很好写）；

#-*- coding:UTF-8 -*- 
import re
import os
import sys
sys.path.append(r"F:\Programming Software\Python\Project\Project_16（CNKI）")
sys.path.append(r"C:\Users\lenovo\Downloads")

import time
import itchat
from itchat.content import TEXT
from CNKI import CNKI



import json
import numpy
import pandas
import random

from PIL import Image
from requests import Session
from bs4 import BeautifulSoup
from selenium import webdriver
from matplotlib import pyplot as plt
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.action_chains import ActionChains


""" 设置自动回复 """

global cnki, dialcount, flag1, flag2, flag3, flag4, judge1, judge2, judge3, judge4, page, driver, results, URL

dialcount = 0
flag1 = True															 # 下一句话是搜索？
flag2 = False															 # 下一句话是看简介？
flag3 = False															 # 下一句话是要下载论文？
flag4 = False															 # 下一句话是要翻页？
judge1 = False															 # 下一句话是搜索完后的一个判断？
judge2 = False															 # 下一句话是看完简介后的一个判断？
judge3 = False															 # 下一句话是下载完后的一个判断？
judge4 = False															 # 下一句话是搜索完后的一个判断？
driver = None
results = None
page = 1																 # 目前在第几页: 处理翻页
URL = None																 # 记录当前所在URL

string1 = "欢迎使用简化版中国知网系统，请输入你需要查询的关键词！任何时候只要你输入'退出'即可退出当前会话，系统将会重置，你之后可以随时开始一次新的会话。会话中请根据引导信息进行文字输入操作"
string2 = "上面是第{}页的论文信息\n如果需要查看下一页请输入1\n如果重新搜索请输入2\n如果需要查看简介请输入'a+<序号>'\n如果需要下载论文请输入'b+<序号>'".format(page)
string3 = "该论文没有PDF下载选项，如需要下载转人工服务"
string4 = "系统内部逻辑错误，请联系管理员调试代码"

@itchat.msg_register(TEXT,isFriendChat=True,isGroupChat=False,isMpChat=False)
def text_reply(msg):
	global cnki, dialcount, flag1, flag2, flag3, flag4, judge1, judge2, judge3, judge4, page, driver, results, URL
	#itchat.send_msg("[%s]收到好友@%s 的信息：%s\n" %(time.strftime("%Y-%m-%d %H:%M:%S",time.localtime(msg["CreateTime"])),msg["User"]["NickName"], msg["Text"]), "filehelper")

	
	if msg["User"]["NickName"]=="妈妈":
		string = msg["Text"]
		if dialcount==0:
			dialcount = 1
			itchat.send_msg("正在启动系统，这可能需要一段时间...",toUserName=msg["FromUserName"])
			cnki = CNKI()												 # 新建类
			return string1

		elif string=="退出": 											 # 重置会话
			try:
				dialcount = 0
				flag1 = True											 # 下一句话是搜索？
				flag2 = False											 # 下一句话是看简介？
				flag3 = False											 # 下一句话是要下载论文？
				flag4 = False											 # 下一句话是要翻页？
				judge1 = False											 # 下一句话是搜索完后的一个判断？
				judge2 = False											 # 下一句话是看完简介后的一个判断？
				judge3 = False											 # 下一句话是搜索完后的一个判断？
				judge4 = False											 # 下一句话是搜索完后的一个判断？
				driver = None
				results = None
				page = 1
				URL = None
				driver.quit()
			except:
				pass
			return "感谢您的使用，欢迎下次再来！" 

		else:
			if flag1:													 # 处理搜索
				results = cnki.search(string)
				for i in range(len(results["序号"])):
					itchat.send_msg("序号{}\n{}".format(i+1,results["题名"][i]),toUserName=msg["FromUserName"])
				judge1 = True
				flag1 = False
				page = 1
				return string2

			elif judge1:												 # 处理搜索后的选择
				if string==1:											 # 下一页？说实话我害怕driver过期就很麻烦
					results = cnki.search(string,page=page+1,headless=True)	 # 查询下一页
					for i in range(len(results["序号"])):
						itchat.send_msg("序号{}\n{}".format(i+1,results["题名"][i]),toUserName=msg["FromUserName"])
					judge1 = True										 # 仍然是处于搜索后选择的状态
					flag1 = False										 # 可以省略
					page += 1
					return string2
					
				elif string==2:											 # 重新搜索
					judge1 = False										 # 取消judge1
					flag1 = True										 # 重新进入搜索
					page = 1											 # 重置page
					return "搜索引擎已重置，请重新输入关键词！"

				elif string[0]=="a":									 # 查看简介
					try: index = int(string[1:].strip())
					except: return "序号无法转化为整数型, 请重新输入！"
					if index<=20 and index>=1:
						URL = results["链接"][index-1]
						response = cnki.search_for_details(URL)
						itchat.send_msg("{}的简介如下：\n".format(results["题名"][index-1],response),toUserName=msg["FromUserName"])
						judge1 = False									 # 取消judge1
						judge2 = True									 # 进入judge2
						return "简介如上！如需下载该论文请输入1, 如需翻页请按2, 重新搜索请按3"
					else:
						return "序号不在范围内（1~20）, 请重新输入！"

				elif string[0]=="b":									 # 下载文件
					try: index = int(string[1:].strip())
					except: return "序号无法转化为整数型, 请重新输入！"
					if index<=20 and index>=1:
						flag = cnki.download(results["链接"][index-1])	 # 下论文了呗
						if flag==0:
							itchat.send_msg(string3,toUserName=msg["FromUserName"])
							return "请重新输入您要进行的操作"
						elif flag==1:
							itchat.send_msg(string4,toUserName=msg["FromUserName"])
							return "请重新输入您要进行的操作"
						else:
							itchat.send_file("F:\Temp\{}.pdf".format(flag),toUserName=msg["FromUserName"])
							try:
								dialcount = 0
								flag1 = True											 # 下一句话是搜索？
								flag2 = False											 # 下一句话是看简介？
								flag3 = False											 # 下一句话是要下载论文？
								flag4 = False											 # 下一句话是要翻页？
								judge1 = False											 # 下一句话是搜索完后的一个判断？
								judge2 = False											 # 下一句话是看完简介后的一个判断？
								judge3 = False											 # 下一句话是搜索完后的一个判断？
								judge4 = False											 # 下一句话是搜索完后的一个判断？
								driver = None
								results = None
								page = 1
								URL = None
								driver.quit()
							except:
								pass
							return "下载完毕！系统已退出！"
					else:
						return "序号不在范围内（1~20）, 请重新输入！"							

			elif judge2:												 # 查看简介后的judge
				if string=="1":
					flag = cnki.download(URL)	 						 # 下论文了呗
					if flag==0:
						itchat.send_msg(string3,toUserName=msg["FromUserName"])
						return "请重新输入您要进行的操作"
					elif flag==1:
						itchat.send_msg(string4,toUserName=msg["FromUserName"])
						return "请重新输入您要进行的操作"
					else:
						itchat.send_file("F:\Temp\{}.pdf".format(flag),toUserName=msg["FromUserName"])
						try:
							dialcount = 0
							flag1 = True								 # 下一句话是搜索？
							flag2 = False								 # 下一句话是看简介？
							flag3 = False								 # 下一句话是要下载论文？
							flag4 = False								 # 下一句话是要翻页？
							judge1 = False								 # 下一句话是搜索完后的一个判断？
							judge2 = False								 # 下一句话是看完简介后的一个判断？
							judge3 = False								 # 下一句话是搜索完后的一个判断？
							judge4 = False								 # 下一句话是搜索完后的一个判断？
							driver = None
							results = None
							page = 1
							URL = None
							driver.quit()
						except:
							pass
						return "下载完毕！系统已退出！"
					pass
				elif string=="2":										 # 翻页
					results = cnki.search(string,page=page+1,headless=True)			 # 查询下一页
					for i in range(len(results["序号"])):
						itchat.send_msg("序号{}\n{}".format(i+1,results["题名"][i]),toUserName=msg["FromUserName"])
					judge1 = True										 # 仍然是处于搜索后选择的状态
					judge2 = False										 # 可以省略
					page += 1
					return string2
					
				elif string=="3":										 # 重新搜索
					judge1 = False										 # 取消judge1
					flag1 = True										 # 重新进入搜索
					page = 1											 # 重置page
					return "搜索引擎已重置，请重新输入关键词！"					

				else:
					return "您输入的不是1，2，3，请重新输入"
			
if __name__ == "__main__":
	itchat.auto_login()
	itchat.run()

后端

后端主要就是CNKI类，被前端调用，这里我也不说太多，因为代码基本上也很难在其他计算机上跑起来，我写的比较硬，因为赶时间，妈妈急着要，我就记几个坑：

一

知网的搜索结果是被iframe给封装了，所以用selenium时要用switch_to_frame方法先进入iframe才能拿到搜索结果的html；说实话这个问题坑了我很长时间，因为我一直搞不清楚为什么不能获取到搜索结果的html，明明元素都能定位的到；

二

知网的搜索结果中的论文题目的标签中的href超链接地址是没有用的，点进去直接返回知网首页（比如你右键这个论文题目的超链接，选择打开链接，将直接返回知网首页）会重定向应该是，我看了一下只有URLID之后那串神秘代码是有用的，你们可以自己看看，每个论文所在

看下面这张图URL里框出来的部分对比上面这张图的框出来的标签中的href中的URLID字段后面的神秘代码，它们是一样的，事实上虾米那这张图URL中问号"?"后面的部分（即uid=...，这个uid我试过是动态生成的，我就不涂掉了）是没用的，直接删了用requests库访问这个URL就可以拿到这个页面的信息（简介在这个页面上）。不过问题是好像并非所有的论文都有这个URLID，优的DBCODE（比如你搜索"中国知网"得到的论文超链接结构就不一样了）。这可能是知网数据库自身架构的不同，这个也没有什么办法，selenium直接模拟点击的话应该也可以（为什么我说应该，因为我没成功。。。但按理说应该可以，我出的问题是拿不到点击后的页面的URL，应该可以解决），无视一切花里胡哨的噱头。

三

完事点击进来就下载PDF咯，妈妈太笨，只能给她全部弄好，CAJ又不会看，只能把PDF打印出来咯。这里因为下载会有弹窗，我想的办法是用pykeyboard模拟敲击ENTER键下载。我看到的办法还有就是对webdriver进行set_preference，但是我发现无论我怎么设定，webdriver都没有变化（比如设定默认下载路径，禁止弹窗之类的），无奈只能让它下到默认路径再剪切到我要的路径上来了。。。

		self.profile = webdriver.FirefoxProfile()
		profile.set_preference("browser.download.folderList", 2)
		profile.set_preference("browser.download.dir", "d:\\tmp") # 下载路径
		option.set_preference("dom.webnotifications.enabled",False) # 不弹窗（指一个窗口只能有一个标签页）
		browser = webdriver.Firefox(option)

给个CNKI的类吧，可能会跑不起来，反正我能跑就完事了。爬虫还是要自己写的

#-*- coding:UTF-8 -*-
import re
import os
import sys
import time
import json
import numpy
import pandas
import random

from PIL import Image
from requests import Session
from bs4 import BeautifulSoup
from selenium import webdriver
from matplotlib import pyplot as plt
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.keys import Keys
from pykeyboard import PyKeyboard

class CNKI():
	def __init__(self,
		userAgent="Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:63.0) Gecko/20100101 Firefox/63.0",
	):																	 # 构造函数
		""" 类构造参数 """
		self.userAgent = userAgent
		""" 类常用参数 """
		self.workspace = os.getcwd()									 # 类工作目录
		self.date = time.strftime("%Y%m%d")								 # 类构造时间

		self.mainURL = "http://www.cnki.net/"							 # 中国知网主页
		self.searchURL = "http://kns.cnki.net/kns/brief/default_result.aspx"
		self.options = webdriver.FirefoxOptions()						 # 火狐驱动配置
		self.profile = webdriver.FirefoxProfile()
		self.session = Session()										 # 初始化一个可能需要用得到的session: CNKI反爬虫仍然很强势, requests包不太好办
		self.headers = {"User-Agent": userAgent}						 # 设置请求头
		self.downloadFolder = "download"								 # 下载文件夹
		self.tempFolder = "temp"										 # 存储临时文件的文件夹
		self.labelCompiler = re.compile(r"<[^>]+>",re.S)				 # 标签正则编译
		""" 类初始化 """
		self.session.headers = self.headers.copy()
		self.session.get(self.mainURL)									 # 定位中国知网主页
		#self.profile.set_preference("dom.webnotifications.enabled",False)
		self.profile.set_preference("browser.download.folderList",2);
		self.profile.set_preference("browser.download.dir","{}\\{}".format(self.workspace,self.downloadFolder))
		#self.profile.set_preference("browser.helperApps.neverAsk.saveToDisk","pdf,caj");
		#self.profile.set_preference("browser.link.open_newwindow",3)
		if not os.path.exists("{}\\{}".format(self.workspace,self.downloadFolder)):
			string = "正在新建文件夹以存储下载文件..."
			print(string)
			os.mkdir("{}\\{}".format(self.workspace,self.downloadFolder))# 新建文件夹存储下载文件
	
		if not os.path.exists("{}\\{}".format(self.workspace,self.tempFolder)):
			string = "正在新建文件夹以存储临时文件..."
			print(string)
			os.mkdir("{}\\{}".format(self.workspace,self.tempFolder))	 # 新建文件夹存储临时文件		

	def search_for_details(self,url):
		html = self.session.get(url).text
		soup = BeautifulSoup(html,"lxml")
		div = soup.find("div",class_="wxBaseinfo")
		response = str()
		for p in div.find_all("p"):
			string = labelCompiler.sub("",str(p)).replace("\n","").replace("\t","")
			response += "{}\n".format(string)
			if string[:3] == "分类号": break
		return response
	
	def search(self,keyword,
		headless=False,
		page=1,
	):
		options = self.options.add_argument("--headless") if headless else self.options
		driver = webdriver.Firefox(self.profile)
		driver.implicitly_wait(10)										 # 设置等待超时
		driver.get(self.searchURL)
		driver.find_element_by_xpath("//input[@class='rekeyword']").send_keys(keyword)
		driver.find_element_by_xpath("//input[@class='researchbtn']").click()
		driver.switch_to_frame("iframeResult")
		if page==1:
			html = driver.find_element_by_xpath("//table[@width='100%' and @cellspacing='0' and @border='0' and @bgcolor='']").get_attribute("innerHTML")
			soup = BeautifulSoup(html,"lxml")
			aLabels = soup.find_all("a",class_="fz14")
			results = {
				"序号": [],
				"题名": [],
				"链接": [],
			}
			for i in range(len(aLabels)):
				results["序号"].append(i+1)
				title = self.labelCompiler.sub("",str(aLabels[i])).strip("\n").strip("\t").strip()
				results["题名"].append(title)
				href = aLabels[i].attrs["href"]								 # 这个链接是个伪链接, 如果打开它则会重定向回主页, 但是里面有一部分字段是有用的, 我找规律找出了这段有用的字段
				index1 = href.find("URLID")
				index2 = href.find("&",index1)
				trueURL = "http://kns.cnki.net/KCMS/detail/{}.html".format(href[index1+6:index2])
				results["链接"].append(trueURL)
			
			return results,driver
		else:
			driver.find_element_by_xpath("//a[text()='{}']".format(i)).click()
			html = driver.find_element_by_xpath("//table[@width='100%' and @cellspacing='0' and @border='0' and @bgcolor='']").get_attribute("innerHTML")
			soup = BeautifulSoup(html,"lxml")
			aLabels = soup.find_all("a",class_="fz14")
			results = {
				"序号": [],
				"题名": [],
				"链接": [],
			}
			for i in range(len(aLabels)):
				results["序号"].append(i+1)
				title = self.labelCompiler.sub("",str(aLabels[i])).strip("\n").strip("\t").strip()
				results["题名"].append(title)
				href = aLabels[i].attrs["href"]								 # 这个链接是个伪链接, 如果打开它则会重定向回主页, 但是里面有一部分字段是有用的, 我找规律找出了这段有用的字段
				index1 = href.find("URLID")
				index2 = href.find("&",index1)
				trueURL = "http://kns.cnki.net/KCMS/detail/{}.html".format(href[index1+6:index2])
				results["链接"].append(trueURL)
			driver.quit()
			return results

	def download(self,url,
		headless=False,
		default_download_path=r"C:\Users\lenovo\Downloads",
		download_path=r"F:\Temp",
	):
		k = PyKeyboard()
		options = self.options.add_argument("--headless") if headless else self.options
		driver = webdriver.Firefox(self.profile,options=options) if headless else webdriver.Firefox(self.profile)
		driver.get(url)
		try: driver.find_element_by_id("pdfDownF").click()
		except:
			return 0													 # return 0 是没有pdf下载的选项
		count = 0
		while True:
			if count==0: time.sleep(5.)									 # 第一次等5秒
			else: time.sleep(1.)										 # 之后等1秒
			k.tap_key(13)												 # 敲击回车键
			isFile = len(list(os.walk(default_download_path))[0][2])	 # 看看默认路径下有几个文件
			if isFile==0:												 # 没下好, 继续下
				count += 1
				continue
			elif isFile==1:
				rename = time.strftime("%Y%m%d%H%M%S")
				os.system(r"rename {}\*.pdf {}\{}.pdf".format(default_download_path,default_download_path,rename))
				os.system(r"move *.pdf {}".format(download_path))		 # 移动到下载路径（不能有空格）
				driver.quit()
				return rename
			else:														 # 
				driver.quit()
				return 1												 # return 1 是系统逻辑错误

if __name__=="__main__":
	cnki = CNKI()
	#cnki.search("农业")
	cnki.download("http://kns.cnki.net/KCMS/detail/44.1267.S.20190529.1324.004.html")

分享学习，共同进步！

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
怎么起诉借钱不还的人？怎样起诉欠款不还的人？影子爱学习
怎么起诉借钱不还的人？怎样起诉欠款不还的人？如果遇到难以解决的法律问题，我们可以匹配专业律师。例如：婚姻家庭（离婚纠纷）、刑事辩护、合同纠纷、债权债务、房产（继承）纠纷、交通事故、劳动争议、人身损害、公司相关法律事务（法律顾问）等咨询推荐手机/微信:15633770876【全国案件皆可】借钱不还起诉对方需要哪些资料起诉欠钱不还的，一般需要的材料包括以下这些：借据、收据、欠条、付款凭证等证据，以及向
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
似乎老是忘记什么东西灰台
S带上了耳机，眼前的一切都与她隔绝开来。虽是初春的好天气，花都开的正鲜艳，行人也都驻足欣赏，还有不少怀着好心情的年轻人在花树下打闹。不过S似乎并不在意这些，连耳机传来的rap也没有调动起她的兴致。一瞬间，心脏好像变成了黑洞，“啊，我身边还有几个人呢，似乎没有了吧”。阳光的温度覆盖到了脖子上，S抬头看了看开满花的树，“我妈好像还挺喜欢花的”，S随手拍了一张照片，微信发到自己一家三口的群里。过了一会，
日常演播练习0822 开阳春天
日常演播练习0822一、绕口令练习司小四和史小世，四月十四日十四时四十上集市，司小四买了四十四斤四两西红柿，史小世买了十四斤四两细蚕丝。司小四要拿四十四斤四两西红柿换史小世十四斤四两细蚕丝。史小世十四斤四两细蚕丝不换司小四四十四斤四两西红柿。司小四说我四十四斤四两西红柿可以增加营养防近视，史小世说我十四斤四两细蚕丝可以织绸织缎又抽丝。二、文本练习狗熊是动物街有名的美食家，它吃得多所以长得胖，它能吃
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
广州会刊小程序开发公司哪家好｜开发多少钱费用｜专业外包服务红匣子实力推荐
在选择广州会刊小程序开发公司时，有几个关键因素需要考虑。首先，您应该确定自己的需求和目标，以便找到最合适的开发公司。其次，您需要考虑公司的经验和专业知识。最后，您还应该考虑公司的信誉和口碑。开发-联系电话：13642679953（微信同号）首先，您应该明确自己的需求和目标。会刊小程序是一种用于展示会议信息和日程安排的应用程序。在选择开发公司之前，您应该明确自己的需求，包括功能要求、设计风格和用户体
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

【日常】写给妈妈的微信机器人（用于知网论文下载）

前端

后端

一

二

三

你可能感兴趣的:(日常,python,微信,爬虫,爬虫,python,日常,微信小程序)