刘子谦

《Python程序设计》实验四报告_搜索小助手

20192213 《Python程序设计》实验四报告

课程：《Python程序设计》
班级： 1922
姓名：刘子谦
学号：20192213
实验教师：王志强
实验日期：2020年6月10日
必修/选修：公选课

1.实验内容

1.程序功能说明

定位：搜索小工具
目标：实现高效搜索，帮助网课学生快速找到答案，实现搜索自动化。
具体功能：有以下四个：
- 多引擎搜索
- 上学吧搜索
- 多引擎翻译
- 截图文字识别
接口说明：
- 百度开放平台API提供OCR识别
- 有道翻译提供翻译
- 金山翻译提供翻译
- 腾讯翻译君翻译提供翻译
- 百度单词提供单词查询
- 截图功能调用微信截图
- 上学吧提供部分题目答案

2.程序实现思路

爬取文本 + 接口爬虫 + GUI界面

3.程序效果展示

首页（有我的logo，有使用说明）
多引擎搜索
上学吧搜索
多引擎翻译
截图文字识别

二、实验过程及结果

1.多引擎搜索实现方法

核心使用webbrowser库，打开网页，本功能实现相对容易，不做过多解释，直接上代码

#下面以百度搜索为例  
#一个打开百度搜索的函数，传入搜索关键词，打开对应网页  
from webbrowser import open as op  
def baidu(words):  
      urlBD = 'https://www.baidu.com/s?isource=infinity&iname=baidu&itype=web&ie=utf-8&wd=' + words  
      op(urlBD)

2.上学吧搜索

本功能分两步：

先搜索题目，获取id列表
再根据id，遍历所有题目，抓取答案

第一步核心代码如下：

传入关键词，自动搜索，返回题目id列表和题目详情列表

#上学吧的搜索程序  
 def getIdAndTitel(words,cookie=''):  
     url = 'https://www.shangxueba.com/ask/search.aspx?key=' + words  
     if cookie=='':  
         tk.messagebox.showerror('用户设置错误','请输入cookie\n否则无法爬取信息\nCookie可询问程序开发者')  
         return False,False  
     else:  
         cookie1 = cookie  
     headers = {  
         'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',  
         'accept-encoding': 'gzip, deflate, br',  
         'accept-language': 'zh-CN,zh;q=0.9',  
         'cookie': cookie1,  
         'referer': 'https://www.shangxueba.com/',  
         'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'  
     }  
   
     html = requests.get(url,headers=headers).text  
  
     # 通过切片获取列表  
     try:  
         detail = html.split('')[1]  
         detail = detail.split('

')[0:-1]  
     except:  
         return False,False  
     idList = []  
     detailList = []  
     for n,i in enumerate(detail):  
         try:  
             #获取ID：  
             detail[n] = i.split('．')[0]  
             idRule = re.compile('

',2)[2]  
             title = title.split('')[0]  
             title = title.replace('','').replace('','')  
  
             idList.append(id)  
             detailList.append(title)  
         except:  
             idList.append('')  
             detailList.append('')  
     return idList,detailList

第二步核心代码如下：

传入题目id和cookie，返回答案列表

#上学吧的搜索程序  
#下面根据urlList，遍历列表中的题目信息  
def getInfoSXB(idList,cookie=''):  
    if cookie == '':  
        tk.messagebox.showerror('用户设置错误', '请输入cookie\n否则无法爬取信息\nCookie可询问程序开发者')  
        return  
    else:  
        cookie1 = cookie  
  
    headers = {  
        'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',  
        'accept-encoding': 'gzip, deflate, br',  
        'accept-language': 'zh-CN,zh;q=0.9',  
  
        'cookie': cookie1,  
        'referer': 'https://www.shangxueba.com/',  
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'  
    }  
    answerList = []  
    for id in idList:  
        try:  
            url  = 'https://www.shangxueba.com/ask/ajax/zuijiainfo.aspx?id='+id+'&t='+ str(int(t.time() * 1000))  
            html = requests.get(url,headers=headers)  
            detail = html.text.split('',1)[1]  
            detail = detail.split('',1)[0]  
            detail = re.sub('3.多引擎翻译本功能实际是四个接口爬虫，爬取有道、金山、腾讯、百度的翻译接口，仅供个人使用。
 上述四大网站，都很有社会责任感，无偿将接口贡献出来，而且接口本身几乎无任何反爬，通过简单的程序即可抓取
 
  有道翻译接口抓取 
 
def youdao(words):  
    string = words  
    data = {  
    'doctype': 'json',  
    'type': 'AUTO',  
    'i':string  
    }  
    url = "http://fanyi.youdao.com/translate"  
    r = requests.get(url,params=data)  
    result = r.json()  
    result = result['translateResult'][0][0]['tgt']  
    print("有道翻译结果：%s" %result)  
    return result 
 
  金山翻译接口抓取 
 
def Jinshan(word,onlyone=0):  
    def process(Request_URL, Form_Data):  
        # 使用urlencode方法转换标准格式  
        data = parse.urlencode(Form_Data).encode('utf-8')  
        # 传递Request对象和转换完格式的数据  
        response = request.urlopen(Request_URL, data)  
        # 读取信息并解码  
        html = response.read().decode('utf-8')  
        # 使用JSON  
        translate_results = json.loads(html)  
        return translate_results  
     
    Request_URL = 'http://fy.iciba.com/ajax.php?a=fy'  
    # 创建Form_Data字典，存储Form Data  
    Form_Data = {'f': 'auto',  
                 't': 'auto'}  
    if onlyone == 0:  
        Form_Data['w'] = word  
        translate_results = process(Request_URL, Form_Data)  
        # 找到翻译结果  
        if 'out' in translate_results['content']:  
            translate_results = translate_results['content']['out']  
        else:  
            translate_results = translate_results['content']['word_mean']  
        # 打印翻译信息  
        print("金山翻译结果：%s" % translate_results)  
        return translate_results  
 
  腾讯翻译君接口抓取 
 
def TencentFY(words):  
    text = words  
    a = 0  # 中文数  
    b = 0  # 非中文数  
    to = "0"  
    from_ = "1"  
    for i in text:  
        if u'\u4e00' <= i <= u'\u9fff':  
            a += 1  
        else:  
            b += 1  
    if a > b:  # 当中文数量大于非中文数量时，就中文转英文  
        to = "1"  
        from_ = "0"  
     
    data = {"from": from_,  
            "to": to,  
            "sourceText": text,  
            "type": "1",  
            "latitude": "1",  
            "longitude": "1",  
            "platform": "H5"}  
    url = "https://m.fanyi.qq.com/translate"  
    headers = {  
        "user-agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"}  
    response = requests.post(url, headers=headers, data=data)  
    html = response.content.decode()  
    html_dict = json.loads(html)  
    print("腾讯翻译结果：", html_dict["targetText"])  
    return html_dict["targetText"] 
 
  百度单词接口抓取 
 
def baiduWord(keyword):  
    base_url = 'https://fanyi.baidu.com/sug'  
    # 构建请求对象  
    data = {'kw': keyword  }  
    data = parse.urlencode(data)  
    # 模拟浏览器  
    header = {"User-Agent": "mozilla/4.0 (compatible; MSIE 5.5; Windows NT)"}  
    req = request.Request(url=base_url,data=bytes(data,encoding='utf-8'),headers=header)  
    res = request.urlopen(req)  
    # 获取响应的json字符串  
    str_json = res.read().decode('utf-8')  
    # 把json转换成字典  
    myjson = json.loads(str_json)  
    info = myjson['data'][0]['v'].replace('int.','').replace('/n. ','')  
    print('百度翻译结果：'+info)  
    return info  
4.截图文字识别
百度开放平台提供的多种免费API，其中就有免费文字识别，本程序就是调用了百度的OCR接口，实现截图文字识别。
本功能分三步实现：
 
  第一步：调用微信截图
 简单是说就是模拟按键Alt+A 
 
def Alt_A():  
  import win32api  
  import win32con  
  win32api.keybd_event(18, 0, 0, 0)  # Alt键位码是18  
  win32api.keybd_event(65, 0, 0, 0)  # v键位码是65  
  win32api.keybd_event(18, 0, win32con.KEYEVENTF_KEYUP, 0)  # 释放按键
  win32api.keybd_event(65, 0, win32con.KEYEVENTF_KEYUP, 0)  

 
  第二步：从剪切板读取图片（或者从文件中读取）
 返回值是图片文件路径（如果是剪切板中读取，会自动将图片保存到本地） 
 
#加载图片  
def loadPic(way):#way=0：剪切板读取，way=1：直接上传图片  
    if way==0:  
        img = ImageGrab.grabclipboard()  
        try:  
            img.save('tmp.png', 'PNG')  
        except:  
            return  
        path = 'tmp.png'  
    elif way ==1:  
        path = filedialog.askopenfilename()  
 
  第三步：通过百度接口实现文字识别 
 
#文字识别，从剪切板读取图片  
def getText(path):  
    API_KEY ='***'      # 百度API秘钥，此处略  
    SECRECT_KEY = '***' # 百度API秘钥，此处略  
  
    # 获取token  
    url = 'https://aip.baidubce.com/oauth/2.0/token'  
    body = {'grant_type': 'client_credentials',  
            'client_id': API_KEY,  
            'client_secret': SECRECT_KEY  
            }  
  
    req = requests.post(url=url, data=body)  
    token = json.loads(req.content)['access_token']  
  
    # 获取百度api识别结果  
    ocr_url = 'https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=%s'%token  
    headers = {'Content-Type': 'application/x-www-form-urlencoded'}  
  
  
    # 读取图片并进行base64加密  
    body = base64.b64encode(open(path ,'rb').read())  
  
    # 进行urlencode  
    data = urllib.parse.urlencode({'image': body})  
  
    # post请求  
    r = requests.post(url=ocr_url, headers=headers, data=data)  
  
    # 输出请求结果  
    print('请求码为: %s' %r.status_code)  
    res_words = json.loads(r.content)['words_result'][0]['words']  
    print('识别结果为: %s' % res_words)  
    return res_words  
5.所有函数目录展示
三、实验过程中遇到的问题和解决过程
问题一：OCR接口选择。
查阅各种资料并检测准确率后，选择了百度开发平台API，大厂产品，免费好用。而且使用比较方便。
问题二：上学吧的反爬策略
上学吧的cookie更换速度极快极快，每次都需要重新登录，登录页面有验证码。给爬虫带来了不便，目前此问题仅通过简单的“频繁更换cookie”解决，暂时没有更好的解决方案。
问题三：封装exe后文件过大
虽然是个很简单的小程序，封装以后依然达到了二百多兆字节。启动速度慢，占用内存高。同时，用Python封装的其他程序也存在类似问题，解决方法会慢慢探索……
四、我的感悟与思考
选修Python真是个非常非常正确的选择，简单灵活的语法，丰富的第三方库，让一切都变得有趣简单。
老师的课堂也很热闹，能轻松学到很多东西，整个Python课程范围跨度大，不仅涉及Python基础知识，还有文件操作，数据库，办公自动化，GUI，socket编程，爬虫等知识，在云班课还有pygame相关教程……可以说应有尽有，而且能在短时间内学会，能在短时间内做出一个像样的作品。很有成就感，Python让图形化界面变得简单，也让我爱上了编程。
我觉得编程最重要的往往不是技术，而是想法。只要有了创意，基本都可实现，这一学期，我完成了很多自我感觉良好的项目，和获得了满满的成就感。相信以后能用Python做更多好玩的事。
如果提一提建议的话，我觉得有些地方讲的比较快。而且存在课讲完后，很多同学没有安装库的现象，感觉如果上课的时候，和老师一起敲代码效果会好些，也建议能提前把环境配置好，不然上课很容易跟不上。
感谢Python，感谢这门选修课！

                    
                        
                        
                             
                        
                        
                        
                            
                        
                        
                        
                            
                        
                    
                

        你可能感兴趣的:(《Python程序设计》实验四报告_搜索小助手)
        
            
                
                    QQ群采集助手，精准引流必备神器
                        2401_87347160
其他经验分享
                        功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
                    
                    铭刻于星（四十二）
                        随风至

                        69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
                    
                    谢谢你们，爱你们！
                        鹿游儿

                        昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
                    
                    理解Gunicorn：Python WSGI服务器的基石
                        范范0825
ipythonlinux运维
                        理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
                    
                    小丽成长记（四十三）
                        玲玲54321

                        小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
                    
                    我的烦恼
                        余建梅

                        我的烦恼。女儿问我：“你给学生布置什么作文题目？”“《我的烦恼》。”“他们都这么大了，你觉得他们还有烦恼吗？”“有啊！每个人都会有自己烦恼。”“我不相信，大人是没有烦恼的，如果说一定有的话，你的烦恼和我写作业有关，而且是小烦恼。不像我，天天被你说，有这样的妈妈，烦恼是没完没了。”女儿愤愤不平。每个人都会有自己的烦恼，处在上有老下有小的年纪，烦恼多的数不完。想干好工作带好孩子，想孝顺父母又想经营好自
                    
                    今日联对0306
                        诗图佳得

                        自对联：烟销皓月临江浒，水漫金山荡塔裙。一一肖士平2020.3.6.1、试对肖老师联：烟销皓月临江浒，夜笼寒沙梦晚舟。耀哥求正2、试对萧老师联:烟销浩月临江浒，雾散乾坤解汉城。秀霞习作请各位老师校正3、自对联：烟销皓月临江浒，水漫金山荡塔裙。一一肖士平2020.3.6.4、试对肖老师垫场联：烟销皓月临江浒，雾锁寒林缈葉丛。小智求正[抱拳]5、试对肖老师联：烟销皓月临江浒；风卷乱云入峰巅。一一五品6
                    
                    Python数据分析与可视化实战指南
                        William数据分析
pythonpython数据
                        在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
                    
                    2022-07-08
                        保利学府里李楚怡1307022

                        ——保利碧桂园学府里——童梦奇趣【科学实验室】「7.9-7.10」✏玩出大智慧约99-144㎡二期全新升级力作
                    
                    每日一题——第八十四题
                        互联网打工人no1
C语言程序设计每日一练c语言
                        题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
                    
                    2022-04-18
                        Apbenz

                        语重心长的和我说，不要老是说不行，人至而立之年危机四伏，内在的，外在的，感觉就是心力憔悴，让人无所适从。面对职场的无情，突然好羡慕干体力劳动的外卖小哥。难道命运是想让我去送外卖了吗？干体力活才能让我活下去？fastadmin打卡成功,淘宝金币任务完成。ㅏㅓㅗㅜㅡㅣㅐㅔㅑㅕㅛㅠㅢㅒㅖY行。야자여자요리우유의사얘기예
                    
                    python os.environ
                        江湖偌大
python深度学习
                        os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
                    
                    Python中os.environ基本介绍及使用方法
                        鹤冲天Pro
#Pythonpython服务器开发语言
                        文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
                    
                    Pyecharts数据可视化大屏：打造沉浸式数据分析体验
                        我的运维人生
信息可视化数据分析数据挖掘运维开发技术共享
                        Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
                    
                    情殇——（5）压抑的小木匠放纵了自己。
                        石疯聊情感故事

                        木讷的小木匠，其实只是不苟言笑。其实内心深处也是挣扎着，由于性格内敛，不喜形于色，给人的感觉非常的木讷。其实小木匠情商智商都不低。他为人扎实，非常的务实。他的爱是既深沉又宽容。可是是一个男人，都会对妻子出轨的事儿，不会忘怀！只是压抑在心底，为了某种考量或许是真爱。小木匠对于丽影和别人私奔又重回家庭，表面上并没有，天翻地覆，暴风骤雨，其内心深处也是经历了，痛苦的挣扎。。。再一次酒后，他和一个离家多年
                    
                    第四天旅游线路预览——从换乘中心到喀纳斯湖
                        陟彼高冈yu
基于Googleearthstudio的旅游规划和预览旅游
                        第四天：从贾登峪到喀纳斯风景区入口，晚上住宿贾登峪；换乘中心有4路车，喀纳斯①号车，去喀纳斯湖，路程时长约5分钟；将上面的的行程安排进行动态展示，具体步骤见”Googleearthstudio进行动态轨迹显示制作过程“、“Googleearthstudio入门教程”和“Googleearthstudio进阶教程“相关内容，得到行程如下所示：Day4-2-480p
                    
                    Python教程：一文了解使用Python处理XPath
                        旦莫
Python进阶python开发语言
                        目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
                    
                    python os.environ_python os.environ 读取和设置环境变量
                        weixin_39605414
pythonos.environ
                        >>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
                    
                    感赏日志133
                        马姐读书

                        图片发自App感赏自己今天买个扫地机，以后可以解放出来多看点书，让这个智能小机器人替我工作了。感赏孩子最近进步很大，每天按时上学，认真听课，认真背书，主动认真完成老师布置的作业。感赏自己明白自己容易受到某人的影响，心情不好，每当此刻我就会舒缓，感赏，让自己尽快抽离，想好的一面。感赏儿子今天在我提醒他事情时，告诉我谢谢妈妈对我的提醒我明白了，而不是说我啰嗦，管事情，孩子更懂事了，懂得感恩了。投射父母
                    
                    我的黑历史
                        袖手围观有来有去

                        孩子同学与我们一起共进晚餐，俩孩子加我三个人。小同学是一个大方率性礼貌的小孩，我们也都非常喜欢。好了，回到正题上来让我把这个故事讲完。俩孩子都喜欢吃鱼，所以就发生了小孩子之间常会发生的事。我狠狠的盯了我家孩子，孩子表情有些狼狈。和孩子单独一起的时候，见她尚未释怀，并谴责我不该狠盯她，让她没面子。也许是她触动了我的童年往事吧。由此，一狠心，给她讲了一段埋藏心里极深的黑历史：我奶奶有四个儿子，四个儿子
                    
                    四章-32-点要素的聚合
                        彩云飘过

                        本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
                    
                    DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理
                        STU学生网页设计
网页设计期末网页作业html静态网页html5期末大作业网页设计web大作业
                        ️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
                    
                    从0到500+，我是如何利用自媒体赚钱？
                        一列脚印

                        运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
                    
                    使用Faiss进行高效相似度搜索
                        llzwxh888
faisspython
                        在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
                    
                    python是什么意思中文-在python中%是什么意思
                        编程大乐趣

                        Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
                    
                    想明白这个问题，你才能写下去
                        文自拾

                        春节放假的时候，又有一天梦见她，第二天她冒着漫天大雪，傻傻地跑来见我。她说，见见傻傻的我，天很冷，心很暖。她回去后，我写了一篇文章，题目叫——从此梦中只有你。我们没在一起的很长一段时间里，她都在我的心底，一次次出现在我的梦里。我对她说，在一起之前，是胆小且闷骚，在一起之后，我变得不要脸了。不要脸的——去爱你。那文章没写完，火车上，给她看了。我有点小失望，花了好几个小时写，她分分钟就看完，很希望她逐
                    
                    东南林氏之九牧林候选父系
                        祖缘树TheYtree

                        渊源介绍东晋初年晋安林始祖林禄公入闽，传十世隋右丞林茂，由晋安迁居莆田北螺村。又五世而至林万宠，唐开元间任高平太守，生三子：韬、披、昌。韬公之孙攒，唐德宗立双阙以旌表其孝，时号"阙下林家"。昌公字茂吉，乃万宠公第三子，官兵部司马，配宋氏，生一子名萍。萍于唐贞元间明经及第，官沣洲司马(后追赠中宪大夫)。唐太和年间归隐后，迁居仙游游洋，世称“游洋林”；其后裔居游洋后迁移漳州漳浦路下，由路下林第四房平和
                    
                    2019-08-08
                        65454

                        东莞家庭聚会出行旅游去哪里玩住？想起来有很久没有和家里人聚会啦，这次组织家人来到威廉古堡别墅轰趴，一大家子27个人，在别墅订了一天办，玩的非常的开心，小孩子玩游戏机，也很放心不会丢，我们就在唱歌、打麻将、打桌球一系列的活动，还准备小次等小孩生日在别墅举办，还可以给孩子做一个生日的策划
                    
                    Day1笔记-Python简介&标识符和关键字&输入输出
                        ~在杰难逃~
Pythonpython开发语言大数据数据分析数据挖掘
                        大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
                    
                    python八股文面试题分享及解析(1)
                        Shawn________
python
                        #1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
                    
                                linux系统服务器下jsp传参数乱码
                                    3213213333332132
javajsplinuxwindowsxml
                                    在一次解决乱码问题中， 发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题 
但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
                                
                                Spring 注解区别以及应用
                                    BlueSkator
spring
                                    1. @Autowired 
@Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 
  
2. @Qualifier 
当spring中存在至少一个匹
                                
                                printf和sprintf的应用
                                    dcj3sjt126com
PHPsprintfprintf
                                    <?php
printf('b: %b <br>c: %c <br>d: %d <bf>f: %f', 80,80, 80, 80);
echo '<br />';
printf('%0.2f <br>%+d <br>%0.2f <br>', 8, 8, 1235.456);

printf('th
                                
                                config.getInitParameter
                                    171815164
parameter
                                    web.xml 
 
 <servlet>
  	<servlet-name>servlet1</servlet-name>
  	<jsp-file>/index.jsp</jsp-file>
  	<init-param>
  		<param-name>str</param-name>

                                
                                Ant标签详解--基础操作
                                    g21121
ant
                                            Ant的一些核心概念： 
        build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。        project：每个构建文
                                
                                [简单]代码片段_数据合并
                                    53873039oycg
代码
                                            合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。 
        代码如下: 
       
                                
                                java 通信技术
                                    云端月影
Java 远程通信技术
                                    在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
                                
                                string与StringBuilder 性能差距到底有多大
                                    aijuans

                                      
        之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！ 
        由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！ 
        
                                
                                今天碰到 java.util.ConcurrentModificationException 异常
                                    antonyup_2006
java多线程工作IBM
                                    今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： 

Iterator<ListItem> iter = ItemMap.keySet.iterator();
while(iter.hasNext()){
ListItem it = iter.next();
//...一些逻辑操作
ItemMap.remove(it);
}
 
结果运行报Con
                                
                                PL/SQL的类型和JDBC操作数据库
                                    百合不是茶
PL/SQL表标量类型游标PL/SQL记录
                                    PL/SQL的标量类型: 
   字符,数字,时间,布尔,%type五中类型的 
--标量：数据库中预定义类型的变量
--定义一个变长字符串 
v_ename varchar2(10); 

--定义一个小数,范围 -9999.99~9999.99 
v_sal number(6,2); 

--定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号 

                                
                                Mockito：一个强大的用于 Java 开发的模拟测试框架实例
                                    bijian1013
mockito单元测试
                                    Mockito框架： 
        Mockito是一个基于MIT协议的开源java测试框架。         Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
                                
                                精通Oracle10编程SQL(10)处理例外
                                    bijian1013
oracle数据库plsql
                                    /*
 *处理例外
 */
--例外简介
--处理例外-传递例外
declare
   v_ename emp.ename%TYPE;
begin
   SELECT ename INTO v_ename FROM emp
      where empno=&no;
   dbms_output.put_line('雇员名：'||v_ename);
exceptio
                                
                                【Java】Java执行远程机器上Linux命令
                                    bit1129
linux命令
                                    Java使用ethz通过ssh2执行远程机器Linux上命令， 
  
封装定义Linux机器的环境信息 
  
package com.tom;


import java.io.File;

public class Env {
    private String hostaddr; //Linux机器的IP地址
    private Integer po
                                
                                java通信之Socket通信基础
                                    白糖_
javasocket网络协议
                                    正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： 
①创建Socket； 
②打开连接到Socket的输入输出流； 
④按照一定的协议对Socket进行读写操作； 
④关闭Socket。 
  
Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
                                
                                angular.bind
                                    boyitech
AngularJSangular.bindAngularJS APIbind
                                    angular.bind   描述：           上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。    使用方法：            angular.bind(se
                                
                                java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。
                                    bylijinnan
java
                                    
import java.util.ArrayList;
import java.util.List;


public class KickOutBadGuys {

	/**
	 * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。
	 * Maybe you can find out 
                                
                                Redis.conf配置文件及相关项说明（自查备用）
                                    Kai_Ge
redis
                                       Redis.conf配置文件及相关项说明 
# Redis configuration file example
 
# Note on units: when memory size is needed, it is possible to specifiy
# it in the usual form of 1k 5GB 4M and so forth:
#

                                
                                [强人工智能]实现大规模拓扑分析是实现强人工智能的前奏
                                    comsci
人工智能
                                     
 
     真不好意思,各位朋友...博客再次更新... 
 
     节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 
 
     但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大... 
 
                                
                                记录一些常用的函数
                                    dai_lm
java
                                    
public static String convertInputStreamToString(InputStream is) {

	StringBuilder result = new StringBuilder();

	if (is != null)
		try {
			InputStreamReader inputReader = new InputStreamRead
                                
                                Hadoop中小规模集群的并行计算缺陷
                                    datamachine
mapreducehadoop并行计算
                                    注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 
 
-----------------------------------------------------------------
                                
                                小学4年级英语单词背诵第二课
                                    dcj3sjt126com
englishword
                                    egg  蛋 
twenty 二十 
any 任何 
well 健康的，好 
  
twelve 十二 
farm 农场 
every 每一个 
back 向后，回 
  
fast 快速的 
whose 谁的 
much 许多 
flower 花 
  
watch 手表 
very 非常，很 
sport 运动 
Chinese 中国的 
  
                                
                                自己实践了github的webhooks, linux上面的权限需要注意
                                    dcj3sjt126com
githubwebhook
                                    环境, 阿里云服务器 
  
1. 本地创建项目, push到github服务器上面 
  
2. 生成www用户的密钥 
sudo -u www ssh-keygen -t rsa -C "[email protected]" 
  
  
3. 将密钥添加到github帐号的SSH_KEYS里面 
  
3. 用www用户执行克隆, 源使
                                
                                Java冒泡排序
                                    蕃薯耀
冒泡排序Java冒泡排序Java排序
                                    冒泡排序 
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 
蕃薯耀 2015年6月23日 10:40:14 星期二 
http://fanshuyao.iteye.com/
                                
                                Excle读取数据转换为实体List【基于apache-poi】
                                    hanqunfeng
apache
                                    1.依赖apache-poi 
  
2.支持xls和xlsx 
  
3.支持按属性名称绑定数据值 
  
4.支持从指定行、列开始读取 
  
5.支持同时读取多个sheet 
  
6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 
比如： 
Str
                                
                                3个处于草稿阶段的Javascript API介绍
                                    jackyrong
JavaScript
                                    原文： 
http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 
 
 
  本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 
 
1) Web Alarm API 
  &
                                
                                6个创建Web应用程序的高效PHP框架
                                    lampcy
Web框架PHP
                                    以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 
1. CakePHP 
CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 
2. CodeIgniter 
CodeIgniter是一个非常小且功能强大的PHP框架，适合需
                                
                                评"救市后中国股市新乱象泛起"谣言
                                    nannan408

                                    首先来看百度百家一位易姓作者的新闻： 
 

    三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。

首先，中国股市这两天
                                
                                页面全屏遮罩的实现 方式
                                    Rainbow702
htmlcss遮罩mask
                                    之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。 
最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
                                
                                关于angularjs的点滴
                                    tntxia
AngularJS
                                      
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 
  
Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。 
  
这里我们来简单的探讨一下它的应用。 
  
首先使用Angularjs我
                                
                                Nutz--->>反复新建ioc容器的后果
                                    xiaoxiao1992428
DAOmvcIOCnutz
                                    问题： 
public class DaoZ { 
  
  public static Dao dao() { // 每当需要使用dao的时候就取一次 
    Ioc ioc = new NutIoc(new JsonLoader("dao.js")); 
    return ioc.get(
                                
                
            
        
    

    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    

    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.

《Python程序设计》实验四报告_搜索小助手

20192213 《Python程序设计》实验四报告

1.实验内容

1.程序功能说明

2.程序实现思路

3.程序效果展示

二、实验过程及结果

1.多引擎搜索实现方法

2.上学吧搜索

本功能分两步：

第一步核心代码如下：

第二步核心代码如下：

',1)[1] detail = detail.split('

4.截图文字识别

本功能分三步实现：

5.所有函数目录展示

三、实验过程中遇到的问题和解决过程

问题一：OCR接口选择。

问题二：上学吧的反爬策略

问题三：封装exe后文件过大

四、我的感悟与思考

你可能感兴趣的:(《Python程序设计》实验四报告_搜索小助手)