野鬼灬

PYTHON实战开发作业 -WEEK1

1_1 初始网页的构成

1.1.1学习笔记：

初步认识网页组成：

HTML标签

头部定义标题，包括浏览器小窗口标题显示的那些

主要展示的文本/图像/各种资源内容

我是最下方那些小小的不起眼的文字

照着视频的讲解，建立了第一个我的网页文件。

乱码了，百度一下我就知道：添加,倒是没乱码了，然而离老师给的网页还相差太多。

那么问题就来了:怎么像WORD排版一样把某些文字定义居中，设置字体，特定地方显示一个图片？答案：CSS样式。具体不详。大概就知道它是负责排版的吧。把老师给的图片和CSS样式的文件夹下载下来，对应添加上去。

总算能看了 ╮(╯▽╰)╭。最后对照参考答案，搞清楚哪一项应该对应哪个class。终于才完成了。心好累。

1.1.2 源代码



 
    
    The blah
     

 
     
         
         
            Home
  
            Site
            Other
        
    
     
        The Beach
  
        
  
         
            
 
            
            
        
         
            stretching from Solta to Mljet, and this unique cycling trip captures the highlights with an ideal
            balance of activity, culture and relaxation. Experience the beautiful island of Korcula with its picturesque old town,
            the untouched beauty of Vis, and trendy Hvar with its Venetian architecture. In the company of a cycling guide,
            this stimulating journey explores towns and landscapes, many of which are on UNESCO's world heritage list.
            Aboard the comfortably appointed wooden motor yacht,
            there is ample time between cycles to swim in the azure waters and soak up the ambience of seaside towns.
        


    
      
        © Mugglecoding

1.1.3 执行结果

原来是对应的class和标签没有对上号。

1.1.4总结

虽然算是完成了，但还感觉很不知其所以然。有必要了解一下HTML的各种标签。

于是买了一本《HTML5权威指南》，很贵，很厚，看评论也很权威，最重要的是，很无聊，完全看不下去……

作罢…… 还是先看视频学爬虫吧，等用到了再说。

1_2 爬取一个本地网页文件的商品信息

1.2.1 学习笔记

打开文件------ witn open() as data

解析网页------soup = BeautifuleSoup()

获取信息------标题= soup.select()，图片 = soup.select()

筛选信息------ 最终要的标题文本=标题[index].text.

最终要的图片链接 = 图片[index].get(‘src’)

1.2.2 源代码

from bs4 import BeautifulSoup
with open('F:\\FileRecv\\课程源码及作业参考答案\\Plan-for-combating-master\\第一周课程\\1.2解析网页中的元素\\1.2练习题答案\\练习题所需网页\\index.html','r') as total_data:
   Soup = BeautifulSoup(total_data, 'lxml') # 解析网页内容

titles = Soup.select('body > div > div > div.col-md-9 > div:nth-of-type(2) > div > div > div.caption > h4:nth-of-type(2) > a')
prices = Soup.select('body > div > div > div.col-md-9 > div:nth-of-type(2) > div > div > div.caption > h4.pull-right')
imgs = Soup.select('body > div > div > div.col-md-9 > div:nth-of-type(2) > div > div > img')
visitors = Soup.select('body > div > div > div.col-md-9 > div:nth-of-type(2) > div > div > div.ratings > p.pull-right')
cates = Soup.select('body > div > div > div.col-md-9 > div:nth-of-type(2) > div > div > div.ratings > p:nth-of-type(2)')
#print(cates)
# 打印出来了... 对于星星有些特别，打印出的是5个东西，满星的是,空星的是
#所以 等级cate就是要获取满星的个数，在提示下，查询BeautifuleSoup的 find_all()函数，
#它返回的是所有符合筛选条件的列表，那么将符合条件(满星)的列表的长度，就是该物品的等级:
for title,price,img,visitor,cate in zip(titles,prices,imgs,visitors,cates):
    outputData ={
        'title':title.get_text(),
        'price': price.get_text(),
        'img': img.get('src'),
        'visitor': visitor.get_text(),
        'cate': len(cate.find_all("span", class_='glyphicon glyphicon-star'))
    }
    print(outputData)

1.2.3 执行结果

1.2.4 总结

1.打开一个本地文件 ___________ with open (‘文件绝对路径名’,’r’) as data:

2.用BeautifuleSoup工具来解析网页 ____________soup =BeatifulSoup(data.text, ‘lxml’)

3.使用Chrome浏览器的监视器，查看某一元素对应的位置右键->检查->copy (Xpath或者CSS selector)

4.从soup中已经获取的一大堆数据里提出自己单独要的。 —————— soup.select(‘具体位置’)

5.soup.select(‘参数’） __________ CSS selector。或者标签.类名 > 下一标签，属性[‘我的属性名’=’我是属性值’。

6 soup.select().find_all(), soup.select().find()。
7 疑问： soup.select() 的返回对象到底是什么类型的列表呢，它会因为select() 函数里参数给的不同而不同吗。

附上帮助文档，有时间了继续看。

1_3 爬取一个真实网页上的信息

1.3.1 学习笔记/解体思路

观察每个页面有24个，那么爬取300个，就是要抓取前10页的所有详情页，再爬第12页的所有详情页，加第13页的前12个。

拆分一下步骤：

后来想了一下，这样太不通用了，爬到最后一页只有10页怎么办，中间夹了几条无效链接所以爬取了23或者22页怎么办。所以，应该按顺序爬下去应该更合适。修改一下想法：

1.3.2 源代码

import time
import requests
from bs4 import BeautifulSoup

url = 'http://bj.xiaozhu.com/search-duanzufang-p1-0/'
header = {
    'Content-type': 'text/html;charset=UTF-8',
    'Referer': 'http://bj.58.com/pbdn/?PGTID=0d409654-01aa-6b90-f89c-4860fd7f9294&ClickID=1',
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36',
}
#计数的变量
icount = [0];
#获取一个大页面上的详情页地址，并且 判断 当前所抓取的所有url个数是否大于了nbOfUrl
def GetOnePageUrl(url,icount,nbOfUrl):
    url_list = []
    web_data = requests.get(url,headers=header)  # 正常情况下是 Responce[200]
    print('请检查当前网络是否正常',web_data.status_code)
    soup = BeautifulSoup(web_data.text,'lxml')
    urlOnDetail = soup.select('#page_list > ul > li > a ')
#把一个这个页面下的所有详情页的URL装进一个列表里
    for urlOnDetail_1 in urlOnDetail:
        url_list.append(urlOnDetail_1.get('href'))
    #从 urlOnDetail_1里获取数据，装进对象里。或者
        icount[0] += 1
        if(icount[0] >= nbOfUrl):
            break
    print('读取URL条数 ：',icount[0])
    return url_list

#当前页面翻页到下一页
def gotoNextPage(url):
    nPage = int(url[-4])   #是否需要添加异常处理.. 如果这个不是数字呢,返回的是什么
    a = int(nPage);a += 1
    url_s = 'http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(a)
    return url_s

#按详情个数去爬,比如爬300条 urls = GetNumberDetail(300) def GetPageUrl_ForPage(nb):
def GetPageUrl_ForPage(nb):
    url_ToChange = url
    urllist = []
    while(icount[0] nb):
            break
        time.sleep(2)
    return urllist
#给定大页面个数，按大页面去爬,不管每一页包含有多少详情页
def GetNBPageDetail(nPage):
    urllist = []
    for i in range(1,nPage):
        url_ToChange =  'http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(i)
        urllist.extend(GetOnePageUrl(url_ToChange, icount,1000000))   #本意是不让这个函数因为到达了nb而跳出，那就把nb设很大
        time.sleep(2)
    return urllist

#根据传进来的参数来判断性别 #男的是member_ico,保保存的member_icol
def GetSuxual(strList):
    try:
        if(len(strList[0])==10):
            return '男'
        elif(len(strList[0])==11):
            return '女'
        else:
            print('检查一下，性别好像没抓对哦')
            return None
    except(IndexError):
        print('检查一下，性别好像没抓到哦')
        return None
#获取一个详情页上的所有信息,并返回一个字典()
def GetOneDetailInfor(url):
    #需要获取的数据有: title ,district, price, hostPicSrc,hostSexual,
    web_data = requests.get(url,headers=header)
    soup = BeautifulSoup(web_data.text,'lxml')
    titles = soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > h4 > em')
    imgs = soup.select('#curBigImage ')
    districts = soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p > span.pr5') #它应该返回的是一个列表
    prices = soup.select('#pricePart > div.day_l > span')
    hostNames = soup.select('#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > a')
    hostPicSrcs = soup.select('#floatRightBox > div.js_box.clearfix > div.member_pic > a > img')
    hostSexuals = soup.select('#floatRightBox > div.js_box.clearfix > div.member_pic > div')  #它根据字符数目来判断
 #   print(hostSexuals)
#爬下来后，先打印着看一下
    for title,district,img,price,hostName,hostPicSrc,hostSexual in zip(titles,districts,imgs,prices,hostNames,hostPicSrcs,hostSexuals):
        data={
            'title =':title.get_text(),
            'district=':district.get_text().strip(),
            'price=': price.get_text(),
            'hostName=': hostName.get_text(),
            'hostPicSrc=': hostPicSrc.get('src'),
            'hostSexual=':  GetSuxual(hostSexual.get('class')),
            'img=': img.get('src'),
        }
        print(data)


urls = GetPageUrl_ForPage(300)
#urls = GetNBPageDetail(4)   #如果调用这个函数，就是获取前3页的所有详情页url了。
for i,url in zip(range(1,len(urls)+1),urls):
    print(i,url)
    GetOneDetailInfor(url)

1.3.3 执行结果

哗哗哗跑到300个，感觉很棒哟，有些页面上没有写性别。

.1.3.4总结

1获取列表/字典/字符串的长度 len(列表)

2 如果抓失败了，XX.select()返回的是空的，那么这时候去给下标索引，编译器会报错。所以了解了一下PYTHON 中捕获下标溢出的异常。

try: .... exception(IndexErro)。后来发现有些确实是没有房东性别的，不知道还会不会有其他的在某些网页里是没有的。所以其实应该每个都判断一下？

3 函数参数选择列表类型，函数结束了之后它也被修改了。实现了实参的传递。

4 学习了列表的几个函数 appen().extend()

5 字符串函数 strip()，去掉多余的，不想要的字符。

6 要在requests.get(url,headers)中添加headers，仿造是我们自己手动打开的网页，而不是爬虫。

7.一次解决一个问题。这样脑子不会乱成一锅粥,出问题了也好排查？所以我下载了XMIND，来学着画思维导图流程图（WORD画起来有点慢，就是这个付费版好贵哟 0..0）。

8.

待解决：

PYTHON 传递实参还有其他方法吗。

异常还要多看看手册描述。

如果要爬很多很多条，可以在获取了url_list以后写到本地文件中？这样就不会轻易丢失了。

看了参考答案，原来可以写的那么简洁啊，一样的问题我这罗里吧嗦的……大可不必弄个实参计数啊。/(ㄒoㄒ)/~~ 多练多练。

1_4 获取某个真实网站上的图片地址，并将其下载到本地

1.4.1 学习笔记

urllib 模块提供的 urlretrieve() 函数。 urlretrieve() 方法直接将远程数据下载到本地。

1.4.2 源代码

#爬取照片并保存

from bs4 import BeautifulSoup
import requests
import time
import urllib.request
import urllib
import os

header = {
    'Content-type': 'text/html;charset=UTF-8',
    'Referer': 'http: // weheartit.com / inspirations / taylorswift',
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36',
}
# 先写爬取一页上面的东西，把地址传进去，获取它上面的图片地址
def GetPicSrc(url):
    wb_data = requests.get(url)
    soup = BeautifulSoup(wb_data.text,'lxml')
    #img = soup.get('div.js-ckick0-out > img')
    img = soup.get('#main-container > div > div.grid-thumb.grid-responsive > div:nth-child > div > div > div > a')
    print(img)

def callBack(a,b,c):
    '''回调函数
	@a:已经下载的数据块
	@b:数据块的带下
	@c:远程文件的带下
	'''
    per = 100.0 * a * b / c
    if(per>100):
        per = 100.0
    print(per)

def GetOnePageData(url):
    data=[]
    dataID=[]
    wb_data = requests.get(url,headers=header)
    soup = BeautifulSoup(wb_data.text, 'lxml')
    img_addresses =soup.select('#main-container > div > div.grid-thumb.grid-responsive > div > div > div > a ')
    inter = 1
    path = 'E:\\Python-TEST\\'
    for img_address in img_addresses:
        dataID = img_address.get('href')
        print("http://weheartit.com/"+dataID)  #打印的是详情页的URL
        dataID_NB = dataID.split('/')[2]
        print(dataID_NB)
        src_img ='http://data.whicdn.com/images/'+dataID_NB+'/large.jpg'  #这是照片url
        print(src_img)
        urllib.request.urlretrieve(src_img, path+dataID_NB+'/large.jpg',callBack)
        time.sleep(2)
        print('Done')
    return data
GetOnePageData('http://weheartit.com/inspirations/taylorswift')

1.4.3 执行结果

然而我失败了 =..= 能打印正确的图片地址，但是使用了urlretrieve函数后，会报错。

听说是对方服务器的问题。那先放着，改天换个网站试试。

1.4.4 总结

1. Python中一串字符的format（）。
2.  一个新的库 import urllib.request

1_5 实战大作业

1.5.1 学习笔记

1. 观察网页 http://bj.58.com/pbdn/0/pn1/ =http://bj.58.com/pbdn/0/

第二页： http://bj.58.com/pbdn/0/pn2/

推测：第N页 http://bj.58.com/pbdn/0/pnN/

所以步骤大概就是：

1. 获取第一页的所有详情页URL，保存在一个url_list中

2. 根据url_list提供的地址，获取该页面上的值。

1.5.2 源代码

#coding=utf-8
from bs4 import BeautifulSoup
import time
import requests

#获取地址为url网页上的浏览量的信息
header = {
    'Content-type': 'text/html;charset=UTF-8',
    'Referer': 'http://bj.58.com/pbdn/0/pn1/?pts=1463556777417',
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36',
}
def get_views_from(url):
    id = url.split('/')[-1].strip('x.shtml')
    api = 'http://jst1.58.com/counter?infoid={}'.format(id)
    # 这个是找到了58的查询接口，不了解接口可以参照一下新浪微博接口的介绍
    js = requests.get(api,headers=header)
#    print('从这里获取访问量',api)
    views = js.text.split('=')[-1]
    return views

#获取一个详情页的信息
def EmptyMessageShow(mylist):
    if(mylist==[]):
        print('没抓到')

def GetCategory(cates):
    cate = []
    n = len(list(cates.find_all('a')))
    for i in list(cates.find_all('a')):
        cate.append(i.get_text())
    return cate
import time
def GetOneDetailData(url):
#    time.sleep(2)
    data = {}
    print('进入页面： ',url)
    wb_data = requests.get(url,headers=header)
    soup = BeautifulSoup(wb_data.text,'lxml')
    cates = soup.select('#header > div.breadCrumb.f12')
                         # header > div.breadCrumb.f12 > span > a
    titles=soup.select('#content > div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.mainTitle > h1')
    times = soup.select('#index_show > ul.mtit_con_left.fl > li.time')
    prices =    soup.select('#content > div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.sumary > ul > li > div.su_con > span')
    oldOrNews = soup.select('#content > div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.sumary > ul > li > div.su_con > span')
    if (len(soup.select('#content > div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.sumary > ul > li > div.su_con > span > a'))==0):
        districts=['未填']
    else:
        districts = soup.select('#content > div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.sumary > ul > li:nth-of-type(3) > div.su_con > span ')
    visitors = list(get_views_from(url))  #为了和其他变量一起打包到zip中
    for cate,title,mytime,price,oldOrNew,district,visitor in zip(cates,titles,times,prices,oldOrNews,districts,visitors):
        data ={

            'title=': title.get_text(),
            'cate = ': cate, #GetCategory(cate),
            'time = ': mytime.text,
            'price =' : price.get_text(),
            'oldOrNow = ': oldOrNew.get_text() ,
            'district=': list(district.stripped_strings) if(district!='未填') else district,
            'visitior': visitor
        }
        if(data == {}):
            print('没爬到信息哦  ')
    print(data)
    return data

#获取一个页面上的所有详情页url,去掉推广商品,去掉转转
def GetOnePageURL(url):
    href = []
    wb_data = requests.get(url)
    soup = BeautifulSoup(wb_data.text, 'lxml')
    singlehref = soup.select('td.t a.t')
    for data in singlehref:
        ifzhuanzhuan = data.get('href')[:26] =='http://m.zhuanzhuan.58.com'  #这是转转商品地址的也正
        ifTuiGuang = data.get('href')[:11] =='http://jump'   #这是推广商品的特征
        if ifzhuanzhuan  or ifTuiGuang:
        #    href.append(data.get('href'))#好长的名字啊，老师说问号之后的不要了 ..
            print('跳过')
        else:
#            href.append(data.get('href').split('?')[0]) 可是用了这个，第一个竟然不一样了
            href.append(data.get('href'))
    print('这一页有',len(href),'个商品信息')
    return href
# 还要加一层 ...可能有多页
def get_links_from(numPages):
    urls = []
    for iPage in range(1,numPages+1):
        list_view = 'http://bj.58.com/pbdn/0/pn{}/'.format(str(iPage))
#        wb_data = requests.get(list_view)
#        soup = BeautifulSoup(wb_data.text,'lxml')
#        for link in soup.select('td.t a.t'):
        urls.append(list_view)
    return urls

# 要调用的函数，就成了一下的：
def run(numPages=1):
    urls = get_links_from(numPages)  #获得好几个页面.
    print(urls)
    for url in urls:
        urlPage = GetOnePageURL(url)
 #       print(urlPage)
        for urlOnePage in urlPage:
            GetOneDetailData(urlOnePage)
            time.sleep(2)

run(1)  #就爬第一页

1.5.3 执行结果

1.5.4总结

1.没有爬到访问量，老师给了参考答案，再消化一下，执行成功了后修改。

2. 学习到了 soup.select()[0].stripped_strings

疑问：

什么样的类型可以强制转换成列表呢。

路漫漫兮 ~~~~

Python Textract库：文本提取程序员喵哥 python 开发语言
更多Python学习内容：ipengtao.comTextract是一个强大的Python库，用于从各种文件格式中提取文本。无论是PDF、Word文档、Excel电子表格、HTML页面还是图像，Textract都能有效地提取其中的文本内容。Textract通过集成多种开源工具和库，实现了对多种文件格式的支持，使得文本提取变得简单而高效。本文将详细介绍Textract库的安装、主要功能、基本操作、高
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
关于使用python进行处理雷达数据笔记六毛驴 python 数据分析
好久不见，甚是想念本人深知这段时间鸽了一篇博（上一篇博），后续会补上的，今天想写一下关于使用python进行TI雷达接收回波数据处理的一些常见问题和解决方法。这也是前几天领导给我布置的任务，所以我将这段时间自己遇到的并且已经解决的问题进行了简单的汇总，也会推荐几本这几天阅读了python书籍。python书籍推荐：python学习手册MarkLutz著（对应python版本3.X，2.X都可）Py
python技巧之下划线老虎也淘气 Python编程掌握指南 python django 开发语言
‍♂️个人主页@老虎也淘气个人主页✍作者简介：Python学习者希望大家多多支持我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注python技巧之下划线1、python的moudles文件中__all__作用2、__slots__用于限定类属性，如：3、下面的小技巧可以获取私有变量：4、下划线种类单个下划线（_）单下划线前缀的名称（例如_shahriar）双下划线前缀的名称（例如__s
【Python学习笔记】一些关于多线程，xls文件读取，PyQt5，PyInstaller打包等问题的解决方案记录百里香酚兰 Python自学笔记 python 学习笔记 pyinstaller xls文件 PyQt5 多线程
背景：最近利用休息时间写了个小型exe程序，主要涉及的技术点有：多线程，读取xls文件，基于PyQt5的简单GUI页面，利用PyInstaller打包成exe。虽然有ChatGPT等协助，但难免还是在开发过程中遇到了一些疑难问题，所以开个记录贴刊登解决方式。问题&解决方式：1.PyQt+PyInstaller：tqdm报错AttributeError:‘NoneType‘objecthasnoat
Python学习日记-第二十九天-tcp（客户端）差点长成吴彦祖 python pandas tcp/ip 网络
系列文章目录tcp介绍tcp特点tcp客户端一、tcp介绍Tcp协议，传输控制协议是一种面向连接的、可靠的、基于字节流的传输层通信协议，由IETF的RFC793定义TCP通信需要经过创建连接、传输数据、终止连接三个步骤TCP通信模型中，在通信开始之前，一定要先建立相关的链接，才能发送数据，类似于生活中的“打电话”（注：之前学习的udp，在通信前，不需要建立相关的链接，只需要发送数据即可，类似于“写
Python学习第十九天 Leo来编程 Python学习学习 python
Django-分页后端分页Django提供了Paginator类来实现后端分页。Paginator类可以将一个查询集（QuerySet）分成多个页面，每个页面包含指定数量的对象。fromdjango.shortcutsimportrender,redirect,get_object_or_404from.modelsimportUserfrom.formsimportUserFormfromdja
漫画算法python篇pdf_用Python抓取漫画并制作mobi格式电子书 jian bao 漫画算法python篇pdf
想看某一部漫画，但是用手机看感觉屏幕太小，用电脑看吧有太不方面。正好有一部Kindle，决定写一个爬虫把漫画爬取下来，然后制作成mobi格式的电子书放到kindle里面看。本人对于Python学习创建了一个小小的学习圈子，为各位提供了一个平台，大家一起来讨论学习Python。欢迎各位到来Python学习群：943752371一起讨论视频分享学习。Python是未来的发展方向，正在挑战我们的分析能力
批量安装 Python 库的脚本：提高python学习效率的第一步（附源码） TAGRENLA Interesting python project python 学习开发语言
批量安装Python库批量安装Python库的脚本：提高数据分析效率的一步（附源码）批量安装脚本前提条件使用pip：Python包管理工具批量安装脚本查看当前python解释器中安装的所有的库批量安装Python库的脚本：提高数据分析效率的一步（附源码）在现代数据分析领域，Python已成为一个不可或缺的工具。为了进行数据处理、分析、可视化和建模等任务，Python社区涌现出了众多强大的库和工具。
Python学习-----项目设计1.0（设计思维和ATM环境搭建） Fitz& Python学习学习 python
目录前言：项目开发流程MVC设计模式什么是MVC设计模式？ATM项目要求ATM项目的环境搭建前言：我个人学习Python大概也有一个月了，在这一个月中我发布了许多关于Python的文章，建立了一个Python学习起步的专栏（https://blog.csdn.net/m0_73633088/category_12186491.html），在这里我非常感谢各位的一路陪伴，你们的支持是我创作的不竭动力
Python学习日志3-复合类型可惜还不下雨学习
python支持多种复合类型，可以将不同的值组合在一起一、列表列表（list）是用方括号标注、逗号隔开的一组值，可以包含不同类型的元素（但最好不要这么做），列表有以下特点：列表内的顺序有先后顺序列表的值可变1.创建列表列表有两种创建方式，一是直接用方括号把表达式括起来，而是用构造函数list()表达式list1=[]#创建了一个空列表list2=["a","b","c"]#创建了一个字符串列表li
Python学习第十四天 Leo来编程 Python学习 python 学习开发语言
pip命令pip是Python的包管理工具，用于安装和管理Python第三方库安装安装pip指令（主要是为了更换pip的国内源），在C:\Users下建立pip文件夹，在pip文件夹里建立pip.ini(C盘不让建立可以桌面建立拖进去)文件内容如下：[global]index-url=https://pypi.tuna.tsinghua.edu.cn/simple常用命令操作类型命令格式描述安装包
Python学习第十五天 Leo来编程 Python学习 python 学习
Django概念Django最初被设计用于具有快速开发需求的新闻类站点，目的是要实现简单快捷的网站开发。以下内容简要介绍了如何使用Django实现一个数据库驱动的网络应用。（Django是一个开放源代码的第三方模块Web应用框架，并且是一个功能全，重量的框架。Flask框架是一个轻量级功能少，从github上搜索pythonweb项目基本都出来的是django和flask项目）学习文档可以使用：官
python爬虫遇到IP被封的情况，怎么办？(2) 2301_82242251 程序员 python 爬虫开发语言
代理的设置：①urllib的代理设置fromurllib.errorimportURLErrorfromurllib.requestimportProxyHandler,build_opener‘’’更多Python学习资料以及源码教程资料，可以在群1136201545免费获取‘’’proxy=‘127.0.0.1:8888’#需要认证的代理#proxy=‘username:password@12
Python学习笔记 Helloooooworldddddd python
eclipse中配置PyDev：Help-->InstallNewSoftware-->Add-->起名如：PyDev，网址：http://www.pydev.org/updates-->选择PyDev-->一路Next安装完之后创建新项目时，如果没有PyDev选项，则是安装的版本跟eclipse、jdk不匹配，需要卸载重新安装。卸载：Help-->AboutEclipse-->Installat
入坑 Python 全能实战小白训练营，470 集干货 12.9G 大揭秘！七七知享 Python python 开发语言 pandas numpy matplotlib java php
家人们，我最近挖到了一个Python学习的宝藏——Python全能实战小白训练营。整整470集，内容超丰富，资源包有12.9G，完全就是为咱们这些想系统学习Python的小白量身定制的。接下来就给大家好好唠唠。随着课程深入，会涉及到Python的各种高级特性，比如面向对象编程、模块与包的使用。在讲面向对象编程时，老师通过打造一个小型游戏角色系统，把类、对象、继承、多态这些抽象概念诠释得生动形象，让
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
Python学习指南：系统化路径 + 避坑建议程之编 Python全栈通关秘籍青少年编程 python 开发语言人工智能机器学习
新手小白学习编程就像搭积木——需要从基础开始，逐步构建知识体系。以下是为你量身定制的Python学习路径，帮你告别杂乱，高效入门！一、学习前的关键认知明确目标：想用Python做什么？数据分析（如Excel自动化、可视化）Web开发（如搭建网站）人工智能（如机器学习）自动化办公（如处理文件、邮件）目标不同，后续学习侧重点不同（但基础通用）。避免误区：❌只看教程不写代码✅边学边动手，哪怕抄代码也要运
第五周作业——第十章动手试一试 hongsqi
10-1Python学习笔记学习笔记：在文本编辑器中新建一个文件，写几句话来总结一下你至此学到的Python知识，其中每一行都以“InPythonyoucan”打头。将这个文件命名为learning_python.txt，并将其存储到为完成本章练习而编写的程序所在的目录中。编写一个程序，它读取这个文件，并将你所写的内容打印三次：第一次打印时读取整个文件；第二次打印时遍历文件对象；第三次打印时将各行
Python学习总结 serve the people 巨人的肩膀 python 开发语言
第一个python程序print("HelloWorld")#缩进一般4个空格键或者1个tab键，但是所有代码块语句必须是相同的缩进，这个必须严格执行，不同的缩进会导致程序不能运行，不能混用空格和tabifTrue:print("True")else:print("False")python注释符单行注释（行注释）#print("HelloWorld")多行注释（块注释）'''print("Hel
python学习，Windows图标一键替换工具开发详解木木黄木木 python 学习 windows
Windows图标一键替换工具开发详解项目概述本项目是一个基于Python开发的Windows图标一键替换工具，提供了简单易用的图形界面，让用户能够轻松地替换Windows系统中的回收站图标、快捷方式图标以及应用程序图标。功能特点支持三种图标替换模式：回收站图标替换桌面快捷方式图标替换系统应用程序图标替换图标预览功能：实时预览选择的图标支持缩放预览支持多种图片格式（ICO、PNG、JPEG等）便捷
2024年Python最新Pytorch--3，面试高分实战 m0_60666452 程序员 python 学习面试
（1）Python所有方向的学习路线（新版）这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，知识体系更全面了。（2）Python学习视频包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然没有那么全面，但是对于入门
Python学习之-分支语句-基础训练 YMLT花岗岩 educoder Python实践（代码篇）学习 python educoder
第1关：计算并输出圆的面积和周长。任务描述从键盘输入圆的半径，如果半径大于等于0，则计算并输出圆的面积和周长。相关知识判断半径是不是小于零测试说明平台会对你编写的代码进行测试：示例代码：#单分支#coding=utf-8#********Begin**********r=float(input())s=3.1415*pow(r,2)c=2*3.1415*rprint("圆的面积为：%.2f"%s)
数据挖掘实战-基于Catboost算法的艾滋病数据可视化与建模分析艾派森数据挖掘实战合集 python 人工智能数据挖掘信息可视化数据分析
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
Python就业薪资怎么样？前景如何？田野猫咪 Python 计算机 python 人工智能数据挖掘
Python是一种全栈的开发语言，你如果能学好Python，前端，后端，测试，大数据分析，爬虫等这些工作你都能胜任。那么Python现在在国内的就业薪资高吗？Python就业薪资怎么样？前景如何？对于这些问题，下面小编整理相关内容为大家详情解析，一起来了解吧~如果你也对Python感兴趣，想通过学习Python转行、做副业或者提升工作效率，我也为大家整理了一份【最新全套Python学习资料】一定对
Python学习第七天 Leo来编程 Python学习学习
模块模块是一个包含Python代码的文件，通常以.py为扩展名。模块中内容有函数、类、变量/常量、测试代码。模块的作用：划分代码结构、提高代码的复用率。命名规范使用小写字母：模块名应全部使用小写字母。避免使用大写字母，因为不同操作系统对文件名的大小写敏感度不同。使用下划线分隔单词：如果模块名由多个单词组成，使用下划线_分隔单词。这种风格称为file_util避免使用关键字和内置模块名不要使用Pyt
Python学习第九天 Leo来编程 Python学习学习
序列化和反序列概念在Python中，序列化是将对象转换为可存储或传输的格式（如字节流或字符串），而反序列化则是将序列化后的数据重新转换为对象（官网序列化）。序列化：就是将不能存储的对象转为可存储的对象（封存pickling）。发序列化：序列化的对象返回成原来的对象（解封unpickling）。方式序列化和反序列化有下面五种方式pickle模块官网概念：pickle模块实现了对一个Python对象结
pywin32，一个超强的 Python 库！ Sitin涛哥 Python python 开发语言
更多Python学习内容：ipengtao.com大家好，今天为大家分享一个超强的Python库-pywin32。Github地址：https://github.com/mhammond/pywin32在Python的世界里，有许多优秀的第三方库可以帮助开发者更轻松地处理各种任务。其中，pywin32库是一个特别引人注目的工具，它提供了对WindowsAPI的完整访问，使得开发者能够利用Pytho
Python 学习与开发：高效编程技巧与实用案例壹屋安源知识分享 python 学习开发语言
Python学习与开发：高效编程技巧与实用案例Python是现代编程语言中最受欢迎的一种，它以简洁、易读的语法和强大的功能广泛应用于数据分析、人工智能、Web开发等多个领域。无论你是Python新手还是有经验的开发者，掌握一些高效编程技巧和实用案例，能让你的Python开发之旅更加顺畅。1.高效的函数式编程使用列表推导式列表推导式是Python中非常常用的功能，它不仅可以让代码更加简洁，还能提高执
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$