qq_33669549

python爬虫学习--pixiv爬虫(2)--国际排行榜的图片爬取

之前用面向过程的形式写了一下pixiv爬虫的登录...

觉得还是面向对象好一些...

那就先把登录过程重写一下...

class Pixiv_Spider:

    def __init__(self):
        self.p_id = ''
        self.p_pw = ''

    def Login(self):                        #处理登录所需要的请求信息

        p_login_url = 'https://www.pixiv.net/login.php'
        
        data = {                                    #登录所要post的信息
                'mode':'login',
                'skip':1
                }

        data['pixiv_id'] = self.p_id                #传入登录id以及password
        data['pass'] = self.p_pw

        p_login_data = urllib.urlencode(data)

        p_login_header = {                          #头信息
                'accept-language':'zh-cn,zh;q=0.8',
                'referer':'https://www.pixiv.net/login.php?return_to=0',
                'user-agent':'mozilla/5.0 (windows nt 10.0; win64; x64; rv:45.0) gecko/20100101 firefox/45.0'
                }

        request = urllib2.Request(
                url = p_login_url,
                data = p_login_data,
                headers = p_login_header
                )
        try:
            cookie_file = 'cookie.txt'                  #生成cookie
            cookie = cookielib.MozillaCookieJar(cookie_file)
            opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))         
            response = opener.open(request)             #登录
            cookie.save(ignore_discard = True,ignore_expires = True)
        except urllib2.URLError,e:
            if hasattr(e,"reason"):
                print "登录失败？？？",e.reason

ps = Pixiv_Spider()
ps.p_id = raw_input('请输入你的pixiv id:')
ps.p_pw = raw_input('请输入你的pixiv密码:')
ps.Login()

登录完成后就可以进行我们想要图片批量爬取了...

首先需要写一个方法利用一下前面登录的cookie...

def Cookie_Login(self):                         #读取之前登陆生成的cookie
    cookie_login = cookielib.MozillaCookieJar()
    cookie_login.load('cookie.txt',ignore_discard = True,ignore_expires = True)
    opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie_login))
    return opener

为了以后的需要...

我们在这里写一个选项菜单...

方便以后添加更多的功能...

def Choice_Pixiv(self,opener):     #选择要跳转到的页面
    if (self.p_choice == '1'):
        try:
            p_page = opener.open(self.p_international_url)   #p_international_url = 'http://www.pixiv.net/ranking_area.php?type=detail&no=6'
            p_international = p_page.read().decode('utf-8')  #利用cookie登录后的页面
        except urllib2.URLError,e:
            if hasattr(e,"reason"):
                print "连接错误:",e.reason

这个时候就可以写今天的主体了国际榜的方法了...

这次需要一个非常厉害的东西 BeautifulSoup...它可以帮助我们在这里进一步提取html中的关键细节

def Pixiv_International(self,opener,p_international,dl_dir):
    soup = BeautifulSoup(p_international)
    for i in range(1,101):                    #已知pixiv国际榜的排名为100名，用for循环来完成
     get_information = str(soup.find(id=i))          #通过bs处理html将我们所需要的信息大体提取出来

在pixiv的国际榜中有单张上传的图片，多张上传的图片，还有一中漫画格式和动图

先来看一下他们在页面代码中是什么样子

单张图片：

<a class="work _work " href="member_illust.php?mode=medium&illust_id=56037267">

href中的就是我们正常浏览作品时的url的一部分

so...将它提取出来...

 result_url = re.search(re.compile('<.*?work\s_work\s".*?href="(.*?)">',re.S),get_information)

多张图片：

动图：

漫画多图：

同理还是提取出中间的href...

result_multiple = re.search(re.compile('<a.*?work\s_work\smultiple\s.*?href="(.*?)">',re.S),get_information)     #多图
result_video = re.search(re.compile('<a.*?work\s_work\sugoku-illust\s.*?href="(.*?)">',re.S),get_information)    #动图
result_manga_multiple = re.search(re.compile('<a.*?work\s_work\smanga\smultiple\s.*?href="(.*?)">',re.S),get_information)   #漫画多图

在当我们用re.search搜索不到的时候，他就会返回一个None...利用这一点我们就可以判断图片模式了

由于功力不足...我无法抓取动图...所以放弃动图...

其他的单图，多图和漫画多图在后面处理的时候不一样...所以这样写

if result_video == None:                                #判断是否是动图
    if result_manga_multiple == None:                   #判断是否为manga
        if result_multiple == None:                     #判断是否为多图
            p_url = 'http://www.pixiv.net/' + result_url.group(1)
        else:
            p_url = 'http://www.pixiv.net/' + result_multiple.group(1)
    else:
        p_url = 'http://www.pixiv.net/' + result_manga_multiple.group(1)
else:
    print "诶呀！这是张动图...无能为力啊...╮(╯▽╰)╭"

这下子我们就能拥有浏览这些图片的url了...

但是这个时候我们输出一下会发现有些和我们想象中的不一样啊（╯‵□′）╯︵┴─┴

http://www.pixiv.net/member_illust.php?mode=medium&illust_id=56039502

经过仔细对比发现是url中间的&在前面的处理中被转义成&了...

我们再写一个工具类来帮助我们将他转换回来...

class Tools:

    remove = re.compile('amp;')

    def removesomething(self,x):
        x = re.sub(self.remove,"",x)
        return x.strip()

通过re.compile找出多出来的amp;，再用re.sub赋空字符就可以了...

想要调用这个类，在爬虫类Pixiv_Spider的__init__中增加这条代码就可以了

def __init__(self):
    self.tool = Tools()

经过一番折腾现在的代码变成这样了

if result_video == None:
    if result_manga_multiple == None:                   #判断是否为manga
        if result_multiple == None:                     #判断是否为多图
             print "报告！前方发现单张张图片..."
             p_url = self.tool.removesomething('http://www.pixiv.net/' + result_url.group(1))
        else:
            print "报告！前方发现多张图片..."
           p_url = self.tool.removesomething('http://www.pixiv.net/' + result_multiple.group(1))
    else:
        print "报告！前方发现多张图片..."
        p_url = self.tool.removesomething('http://www.pixiv.net/' + result_manga_multiple.group(1))
else:
     print "诶呀！前方这是张动图...无能为力啊...╮(╯▽╰)╭"

光url提取出来还不够，我还想保存这些图片的信息：标题，p站id,作者等等...

再来看一下刚刚的html...

标题：

p站id：

作者：

再写一个方法将这些信息打印到屏幕上并将它们以文件形式保存...

def Download_Data(self,i,get_information,p_url):
    #通过使用正则表达式再处理一遍经过bs处理的html代码，找到需要的信息(url,title,user)
    result_title = re.search(re.compile('<a href=".*?>(.*?)</a>',re.S),get_information)
    result_id = re.search(re.compile('<a class.*?illust_id=(.*?)">',re.S),get_information) 
    result_user = re.search(re.compile('<span class.*?>(.*?)</span>',re.S),get_information)    
    p_rank = str(i)                   #在屏幕上输出信息
    print "RANK #" + p_rank
    p_id = result_id.group(1)
    print "Pixiv ID:" + p_id
    p_title = result_title.group(1)
    print "Title:" + p_title
    p_user = result_user.group(1)
    print "User:" + p_user
    file_data = open('E:/pixivdata/' + dl_dir + '/pixiv_' + p_id + '.txt','w')     #创建信息文件
    massage = [                         #保存信息
           'rank:' + p_rank +'\n',
           'id:' + p_id + '\n',
           'title:' + p_title + '\n',
           'user:' + p_user + '\n',
           'url:' + p_url
    ]
    file_data.writelines(massage)
    file_data.close()
    print "pixiv信息保存成功"           #将信息以txt格式保存下来
   return p_id

墨迹了这么长时间，收集了足够的信息...现在可以写下载的部分了...

先看下网页...

单张图片：

多张图片(漫画和普通多图)：

经过观察我们发现多图的界面可以看到一共有多少张图片...这样子我们就可以先将多图的图片数提取出来...

soup = BeautifulSoup(opener.open(p_url))
result_pic_more = re.search(re.compile('</li><li>.*?\s(.*?)P</li>',re.S),str(soup.find_all("ul",class_="meta")))
print "报告！发现图片" + result_pic_more.group(1) + "张..."

点开多图...跳转到另一个页面...

通过查看网页代码发现他指向了这样一个url...

点进去发现这里就是我们想要的原图，后面的page控制了图片在多图中的顺序

http://www.pixiv.net/member_illust.php?mode=manga_big&illust_id=56039502&page=0

除了page以外...这个url和我们刚刚爬到的url还是有点区别...那就在Tools()里给它构造出一个一样的

http://www.pixiv.net/member_illust.php?mode=medium&illust_id=56039502

make_m = re.compile('mode=medium')

def make_big_url(self,x):
    x = re.sub(self.make_m,"mode=manga_big",x)
    return x.strip()

于是通过现有信息来进行爬取

for j in range(0,int(result_pic_more.group(1))):            
    make_url = self.tool.make_big_url(p_url)+'&page='+str(j)      #构造url
    m_soup = BeautifulSoup(opener.open(make_url))
    real_url = re.search(re.compile('<img.*?src="(.*?)"/>',re.S),str(m_soup.find_all("img")
    print '成功找到大图链接（ˉ﹃ˉ）...\n' + real_url.group(1)   #下载图片并保存
    d_url = opener.open(make-url)
   file_pic = open('E:/pixivdata/pixiv_' + p_id + '_' + str(j) + '.jpg','wb')
    file_pic.write(d_url.read)
    file_pic.close()

但是到程序到这里就会报错...

找来找去发现在当访问原图的url的时候浏览器会向服务器发送一个请求头...这个请求头与之前的请求头有区别的是它多了一个参数Referer...

如果在只访问原图url的时候...浏览器（我们的程序）并不会发送带Referer的请求头...服务器收到这个请求头但是不会回应...于是就悲催了...403

那么我们就给他一个Referer...

def Download_Request(self,opener,make_url,real_url):
    p_download_header = {                          #头信息
        'Accept-Language':'zh-CN,zh;q=0.8',
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:45.0) Gecko/20100101 Firefox/45.0'
    }
    p_download_header['Referer'] = make_url        #将referer加入header，没有referer会显示403                
    download_request = urllib2.Request(
        url = real_url.group(1),
        headers = p_download_header
        )
    decode_url = opener.open(download_request)
    return decode_url.read()

不光是这里...细心的人可以发现我们提交的Referer和浏览器上看到的有点区别

我们还是在刚刚的Tools()里再写一个方法处理它

rmbig = re.compile('_big')

def removebig(self,x):
    x = re.sub(self.rmbig,"",x)
    return x.strip()

p_download_header['Referer'] = self.tool.removebig(make_url)

这下可以成功抓取多张图片了...

不过我在这里再给程序添加个小功能...就是将图片按照服务器上的文件格式进行保存...在Tool()中添加下面的方法...

def Pic_Type(self,real_url):                    #区分图片分辨率
    p_type = re.search(re.compile('png',re.S),real_url)
    if p_type == None:
        self.pic_type = 'jpg'
        return self.pic_type
    else:
        self.pic_type = 'png'
        return self.pic_type

这样我们多图下载的功能就完成了

for j in range(0,int(result_pic_more.group(1))):            
    make_url = p_url+'&page='+str(j)       #生成多张的url
    m_soup = BeautifulSoup(opener.open(make_url))
    real_url = re.search(re.compile('<img.*?src="(.*?)"/>',re.S),str(m_soup.find_all("img")))
    p_type = self.tool.Pic_Type(real_url.group(1))
    print '成功找到大图链接（ˉ﹃ˉ）...\n' + real_url.group(1)#下载图片并保存
    file_pic = open('E:/pixivdata/pixiv_' + p_id + '_' + str(j) + '.' + p_type,'wb')  
    file_pic.write(self.Download_Request(opener,make_url,real_url))
    file_pic.close()
    print '成功下载到本地(/≧▽≦)/...'

点开单图...使其最大化...用查看网页代码...

找到了单张图片大图的url...

http://i4.pixiv.net/img-original/img/2016/03/27/16/00/01/56037267_p0.png

和多图的差不多

soup = BeautifulSoup(opener.open(p_url))
real_url = re.search(re.compile('.*?data-src="(.*?)"',re.S),str(soup.find_all("img",class_="original-image")))
print '成功找到大图链接(ˉ﹃ˉ)...\n' + real_url.group(1)
p_type = self.tool.Pic_Type(real_url.group(1))
file_pic = open('E:/pixivdata/' + dl_dir + '/pixiv_' + p_id + '.' + p_type,'wb')                
file_pic.write(self.Download_Request(opener,make_url,real_url))
file_pic.close()
print '成功下载到本地(/≧▽≦)/...'

整理一下...下载的方法就写好了...

def Download_Pic(self,p_num,i,opener,p_url,p_id,dl_dir):
    if p_num == '1':
    soup = BeautifulSoup(opener.open(p_url))
    real_url = re.search(re.compile('.*?data-src="(.*?)"',re.S),str(soup.find_all("img",class_="original-image")))
    print '成功找到大图链接(ˉ﹃ˉ)...\n' + real_url.group(1)
    p_type = self.tool.Pic_Type(real_url.group(1))
    file_pic = open('E:/pixivdata/' + dl_dir + '/pixiv_' + p_id + '.' + p_type,'wb')
       file_pic.write(self.Download_Request(opener,p_url,real_url))
    file_pic.close()
    print '成功下载到本地(/≧▽≦)/...'
            
   if p_num == 'more':
       soup = BeautifulSoup(opener.open(p_url))
    result_pic_more = re.search(re.compile('</li><li>.*?\s(.*?)P</li>',re.S),str(soup.find_all("ul",class_="meta")))
    print "发现图片" + result_pic_more.group(1) + "张...⊙▽⊙"
    for j in range(0,int(result_pic_more.group(1))):
           make_url = self.tool.make_big_url(p_url)+'&page='+str(j)      #生成多张的url
           m_soup = BeautifulSoup(opener.open(make_url))
           real_url = re.search(re.compile('<img.*?src="(.*?)"/>',re.S),str(m_soup.find_all("img")))
           p_type = self.tool.Pic_Type(real_url.group(1))
           print '成功找到大图链接（ˉ﹃ˉ）...\n' + real_url.group(1)     #下载图片并保存
           file_pic = open('E:/pixivdata/' + dl_dir + '/pixiv_' + p_id + '_' + str(j) + '.' + p_type,'wb')  
           file_pic.write(self.Download_Request(opener,make_url,real_url))
           file_pic.close()
      print '成功下载到本地(/≧▽≦)/...'

写了这么多我们整理下就是我们想要的小程序了

#coding:UTF-8

__author__ = 'monburan'
__version__ = '0.10 only_international'

import os
import re
import urllib
import urllib2
import cookielib
from urllib2 import urlopen
from bs4 import BeautifulSoup

class Tools:

    remove = re.compile('amp;')
    rmbig = re.compile('_big')
    make_m = re.compile('mode=medium')
    
    def removebig(self,x):
        x = re.sub(self.rmbig,"",x)
        return x.strip()

    def removesomething(self,x):
        x = re.sub(self.remove,"",x)
        return x.strip()

    def make_big_url(self,x):
        x = re.sub(self.make_m,"mode=manga_big",x)
        return x.strip()

    def Pic_Type(self,real_url):                    #区分图片分辨率
        p_type = re.search(re.compile('png',re.S),real_url)
        if p_type == None:
            self.pic_type = 'jpg'
            return self.pic_type
        else:
            self.pic_type = 'png'
            return self.pic_type

class Pixiv_Spider:

    def __init__(self):
        self.tool = Tools()
        self.p_id = ''
        self.p_pw = ''
        self.p_choice = ''
        self.dl_dir = ''
        self.pic_type = ''
        self.p_international_url = 'http://www.pixiv.net/ranking_area.php?type=detail&no=6'     #国际排行榜url

    def Login(self):                        #处理登录所需要的请求信息
        p_login_url = 'https://www.pixiv.net/login.php'        
        data = {                                    #登录所要post的信息
                'mode':'login',
                'skip':1
                }
        data['pixiv_id'] = self.p_id                #传入登录id以及password
        data['pass'] = self.p_pw
        p_login_data = urllib.urlencode(data)
        p_login_header = {                          #头信息
                'accept-language':'zh-cn,zh;q=0.8',
                'referer':'https://www.pixiv.net/login.php?return_to=0',
                'user-agent':'mozilla/5.0 (windows nt 10.0; win64; x64; rv:45.0) gecko/20100101 firefox/45.0'
                }
        request = urllib2.Request(
                url = p_login_url,
                data = p_login_data,
                headers = p_login_header
                )
        try:
            cookie_file = 'cookie.txt'                  #生成cookie
            cookie = cookielib.MozillaCookieJar(cookie_file)
            opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))         
            response = opener.open(request)             #登录
            cookie.save(ignore_discard = True,ignore_expires = True)
        except urllib2.URLError,e:
            if hasattr(e,"reason"):
                print "登录失败？？？",e.reason
    
    def Download_Request(self,opener,make_url,real_url):
            p_download_header = {                          #头信息
                'Accept-Language':'zh-CN,zh;q=0.8',
                'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:45.0) Gecko/20100101 Firefox/45.0'
            }

            p_download_header['Referer'] = self.tool.removebig(make_url)        #将处理过的referer加入header，没有referer会显示403
                
            download_request = urllib2.Request(
                url = real_url.group(1),
                headers = p_download_header
                ) 
            decode_url = opener.open(download_request)
            return decode_url.read()

    def Cookie_Login(self):                         #读取之前登陆生成的cookie
            cookie_login = cookielib.MozillaCookieJar()
            cookie_login.load('cookie.txt',ignore_discard = True,ignore_expires = True)
            opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie_login))
            return opener

    def Choice_Pixiv(self,opener):     #选择要跳转到的页面
        if (self.p_choice == '1'):
            try:
                p_page = opener.open(self.p_international_url)
                p_international = p_page.read().decode('utf-8')
                dl_dir = 'international'
                self.Pixiv_International(opener,p_international,dl_dir)
            except urllib2.URLError,e:
                if hasattr(e,"reason"):
                    print "连接错误:",e.reason

    def Pixiv_International(self,opener,p_international,dl_dir):
        soup = BeautifulSoup(p_international)
        os.mkdir(r'E:/pixivdata/' + dl_dir + '/')          #生成文件夹
        print "生成"+dl_dir+"目录成功！"
        for i in range(1,101):                              #已知pixiv国际榜的排名为100名，用for循环来完成
            get_information = str(soup.find(id=i))          #通过bs处理html将我们所需要的信息大体提取出来
            result_url = re.search(re.compile('<.*?work\s_work\s".*?href="(.*?)">',re.S),get_information)
            result_multiple = re.search(re.compile('<a.*?work\s_work\smultiple\s.*?href="(.*?)">',re.S),get_information)
            result_video = re.search(re.compile('<a.*?work\s_work\sugoku-illust\s.*?href="(.*?)">',re.S),get_information)
            result_manga_multiple = re.search(re.compile('<a.*?work\s_work\smanga\smultiple\s.*?href="(.*?)">',re.S),get_information)            
            if result_video == None:
                if result_manga_multiple == None:                   #判断是否为manga
                    if result_multiple == None:                     #判断是否为多图
                        p_num = '1'
                        p_url = self.tool.removesomething('http://www.pixiv.net/' + result_url.group(1))
                        print "报告！前方发现单张图片..."
                        p_id = self.Download_Data(i,get_information,p_url,opener,dl_dir)
                        self.Download_Pic(p_num,i,opener,p_url,p_id,dl_dir)
                    else:
                        p_num = 'more'
                        p_url = self.tool.removesomething('http://www.pixiv.net/' + result_multiple.group(1))
                        print "报告！前方发现多张图片..."
                        p_id = self.Download_Data(i,get_information,p_url,opener,dl_dir)
                        self.Download_Pic(p_num,i,opener,p_url,p_id,dl_dir)
                else:
                    p_num = 'more'
                    p_url = self.tool.removesomething('http://www.pixiv.net/' + result_manga_multiple.group(1))
                    print "报告！前方发现多张漫画..."
                    p_id = self.Download_Data(i,get_information,p_url,opener,dl_dir)
                    self.Download_Pic(p_num,i,opener,p_url,p_id,dl_dir)
            else:
                print "报告！前方这是张动图...无能为力啊...╮(╯▽╰)╭"

    def Download_Data(self,i,get_information,p_url,opener,dl_dir):
        #通过使用正则表达式再处理一遍经过bs处理的html代码，找到需要的信息(url,title,user)
        result_title = re.search(re.compile('<a href=".*?>(.*?)</a>',re.S),get_information)
        result_id = re.search(re.compile('<a class.*?illust_id=(.*?)">',re.S),get_information) 
        result_user = re.search(re.compile('<span class.*?>(.*?)</span>',re.S),get_information)        
        p_rank = str(i)
        p_id = result_id.group(1)
        p_title = result_title.group(1)
        p_user = result_user.group(1)
        print "RANK #" + p_rank + "\nPixiv ID:" + p_id + "\nTitle:" + p_title +"\nUser:" + p_user
        file_data = open('E:/pixivdata/' + dl_dir + '/pixiv_' + p_id + '.txt','w')     #创建信息文件
        massage = [                         #保存信息
            'rank:' + p_rank +'\n',
            'id:' + p_id + '\n',
            'title:' + p_title + '\n',
            'user:' + p_user + '\n',
            'url:' + p_url
            ]
        file_data.writelines(massage)
        file_data.close()
        print "报告！pixiv信息保存成功..."           #将信息以txt格式保存下来
        return p_id

    def Download_Pic(self,p_num,i,opener,p_url,p_id,dl_dir):
        if p_num == '1':
            soup = BeautifulSoup(opener.open(p_url))
            real_url = re.search(re.compile('.*?data-src="(.*?)"',re.S),str(soup.find_all("img",class_="original-image")))
            print '成功找到大图链接(ˉ﹃ˉ)...\n' + real_url.group(1)
            p_type = self.tool.Pic_Type(real_url.group(1))
            file_pic = open('E:/pixivdata/' + dl_dir + '/pixiv_' + p_id + '.' + p_type,'wb')                
            file_pic.write(self.Download_Request(opener,p_url,real_url))
            file_pic.close()
            print '成功下载到本地(/≧▽≦)/...'            
        if p_num == 'more':
            soup = BeautifulSoup(opener.open(p_url))
            result_pic_more = re.search(re.compile('</li><li>.*?\s(.*?)P</li>',re.S),str(soup.find_all("ul",class_="meta")))
            print "发现图片" + result_pic_more.group(1) + "张...⊙▽⊙"
            for j in range(0,int(result_pic_more.group(1))):
                make_url = self.tool.make_big_url(p_url)+'&page='+str(j)        #生成多张的url
                m_soup = BeautifulSoup(opener.open(make_url))
                real_url = re.search(re.compile('<img.*?src="(.*?)"/>',re.S),str(m_soup.find_all("img")))
                p_type = self.tool.Pic_Type(real_url.group(1))
                print '成功找到大图链接（ˉ﹃ˉ）...\n' + real_url.group(1)     #下载图片并保存
                file_pic = open('E:/pixivdata/' + dl_dir + '/pixiv_' + p_id + '_' + str(j) + '.' + p_type,'wb')  
                file_pic.write(self.Download_Request(opener,make_url,real_url))
                file_pic.close()
                print '成功下载到本地(/≧▽≦)/...'        

    def Program_Start(self):
        self.Login()
        opener = self.Cookie_Login()
        self.Choice_Pixiv(opener)

ps = Pixiv_Spider()
ps.p_id = raw_input('请输入你的pixiv id:')
ps.p_pw = raw_input('请输入你的pixiv密码:')
print ('1.进入国际排行榜)
ps.p_choice = raw_input()
ps.Program_Start()

来看一下运行的结果吧（今天刚好前三名分别是多图，单图，和动图）

你可能感兴趣的:(爬虫,python,pixiv,菜鸟编程)

CLR中的marshal_as 介绍 qzy0621 C#C++笔记 c++c#
CLR中的marshal_as介绍CLR和CLI的关系CLI（CommonLanguageInfrastructure）CLR（CommonLanguageRuntime）marshal_as介绍marshal_as代码使用示例工程文件说明CLR和CLI的关系CLR和CLI是与.NET技术密切相关的两个概念，它们在编程语言和运行时环境中扮演着重要角色。简单来说，CLI是一种标准，而CLR是该标准的
Python项目在 Cursor 编辑器中 Conda 环境配置问题 phper8 python python conda cursor
在开发使用FastApi框架的Python某项目时，我遇到了一个因为Conda环境配置没有起作用的问题。我是用Cursor编辑器开发FastApi项目的，项目运行在Conda环境blog中，由于使用了opencc-python-reimplemented，Python版本要求3.10.16。于是我创建blog基于此版本：condacreate-nblogpython=3.10.16但Cursor的
如何用Conda保持Python环境的完美隔离？西坡不是东坡 python学习 conda python 开发语言
想象一下，你正在开发一个网站，使用了Python3.8和Django2.2。突然，你的一个朋友邀请你参与另一个用Python3.6和Flask1.1开发的项目。如果没有Conda，你可能需要在两个项目间频繁切换，每次都要重新安装和配置环境，这不仅耗时，而且容易出错。但现在，有了Conda，你可以轻松地为每个项目创建和管理虚拟环境，让开发工作变得简单高效。Conda与虚拟环境什么是Conda？Con
【已解决】conda环境下ROS2 colcon build编译选择特定python解释器_anaconda 使用colcon m0_60607675 2024年程序员学习 python conda 开发语言
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
linux基础02（Bash+vim用法）景天科技苑 linux基础与进阶 shell脚本编写实战 linux bash vim
Bash详解：在Linux系统中，Bash是一种Unixshell，用于与操作系统进行交互，执行命令和脚本，以及管理文件和目录。Bash是BourneAgainSHell的缩写，是一种强大的命令行界面工具，广泛用于Linux和其他类Unix操作系统。Bash提供了非常丰富的命令集和脚本编程功能，可以用于自动化任务、批处理操作、系统管理、软件开发等各种用途。我们在服务器上操作命令时，谨记：1、在服务
JAVA Spring Boot Aspect 注解的使用和注意事项微笑的曙光（StevenLi） JAVA java spring boot 开发语言
JavaSpringBoot的Aspect注解，作为面向切面编程的利器，其强大之处在于能够无缝地将横切关注点融入业务逻辑中，而无需修改原有代码。通过动态代理机制，Aspect可以在运行时灵活地织入日志、事务管理、权限校验等额外逻辑，极大地提高了系统的灵活性和可维护性。此外，Aspect还支持多种通知类型，如前置通知、后置通知、环绕通知等，满足了不同场景下的需求。这种松耦合、高内聚的设计思想，是现代
Python 爬虫实战：开放数据集抓取与大数据分析应用西攻城狮北 python 爬虫数据分析
引言在数据驱动的时代，开放数据集成为了各领域研究和应用的宝贵资源。通过抓取和分析开放数据集，我们可以挖掘出有价值的信息，为决策提供支持。本文将详细介绍如何使用Python爬虫技术抓取开放数据集，并进行大数据分析应用。一、项目背景与目标1.项目背景随着信息技术的飞速发展，越来越多的机构和组织开始开放其数据集，以促进创新和研究。这些开放数据集涵盖了各个领域，如气象、交通、医疗、金融等。通过抓取和分析这
electron调用python_Electron as GUI of Python weixin_39653361
最近准备做一个离线升级工具，想起前几天刚接触的Electron决定用它与python相结合来完成开始准备环境搭建几经折腾各种zerorpc，zerormq各种报错历经一天多的网上折腾终于找到一篇实践成功先看整个流程搭建:start|V+------------+||start|+------------->+-------------------+|electron|subprocess|||||
Electron+Python软件系统开发记录（一）：基础环境搭建多宝鱼1998 环境配置遇到的坑 python nodejs thrift
Electron+Python软件系统开发记录（一）：基础环境搭建1.问题说明最近开始做本科毕设，其中有一部分内容是搭建一个完整的软件系统。系统要求就是常见的客户端，服务器，数据库的整体架构。因为本科不是计算机系的，所以学习的相关技能少，以前写课程设计一般用QT或者MFC，还有Mac的OC语言。本着多学习的态度，这次选用了Electron框架，可以迫使自己学学html,css,js这些东西。后端因
C++并发编程实战 lijiaxin2333 C++c++
文章目录第一章:你好,C++并发世界什么是并发并发的途径为什么使用并发什么时候不使用并发C++新标准中的并发支持开始入门:你好,并发世界第一章:你好,C++并发世界至C++11开始,C++标准支持多线程程序.什么是并发人可以一边唱歌一边跳舞,计算机呢?单处理器计算机每秒可以切换任务许多次,做一点A任务再做一点B任务,然AB任务看起来是并行发生.这就是任务切换.任务切换可以被看做并发.多处理器计算机
windows下pycharm中配置conda虚拟环境攻城狮的梦 yolov8从基础到精通 windows pycharm conda
目录一：背景二：安装conda环境三：pycharm配置环境四：注意问题一：背景在使用python的过程中，我们可能需要在一个windows环境中创建多个版本的python和安装不同的库去做一些开发任务。使用conda，我们可以先创建多个独立的Python环境，以免影响其他环境的运行。在每个独立的环境中安装各自的包，互相不影响。二：安装conda环境1：下载安装Anaconda3Anaconda指
C++ 并发编程实战学习笔记 myc13381 c++笔记
C++并发编程学习笔记目录一.基本接口二.初步了解多线程三.线程所属权管理四.线程间共享数据五.同步并发操作六.C++内存模型和原子类型操作七.基于锁的并发数据结构设计八.无锁数据结构九.并发代码设计十.高级线程管理十一.并行算法十二.参考资料基本接口std::thread常用成员函数构造和析构函数//默认构造函数，创建一个线程，什么也不做thread()noexcept;//初始化构造函数，创建
多线程程序的测试和调试_第11章_《C++并发编程实战》笔记郭涤生 #并发线程 c/c++c++笔记并发编程
多线程程序的测试和调试1.并发相关Bug的核心类型1.1数据竞争（DataRace）1.2死锁（Deadlock）1.3活锁（Livelock）2.定位并发Bug的技巧3.代码优化与修复示例3.1修复数据竞争（使用原子操作）3.2避免死锁（统一锁顺序）4.总结5.多选题目及答案6.设计题目7.设计题目参考答案1.并发相关Bug的核心类型1.1数据竞争（DataRace）定义：多线程同时访问共享数据
设计无锁的并发数据结构_第七章_《C++并发编程实战》笔记郭涤生 #并发线程 c/c++数据结构 c++
设计无锁的并发数据结构1.核心概念与难点1.1无锁（Lock-Free）条件1.2原子操作的重要性1.3内存顺序（MemoryOrder）1.4ABA问题2.代码解析：无锁栈的实现（简化）3.多选题目4.设计题目5.多选题答案6.设计题参考答案1.核心概念与难点1.1无锁（Lock-Free）条件定义：一种并发算法的实现方式，保证无限执行进程中至少有一个线程能推进操作（系统整体进步）。关键特性：无
并发设计_第八章_《C++并发编程实战》笔记郭涤生 #并发线程 c/c++c++并发编程
并发设计1.线程间工作划分（工作窃取）2.性能优化（伪共享与缓存行对齐）3.设计并发数据结构（无锁队列）4.多选题目5.多选题目答案4.设计题目5.设计题目参考答案1.线程间工作划分（工作窃取）概念：使用工作窃取（WorkStealing）策略平衡负载。空闲线程从其他线程的任务队列尾部“偷”任务执行，减少闲置线程。代码示例：线程池实现工作窃取队列#include#include#include#i
C++内存模型和原子操作_第五章_《C++并发编程实战》笔记郭涤生 c/c++#并发线程 c++并发编程
C++内存模型和原子操作1.原子操作与无锁编程2.内存顺序核心概念示例代码3.原子操作的应用：自旋锁核心概念示例代码4.无锁数据结构：无锁栈核心概念示例代码5.多选题目5.多选答案7.设计题目7.设计题目示例答案1.原子操作与无锁编程核心概念原子操作：是不可分割的操作，在执行过程中不会被其他线程中断。C++标准库在头文件中提供了一系列原子类型，如std::atomic、std::atomic等。原
Python --itertools中accumulate函数详细讲解何等样仁算法与数据结构 python 开发语言
1.1前言：本文将详细讲解itertools中的accumulate，accumulate函数可以在前缀和中运用，否则就需要每次移动的时候维护一个前缀和，大家如果不知道前缀和也可以先了解一下前缀和，前缀和可以解决数组区间和查询问题、矩阵区域和查询问题、连续子数组和问题、最大子段和问题、最大子矩阵和问题这里，但是如果大家不太了解前缀和也可以放心食用，因为运用这个累加函数其实十分简单。1.2定义：it
【java多线程】线程通信（以生产者消费者问题为例） 6<7 java python 开发语言
线程通信(主讲wait方法和notifyAll方法)在Java多线程编程中，线程通信是指多个线程之间相互协作、交换信息的过程。为了实现线程通信，Java提供了一些方法，下面详细介绍常用的线程通信方法：基于Object类的方法在Java中，每个对象都有一个内置的监视器（锁），基于这个特性，Object类提供了三个用于线程通信的方法：wait()、notify()和notifyAll()。这些方法必须
C语言入门（大一笔记）函数篇考不上贰幺幺不改名 C语言笔记 c语言程序设计编程语言
第七章C语言函数前言一、基础知识点7.1什么是函数？概念我们将常用的代码以固定的格式封装（包装）成一个独立的模块，只要知道这个模块的名字就可以重复使用它，这个模块就叫做函数（Function）。用比较字符串大小的函数讲解函数的封装以及一些注意事项。库函数和自定义函数C语言自带的函数称为库函数（LibraryFunction）。库（Library）是编程中的一个基本概念，可以简单地认为它是一系列函数
【21】单片机编程核心技巧：if语句逻辑与真假判断智木芯语【编程技巧】单片机嵌入式 #STC8 #STM32
【21】单片机编程核心技巧：if语句逻辑与真假判断七律·条件分野if语句判真假，括号条件定乾坤。非零为真零为假，大括号内藏玄门。省略虽简风险在，代码规范护本根。单片逻辑由心控，条件分支自成文。注释：if语句判真假：通过条件表达式判断逻辑分支走向。括号条件定乾坤：括号内表达式决定代码执行路径。非零为真零为假：C语言中非零值为真，零值为假。大括号内藏玄门：大括号界定条件满足时执行的代码块。省略虽简风险
php mysql中几个版本的进化史_PHP 进化史 — 从 v5.6 到 v8.0 插门胡的小背心 php mysql中几个版本的进化史
在此篇文章中，我们将用15分钟对PHPv7.x版本更改进行简要回顾。PHP7.3版本发布后，为了更好地理解这门广泛流行的编程语言的新特性和优化之处，我决定详细地研究下PHP开发：正在开发什么以及其开发方向。在查看了PHP在PHP7.x版本开发过程中实现的一系列特性的简要列表之后，我决定自己整合这个列表作为一个很好的补充，我相信也会有人觉得有用的。我们将从PHP5.6作为基准开始，研究添加或者更改了
python中很常用的10个内置函数整理（初学必备）程序员七海网络安全程序员黑客 python 网络 windows linux 数据库开源服务器
对于初学Python的小伙伴们来说，掌握内置常用函数是学好Python的重要一步。这些函数不仅能让你的代码更加简洁，还可以提高编程效率。本笔记将为大家整理62个Python中最常用的内置函数，并且给出了一些简单的示例，帮助大家更好地理解和运用这些函数。这些内置函数是Python编程的基础，对于初学者来说，理解和掌握它们是非常重要的。通过实践和运用这些函数，你将能够更加高效地编写Python代码，并
保姆级教学——本地免费部署DeepSeek-R1模型并通过Python调用 shuaige_shiwoa python+AI python 开发语言 AI编程 ai
以下是如何在本地免费部署DeepSeek-R1模型并通过Python调用的详细指南：一、环境准备（Windows/Linux/Mac通用）1.硬件要求最低配置：16GB内存+20GB可用磁盘空间推荐配置：NVIDIAGPU（显存≥8GB）+CUDA11.8（CPU模式支持但速度较慢）2.软件依赖#创建虚拟环境（可选但推荐）condacreate-ndeepseekpython=3.10condaa
ChromeDriver介绍和使用 Chen_Chance chrome
什么是ChromeDriver？ChromeDriver是一个用于在自动化测试中控制GoogleChrome浏览器的工具。它是SeleniumWebDriver的一部分，可以让开发者通过编程的方式操作浏览器进行各种测试。ChromeDriver充当了WebDriver和Chrome浏览器之间的桥梁，使得测试脚本能够与浏览器交互。为什么使用ChromeDriver？在现代软件开发中，确保网页在不同浏
C C++ 为什么称为Native代码、虚拟机 TO_ZRG c++开发语言
CC++为什么称为Native代码，为什么要快1.直接编译为机器码无需中间层：C/C++代码通过编译器（如GCC、Clang）直接编译为CPU可执行的机器码（二进制指令），运行时无需虚拟机（如JVM）或解释器（如Python解释器）的介入。减少运行时开销：相比Java、C#等需要运行时环境（JIT编译）的语言，C/C++的执行路径更短，避免了中间层的性能损耗。2.底层硬件访问能力直接操作硬件：C/
LeetCode 热题 HOT 100 第四十七天 146. LRU 缓存中等题用python3求解阿舒带你学编程面试学习路线阿里巴巴缓存 leetcode 链表面试 java-ee
题目地址请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类：LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中，则返回关键字的值，否则返回-1。voidput(intkey,intvalue)如果关键字key已经存在，则变更其数据值value；如果不存在，则向缓存中插
Python爬虫-请求模块urllib3 andyyah晓波 python 爬虫开发语言
Python爬虫-请求模块urllib3urllib3是一个功能强大、条理清晰，用于HTTP客户端的第三方模块，许多Python的原生系统已经开始使用urllib3。urllib3提供了很多Python标准库里所没有的重要特性：线程安全。连接池。客户端SSL/TLS验证。使用multipart编码上传文件。Helpers用于重试请求并处理HTTP重定向。支持gzip和deflate编码。支持HTT
Python爬虫-请求模块Urllib andyyah晓波 python 爬虫开发语言
Python爬虫-请求模块UrllibPython3中的Urllib模块中包含多个功能的子模块，具体内容如下：urllib.request：用于实现基本HTTP请求的模块。urllib.error：异常处理模块，如果在发送网络请求时出现了错误，可以捕获异常进行异常的有效处理。urllib.parse：用于解析URL的模块。urllib.robotparser：用于解析robots.txt文件，判断
python自制MBTI 16型人格测试1.0 LHTZ python 开发语言娱乐
什么是16型人格测试16型人格测试也叫MBTI（Myers-BriggsTypeIndicator）测试，它是一种基于心理学理论的人格测评工具。这个理论最初是由凯瑟琳・库克・布里格斯（KatharineCookBriggs）和她的女儿伊莎贝尔・布里格斯・迈尔斯（IsabelBriggsMyers）在20世纪40年代开发的。它的理论基础是瑞士心理学家卡尔・荣格（CarlJung）的心理类型理论。MB
Python常用函数及常用库整理 Nicholson07 python
简单整理一下一些常用函数，方便自己查阅。目录文件操作文件夹/目录文件数据格式链表类特殊函数一些常用函数常用库tqdm进度条库tqdm模块参数说明常用函数使用方法yacs参数配置库简介使用方法logging日志库使用方法文件操作文件夹/目录importos1、os.path.exists(path)判断一个文件/目录是否存在，只要存在相匹配的文件或目录就返回True，因此当目录与文件同名时可能报错2
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多