看，未来

Python爬虫自学系列（八）-- 项目实战篇（二）爬取我的所有CSDN博客

文章目录

- 前言
- 网站分析
- - 获取所有公开博客的链接
- 网页分析
- - 测试文档
  - 三个问题摆在眼前
  - - 问题一解决方案：
    - 问题二解决方案：
    - 问题三解决方案
    - - 思路一：
      - 思路二：
      - 思路三：
      - 我的选择
  - 结果分析
  - 新结果分析
  - 界面Xpath
- 爬取一篇博客
- - 正则表达式分析
  - 正则表达式测试
  - 状态机
  - 保存到文件
- 获取全部博客

前言

这次玩点刺激的，爬取我的所有博客。
当然，这事儿只有我能干，你们要爬可以爬自己的，后面我会把代码和分析结果放出来。

这两周发生了些不太愉快的事情，反正我现在是挺失望的。

网站分析

获取所有公开博客的链接

刚开始呢，我想找网站地图，看看能不能找到属于我的那一块儿。后来发现是我想多了，网站地图是有，但是那么多博主，一人搞一个也不太现实。于是这条路就走不通了。

接下来，我又去了“文章管理”界面，但是我马上就发现了这是一个动态网页。
我看了看底部的页码，十五页，说多页多，说少也少。反正就挺尴尬一个数的。
我想了想，这个页面比主页要简单点，抓个包看看吧。
找到了文章ID的包，发现网址单独拿出来打不开，于是又放弃了。

最后，我又回到了主页。
底部的页码一看，七页，可以，动手吧。

我本来想着，链接和标题一起拿了，后来转念一想，，文章里面也是有标题的，到时候一起拿就好了。

于是开始写代码。
有一说一啊，取Xpath的时候，谷歌确实好用，用火狐取出来的Xpath一直放空，谷歌取出来的是相对Xpath，一步到位。

import requests
import threadpool
from lxml import etree
import pandas as pd

cookie = '放你自己的'
header = {
     
'User-Agent': '放你自己的',
'Connection': 'keep-alive',
'accept': 'application/json, text/javascript, */*; q=0.01',
'Cookie': cookie,
'referer': '放你自己的主页'
}

url_list = ['https://lion-wu.blog.csdn.net/article/list/1', 'https://lion-wu.blog.csdn.net/article/list/2', 'https://lion-wu.blog.csdn.net/article/list/3', 'https://lion-wu.blog.csdn.net/article/list/4', 'https://lion-wu.blog.csdn.net/article/list/5', 'https://lion-wu.blog.csdn.net/article/list/6', 'https://lion-wu.blog.csdn.net/article/list/7']	# 这个链接很有规律的

keep_url_list = []	# 这个用来

def outdata(url):
    try:
        print('succeed'+url)
        res = requests.get(url,headers=header)
        wbdata = res.content.decode('UTF-8')
        tree = etree.HTML(wbdata)
        el_list = tree.xpath('//*[@id="articleMeList-blog"]/div[2]//div/h4/a/@href')
        print(el_list)
        keep_url_list.append(el_list)

    except:
        print('failed'+url)

def Thread_Pool(outdata,datalist = None,Thread_num = 5):
    '''
    线程池操作，创建线程池、规定线程池执行任务、将任务放入线程池中、收工
    :param outdata: 函数指针，线程池执行的任务
    :param datalist: 给前面的函数指针传入的参数列表
    :param Thread_num: 初始化线程数
    :return: 暂无
    '''
    pool = threadpool.ThreadPool(Thread_num)  # 创建Thread_num个线程

    tasks = threadpool.makeRequests(outdata, datalist)  # 规定线程执行的任务
    # outdata是函数名，datalist是一个参数列表，线程池会依次提取datalist中的参数引入到函数中来执行函数，所以参数列表的长度也就是线程池所要执行的任务数量。

    [pool.putRequest(req) for req in tasks]  # 将将要执行的任务放入线程池中

    pool.wait()  # 等待所有子线程执行完之后退出


Thread_Pool(outdata,datalist=url_list,Thread_num = 7)


#outdata('https://lion-wu.blog.csdn.net/article/list/1')

u2 = []
for i in keep_url_list:
    for j in i:
        print(j)
        u2.append(j)

pd.DataFrame(u2).to_csv('My_CSDN.csv')

网页分析

测试文档

本文使用测试文档：测试文档，要自己动手实现的朋友请打开测试文档跟着操作。

三个问题摆在眼前

随便点开了一篇博客的源码，看到里面不同的部件有不同的标签。
那么这里就涉及到了三个问题：

1、我总共用了多少不同的效果？
2、在爬取的时候，如何使不同的标签下的数据在存储的时候保持原有的顺序
3、标签的标记是否需要留下

问题一解决方案：

第一个问题好办，打开编辑界面就可以很清楚的看到所有的效果了：

回忆一下我用过的所有效果，有：

文章标题、文内标题、（目录）、加黄标、加粗、斜体、无序、有序、待办、【引用】、【代码块】、【图片】、【表格】、【超链接】、【分隔线】

打括号的是不要的，打中括号的是常用的。

那，要怎么看这些效果在源码里的体现呢，去找是不可能去找的了，写一篇博客，把这些功能都包进去测试就好了。

问题二解决方案：

对于问题二啊，我也纠结了一会儿，因为我不知道Xpath在爬取多个不同标签的时候能否保留住他们原有的顺序。
百度了一会儿，说真的，全是屁话。

于是我就做了个demo测试了一下：

import requests
from lxml import etree

# 前面这一串不再放出

def outdata(url):
    try:
        print('succeed'+url)
        res = requests.get(url,headers=header)
        wbdata = res.content.decode('UTF-8')
        tree = etree.HTML(wbdata)
        el_list = tree.xpath('//*[@id="articleMeList-blog"]/div[2]//div/h4/a')
        for el in el_list:
            e = el.xpath('./text() | ./@href')	 
            # 我特地把顺序反过来，就是要排除这种可能，因为真的开始爬的时候是不会事先让你知道顺序规律的，也没有规律可言。
            print(e)
            
    except:
        print('failed'+url)

outdata('https://lion-wu.blog.csdn.net/article/list/1')

结果证明是成功的，再做点字符串切割切掉转义字符和前后空格就行了。

问题三解决方案

本来以为这个问题是最简单的，只是我想不想留的问题。后来发现不是这样的。

思路一：

对于这个问题，如果直接上手去抓标签里面的文本的话，最终是会丢失掉标签的。
这个问题我想了想，我们可以先将文章标题取下，
之后取下文章正文部分的全部源码，用正则表达式对源码中的各标签打上标记，
之后再用Xpath将文本和链接取出来。

结果：转成字符串之后转不回来了、、、

于是，我又产生了一个想法。

思路二：

首先，非硬性需求的特效就不要了。比方说加粗、斜体、黄标、下划线这种的，就不要了。无序，有序，待办归为一类，也不要了。

这样一选择，那么需要注意的特效（单独再提取一份出来作为标记）就只有：引用、代码块、图片、表格、超链接了。

引用，代码块只标记首尾，表格把表头取出之后底下的也只标记首尾，
超链接和图片链接需要拿出来。

剩下的就交给匹配算法的事情了。

就是说，先把文本和链接全部提取出来，再重头提取一些重要信息。

这个只是复杂度高一些，实现还是没问题的。

思路三：

在Xpath提取的时候，看看能不能直接对文本进行标记，如果可以的话，那就最好。

我的选择

我选三，实现了。
方法一里面不是有说，将etree对象转化为字符串吗？
那我完全可以先把标签都选下来，我不取文本，我直接转字符串，这样不就连标签带文本全拿下来了吗？最后我们通过正则表达式将HTML代码中很长的标签转换为比较短的标签。

来看一下从测试文档上抓下来的标签们：

def outdata(url):
    try:
        print('succeed'+url)
        res = requests.get(url,headers=header)
        code = res.apparent_encoding  # 获取url对应的编码格式
        res.encoding = code

        wbdata = res.text
        tree = etree.HTML(wbdata)
        el_list = tree.xpath('//*[@id="content_views"]')

        for el in el_list:
            # e = etree.tostring(el, encoding=code).decode(code)
            # 这一步可以获取文章主体的源码部分

			#界面xpath在下面有提供
            es = el.xpath('./h1 |./h2 |./h3 |./h4 |./h5 |./h6 |./p |./p/mark |./p/span/span/span/span[2]//span/span[2]'
                '|./p/strong |./p/em |./ul//li |./ol//li |./ul//li |./blockquote/p |./pre/code |./p/code '
                '|./div/table/thead/tr//th |./div/table/tbody/tr//td |./hr |./p/img |./p/a')

            for e in es:
                print(etree.tostring(e, encoding=code).decode(code))
                print('-----')	# 调试所用，使得结果更清晰

    except:
        print('failed'+url)

结果：

succeedhttps://lion-wu.blog.csdn.net/article/details/113402976
<p/>

-----
<p/> 

-----
<h1><a id="_2"/>一级标题</h1> 

-----
<h2><a id="_3"/>二级标题</h2> 

-----
<h3><a id="_4"/>三级标题</h3> 

-----
<h4><a id="_5"/>四级标题</h4> 

-----
<h5><a id="_6"/>五级标题</h5> 

-----
<h6><a id="_7"/>六级标题</h6> 

-----
<p>这是一篇测试文档，现在不知道干嘛用很正常，我在写一个爬虫的项目，等我爬虫自学系列最后一篇出来就知道啦，到时候如果你们想复现的话，直接来我这里拿就好。</p> 

-----
<p><span class="katex--display"><span class="katex-display"><span class="katex"><span class="katex-mathml">
     
      
       
        
         a
        
        
         =
        
        
         b
        
        
         +
        
        
         c
        
       
       
         a = b + c 
       
      
     </span><span class="katex-html"><span class="base"><span class="strut" style="height: 0.43056em; vertical-align: 0em;"/><span class="mord mathdefault">a</span><span class="mspace" style="margin-right: 0.277778em;"/><span class="mrel">=</span><span class="mspace" style="margin-right: 0.277778em;"/></span><span class="base"><span class="strut" style="height: 0.77777em; vertical-align: -0.08333em;"/><span class="mord mathdefault">b</span><span class="mspace" style="margin-right: 0.222222em;"/><span class="mbin">+</span><span class="mspace" style="margin-right: 0.222222em;"/></span><span class="base"><span class="strut" style="height: 0.43056em; vertical-align: 0em;"/><span class="mord mathdefault">c</span></span></span></span></span></span></p> 

-----
<span class="mord mathdefault">a</span>
-----
<span class="mord mathdefault">b</span>
-----
<span class="mord mathdefault">c</span>
-----
<p><mark>这是突出字体</mark></p> 

-----
<mark>这是突出字体</mark>
-----
<p><strong>这是加粗字体</strong></p> 

-----
<strong>这是加粗字体</strong>
-----
<p><em>这是斜体</em></p> 

-----
<em>这是斜体</em>
-----
<li>这是无序</li>
-----
<li>这还是无序</li>
-----
<hr/> 

-----
<li>这是有序</li>
-----
<li>这还是有序</li>
-----
<hr/> 

-----
<li class="task-list-item"><input type="checkbox" class="task-list-item-checkbox" disabled="disabled"/> 这是待办</li>
-----
<li class="task-list-item"><input type="checkbox" class="task-list-item-checkbox" disabled="disabled"/> 这依旧是待办</li>
-----
<li>这是有序</li>
-----
<li>这还是有序</li>
-----
<hr/> 

-----
<p>这里是引用<br/> 这里还是引用</p> 

-----
<code class="prism language-python">代码块在这里
</code>
-----
<hr/> 

-----
<p>这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用</p> 

-----
<code class="prism language-python">代码块在这里
</code>
-----
<p><img src="https://img-blog.csdnimg.cn/20210129182417155.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNzYyMTkx,size_16,color_FFFFFF,t_70" alt="在这里插入图片描述"/></p> 

-----
<img src="https://img-blog.csdnimg.cn/20210129182417155.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNzYyMTkx,size_16,color_FFFFFF,t_70" alt="在这里插入图片描述"/>
-----
<p><a href="https://blog.csdn.net/qq_43762191?spm=1001.2101.3001.5343">超链接，顺着网线来打我啊！！！</a></p> 

-----
<a href="https://blog.csdn.net/qq_43762191?spm=1001.2101.3001.5343">超链接，顺着网线来打我啊！！！</a>
-----
<hr/> 

-----
<p>别忘了下划线哦<code>这是行代码</code></p>
                
-----
<code>这是行代码</code>
-----

结果分析

分析一下这里的结果，我们才好对下一步进行决策嘛。

1、首先，第一眼就看到了那一大串标签围绕的公式了，我不记得我还有没有带公式的博客，就留着吧，反正也是一个正则的事情。

2、其次一个很明显的就是重复问题了。
之前直接提取文本的时候不会出现，因为‘/’仅仅提取当前子路径下的所有，但是现在转了字符串，那么‘./p’就成了很多个以‘./p’开头的标签的上级标签了。这时候重复的出现就是必然的了。
在取标签的时候，这似乎是不可调和的矛盾，那就只好在取出标签之后进行一次去重了。
所以我还得写一个去重的函数

3、对于上面这个问题，还有一个解决方法，即在取标签的时候，对于所有以‘./p/’开头的标签全部不留，只留下‘./p’，后面取标签的时候将

的优先级设为最低

再看一下效果。

succeedhttps://lion-wu.blog.csdn.net/article/details/113402976
<p/>

-----
<p/> 

-----
<h1><a id="_2"/>一级标题</h1> 

-----
<h2><a id="_3"/>二级标题</h2> 

-----
<h3><a id="_4"/>三级标题</h3> 

-----
<h4><a id="_5"/>四级标题</h4> 

-----
<h5><a id="_6"/>五级标题</h5> 

-----
<h6><a id="_7"/>六级标题</h6> 

-----
<p>这是一篇测试文档，现在不知道干嘛用很正常，我在写一个爬虫的项目，等我爬虫自学系列最后一篇出来就知道啦，到时候如果你们想复现的话，直接来我这里拿就好。</p> 

-----
<p><span class="katex--display"><span class="katex-display"><span class="katex"><span class="katex-mathml">
     
      
       
        
         a
        
        
         =
        
        
         b
        
        
         +
        
        
         c
        
       
       
         a = b + c 
       
      
     </span><span class="katex-html"><span class="base"><span class="strut" style="height: 0.43056em; vertical-align: 0em;"/><span class="mord mathdefault">a</span><span class="mspace" style="margin-right: 0.277778em;"/><span class="mrel">=</span><span class="mspace" style="margin-right: 0.277778em;"/></span><span class="base"><span class="strut" style="height: 0.77777em; vertical-align: -0.08333em;"/><span class="mord mathdefault">b</span><span class="mspace" style="margin-right: 0.222222em;"/><span class="mbin">+</span><span class="mspace" style="margin-right: 0.222222em;"/></span><span class="base"><span class="strut" style="height: 0.43056em; vertical-align: 0em;"/><span class="mord mathdefault">c</span></span></span></span></span></span></p> 

-----
<p><mark>这是突出字体</mark></p> 

-----
<p><strong>这是加粗字体</strong></p> 

-----
<p><em>这是斜体</em></p> 

-----
<li>这是无序</li>
-----
<li>这还是无序</li>
-----
<hr/> 

-----
<li>这是有序</li>
-----
<li>这还是有序</li>
-----
<hr/> 

-----
<li class="task-list-item"><input type="checkbox" class="task-list-item-checkbox" disabled="disabled"/> 这是待办</li>
-----
<li class="task-list-item"><input type="checkbox" class="task-list-item-checkbox" disabled="disabled"/> 这依旧是待办</li>
-----
<li>这是有序</li>
-----
<li>这还是有序</li>
-----
<hr/> 

-----
<p>这里是引用<br/> 这里还是引用</p> 

-----
<code class="prism language-python">代码块在这里
</code>
-----
<hr/> 

-----
<p>这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用</p> 

-----
<code class="prism language-python">代码块在这里
</code>
-----
<p><img src="https://img-blog.csdnimg.cn/20210129182417155.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNzYyMTkx,size_16,color_FFFFFF,t_70" alt="在这里插入图片描述"/></p> 

-----
<p><a href="https://blog.csdn.net/qq_43762191?spm=1001.2101.3001.5343">超链接，顺着网线来打我啊！！！</a></p> 

-----
<hr/> 

-----
<p>别忘了下划线哦<code>这是行代码</code></p>
                
-----

新结果分析

新结果，不论是在重复方面，还是在文字解码方面，都要优于上面的结果，所以我重新做一次分析。

1、首先，如果判断出来是公式的话，切分之后去掉空的部分，取倒数第二个元素即可。
2、如果是引用的话，还是换这个标签：./blockquote来抓取比较好，因为不排除出现单行引用，那就和

区分不了了。
这样获得的结果就是：

<blockquote> 
 <p>这里是引用</p> 
</blockquote>

或者

<blockquote> 
 <p>这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用<br/> 这里是引用<br/> 这里还是引用</p> 
</blockquote>

3、在获取图片链接的时候，要注意将前后剔除干净。
4、注意行代码的提取。
5、正则时，既要提取标签，也要提取出文字，需要注意存放的问题。

其他的也没有啥了

界面Xpath

首先，标记以及正文部分都在这个标签之下：//*[@id="mainBox"]/main/div[1]
标题在这里：//*[@id="articleContentId"]
正文在这里：//*[@id="content_views"]

文中标题所在位置：
//*[@id="content_views"]//h1
//*[@id="content_views"]//h2
//*[@id="content_views"]//h3
//*[@id="content_views"]//h4
//*[@id="content_views"]//h5
//*[@id="content_views"]//h6

段落文本所在位置：//*[@id="content_views"]//p
黄色标标所在位置：//*[@id="content_views"]//p/mark
公式------所在位置：//*[@id="content_views"]//p/span/span/span/span[2]//span/span[2]
黑色加粗所在位置：//*[@id="content_views"]//p/strong
斜体字—所在位置：//*[@id="content_views"]//p/em

无序标签所在位置：//*[@id="content_views"]//ul//li/text()
有序标签所在位置：//*[@id="content_views"]//ol//li/text()
待办和无序是一样的，不管了，反正也只是用着好玩。
引用标签所在位置：//*[@id="content_views"]//blockquote/p//text()

代码块儿所在位置：//*[@id="content_views"]//pre/code/text()
行代码—所在位置：//*[@id="content_views"]//p/code
超链接—所在位置：//*[@id="content_views"]//p/a

表格表头所在位置：//*[@id="content_views"]//div/table//th
表格内容所在位置：//*[@id="content_views"]//div/table//td
下划线—所在位置：//*[@id="content_views"]//hr

图片：//*[@id="content_views"]//p/img

爬取一篇博客

经过上面缜密的分析，我准备完整的爬取一篇博客并保存到正确的文件中。
爬哪篇呢？自然是测试文档了。

正则表达式分析

经过一会儿的努力，我写出了这样的正则表达式：

res = re.findall('(<.+?>)',string = string)
#res2 = re.findall('(>.*?<)',string = string)
res2 = re.findall('(>[\s\S]*?<)',string=string)
print(res)

# 因为在提取第二个正则表达式的时候，会带上‘>’和‘<’，所以需要剔除一下
for r2 in range(len(res2)):
	res2[r2] = res2[r2].replace('>', '').replace('<', '').replace('\n', '').strip()
    # 在遍历时修改需要使用下标
    # 字符串一旦写完，就不能通过下标对其进行修改
	
for r3 in res2[:]:  # 不用res2[:]的话，遍历会跳步
    if r3 == '':
        res2.remove(r3)

result = ''.join(res2)	# 这里不应该简单整合，这个整合给公式就好了。
# 这段操作稍后会单独整理一份博客。

print(result)

正则表达式测试

首先，拿最简单的先试一下：

string = '一级标题
'

['', '', '
']
一级标题

说明这个表达式初步可用了。

再拿长一点的：

['', '
']
这是一篇测试文档，现在不知道干嘛用很正常，我在写一个爬虫的项目，等我爬虫自学系列最后一篇出来就知道啦，到时候如果你们想复现的话，直接来我这里拿就好。

应该可以看出来拿的是哪个啊。

接下来，就是我们前面看着就烦的公式部分了。
能否成功呢？

string = '''
 '''

结果：

['', ' $'$ , ' $'$ , ' $'$ , ', '', ' $'$ , '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '
']

a=b+c

看得出来，很成功啊！！！

但是，等下的算法里面不能忘记对链接的处理，他们可都在标签里面呢！！！

状态机

前面的代码好像还有一点改动，记不得了。
有了这个状态机，就可以初步的把标签啥的都打上去了。
当然，还有需要改动的地方，只是目前我觉得性价比不高，就没写。

def get_div_name(div_list):
    '''
    这是一个用于提取标签的状态机
    :param div_list: 标签列表
    :return: 最终标签名
    '''
    if div_list[0] == '
':
        return '【下划线】'
    elif div_list[0][1] == 'h':
        hn = re.search('[0-9]{1}',div_list[0]).group(0)
        return '【' + hn + '级标题】'
    elif div_list[0] == '':
        return '【枚举】'
    elif div_list[0] == '
':
        return '【待办】'
    elif div_list[0] == '':
        return '【引用】'
    elif ' in div_list[0]:
        l = re.search('(-.+?")',div_list[0])
        language = l.group(0).replace('-','').replace('"','')
        return '【'+language+'语言代码块儿】'
    elif div_list[0] == '':
        if div_list[1] == '
':
            return '【纯文本】'
        elif 'katex' in div_list[1]:
            return '【公式】'
        elif div_list[1] == '':
            return '【黄标突出】'
        elif div_list[1] == '':
            return '【加粗】'
        elif div_list[1] == '':
            return '【斜体】'
        elif div_list[1] == '':
            return '【行代码】'
        elif 'img' in div_list[1]:
            h = re.search('(".+?")',div_list[1])
            href = h.group(0).replace('"','').replace('"','')
            return '【图片】：' + href
        elif 'href' in div_list[1]:
            h = re.search('(".+?")', div_list[1])
            href = h.group(0).replace('"', '').replace('"', '')
            return '【超链接：】'+ href
        else:
        	return ''
    else:
        return ''

def outdata(url):
    try:
        print('succeed'+url)
        res = requests.get(url,headers=header)
        code = res.apparent_encoding  # 获取url对应的编码格式
        res.encoding = code

        wbdata = res.text
        tree = etree.HTML(wbdata)
        el_list = tree.xpath('//*[@id="content_views"]')

        for el in el_list:

            es = el.xpath('./h1 | ./h2 | ./h3 | ./h4 | ./h5 | ./h6 | ./p |./ul//li | ./ol//li | ./ul//li | ./blockquote | ./pre/code '
                '| ./div/table/thead/tr//th | ./div/table/tbody/tr//td | ./hr')

            for e in es:
                string = etree.tostring(e,encoding=code).decode(code)
                res = re.findall('(<.+?>)', string=string)
                res2 = re.findall('(>[\s\S]*?<)', string=string)
                div_name = get_div_name(res)
                for r2 in range(len(res2)):
                    res2[r2] = res2[r2].replace('>', '').replace('<', '').replace('\n', '').strip()

                for r3 in res2[:]:  # 不用res2[:]的话，遍历会跳步
                    if r3 == '':
                        res2.remove(r3)

                if div_name != '':
                    res2.insert(0,div_name)

                print('\n'.join(res2))
                print('-----')

    except:
        print('failed'+url)

 
  保存到文件 
  接近尾声了啊。
 又做了点微调，然后将数据保存到了文件里面。 
  def save_to_file(file_name,contant):
    '''
    这个函数用于将数据写入到文件中
    :param file_name:文件名
    :param contant: 文件内容
    :return: none
    '''
    file_path = r'D:\CSDN博客'
    if not os.path.exists(file_path):   # 如果目标文件夹不存在
        os.mkdir(file_path)
    w_file_path = file_path+'\\'+'file_name'+'.txt'
    f = open(w_file_path,'w')
    for c in contant:
        f.write(c)
    f.close()
 
  获取全部博客 
  其实吧，也就是扔进线程池里去处理。
 所以就在下面加两行线程池的启动即可： 
  url_list = pd.read_csv('My_CSDN.csv')['url']

Thread_Pool(outdata,datalist=url_list,Thread_num = 10)
 
   
  简陋了点，但是1.0版本是出来了，接下来就是优化的事情了。 
  本文代码还算详尽，要拿完整代码，扫旁边二维码，后台回复：“博客”，获取当前最新版本。
 2021.2.1好前会放上第一个版本。

 
  至于私密博客，回头优化的时候会带上。 
   
  有感情是一回事儿，被欺骗是另一回事儿。被伤过的心还怎么再爱呢？

基于STM32L4XX、HAL库的FM24CL16B铁电存储器驱动程序设计 July工作室 STM32 外设驱动程序设计 stm32 嵌入式硬件单片机
一、简介：FM24CL16B是一款由Cypress（现为Infineon）生产的16Kbit（2Kx8）串行FRAM（铁电随机存取存储器）芯片。FRAM结合了RAM和ROM的优点，具有非易失性、高速读写、低功耗等特点。FM24CL16B通过I2C接口与微控制器通信，支持标准模式（100kHz）和快速模式（400kHz）。二、硬件接口：FM24CL16B的硬件接口非常简单，主要引脚如下：VDD:电源
Vue-前端发展史 lengzher_5601 Vue vue.js html css js jsp
文章目录Vue-前端发展史二、前端发展史1、UI框架2、JavaScript构建工具3、三端同一4、后端技术5、主流前端框架混合开发微信小程序Vue-前端发展史二、前端发展史1、UI框架Ant-Design：阿里巴巴出品，基于React的UI框架ElementUI、iview、ice：饿了么出品，基于Vue的UI框架BootStrap：Teitter推出的一个用于前端开发的开源工具包AmazeUI
JAVA面试_进阶部分_MySQL索引失效的几种情况茂茂在长安 JAVA mysql java 面试 mysql
1.索引不存储null值更准确的说，单列索引不存储null值，复合索引不存储全为null的值。索引不能存储Null，所以对这列采用isnull条件时，因为索引上根本没Null值，不能利用到索引，只能全表扫描。为什么索引列不能存Null值？将索引列值进行建树，其中必然涉及到诸多的比较操作。Null值的特殊性就在于参与的运算大多取值为null。这样的话，null值实际上是不能参与进建索引的过程。也就是
HTML5 Canvas制作雪花飘落动画坚持坚持那些年
本文还有配套的精品资源，点击获取简介：HTML5引入了Canvas元素，它赋予网页设计师丰富的绘图能力，允许通过JavaScript实现复杂的动画效果。本文将介绍如何结合HTML5的Canvas元素和JavaScript创建一个全屏的雪花飘落背景动画。通过定义雪花对象、创建雪花数组、编写主循环并利用requestAnimationFrame来绘制和更新雪花位置，我们能够实现一个逼真的雪花飘落动画效
Poe AI推出Previews预览功能！对标Claude Artifacts！ AI信息Gap 人工智能 ai gpt OpenAI chatgpt
Anthropic在发布最新模型Claude3.5Sonnet时，同时官宣了一个针对ClaudeAI重要的更新，那就是Artifacts。新功能Artifacts允许Claude用户在与聊天机器人的对话之外，通过一个专门的窗口分享、编辑和构建重要的独立内容。这些内容通常是超过15行的文本、代码片段、HTML网页、SVG图像、图表和交互式React组件等。用户可以在专用窗口中查看、复制和编辑这些内容
用 Claude3.5 从零写扫雷游戏-实现蜂窝地图 selfboot0 AI编程 ai chatgpt
上一篇用Claude3.5从零写扫雷游戏-基本功能篇中，在Claude3.5的帮助下，我这前端小白也基本完成了一个完整的扫雷游戏。不过只是传统的方格扫雷，如果换成蜂窝扫雷游戏，Claude3.5能实现吗？先来看成果吧，可以在在线扫雷游戏中体验：Claude3.5蜂窝扫雷实现考虑到前面已经实现了基本的方格扫雷，并且我们很机智的把逻辑，渲染，UI组件都分开了。那么实现蜂窝状的扫雷，也可以按照这个思路来
java websocket 认证_配置JAVA SSL/TLS 之websocket wss交互式认证 weixin_39695490 java websocket 认证
我下面生成的.keystore文件也可以用.jks后缀代替，jks的意思就是javakeystore，另外需要知道.cer文件是二进制的，.pem文件是文本文件，本质都是一样的，他们可以互相转换。java语言操作的是二进制的文件，其他的一些脚本语言，可能操作的是PEM格式的文件。看具体情况吧。创建服务端keystorekeytool-genkey-v-aliasserver_ks-keysize2
服务器ws证书,C＃使用带有ssl和服务器证书的ws-security webservice无法为具有权限的SSL / TLS Build 安全通道... 王振升服务器ws证书
我必须使用带有SSL证书和服务器证书的javawebservice.我获得了TLS证书和WSS证书我的app.config：binding="customBinding"bindingConfiguration="customB"behaviorConfiguration="myBehavior"contract="ServiceReference1.MyClient"name="Name">me
Spring Boot 条件注解：@ConditionalOnProperty 完全解析 web18285997089 面试学习路线阿里巴巴 spring boot java 后端
在SpringBoot项目中，有时候我们希望根据配置文件中的某个属性值来决定是否启用某个功能或加载某个组件。此时，@ConditionalOnProperty注解就可以发挥作用。它通过配置文件的属性值控制Bean或配置类的加载，使得我们的程序更具灵活性。本文将详细介绍@ConditionalOnProperty的用法，并通过功能开关和环境配置两个实际场景来展示它的强大之处。1.@Condition
Python机器学习实战：使用Flask构建机器学习API AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：使用Flask构建机器学习API作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域，模型训练和部署一直是重要的挑战。传统的机器学习项目往往采用独立的脚本或复杂的流程，难以实现模型的自动化、可视化和复现。为了解决这一问题，将机器学习模型封装成可访问的API变得越来越流行。Fla
Git远程推送常见错误及解决方案： sgsgy5 Git常见错误解决方案 Git常见错误 git常见错误解决方案
Git远程推送1、问题：git远程提交时出现错误：error:RPCfailed;curl56OpenSSLSSL_read:SSL_ERROR_SYSCALL,errfno10054原因分析：可能是文件过大导致。解决方法：在要推送的文件夹下右键打开gitbashhere输入命令：#首先设置通信缓存大小gitconfighttp.postBuffer524288000#然后把缓存清除gitfilt
django中路由配置规则的详细说明小赖同学啊 python django sqlite 数据库
在Django中，路由配置是将URL映射到视图函数或类视图的关键步骤，它决定了用户请求的URL会触发哪个视图进行处理。以下将详细介绍Django中路由配置的规则、高级使用方法以及多个应用配置的规则。基本路由配置规则1.项目级路由配置在Django项目中，根路由配置文件通常是urls.py，位于项目目录下。以下是一个简单的示例：#项目目录下的urls.pyfromdjango.contribimpo
ROS实践（三）xacro文件基础（urdf扩展）简约少年 ROS 机器人 xacro
目录一、定义二、xacro文件常见组成部分1.命名空间声明2.定义宏3.调用宏4.定义参数5.条件语句6.转换xacro文件为urdf7.gazebo标签三、代码示例1.gazebo标签使用（仿真参数配置）2.引用仿真配置并定义机器人模型（结构）四、加载仿真模型（含传感器的机器人）1.编写launch文件。2.实际效果。一、定义通俗来说，xacro就是urdf文件的一种“进阶版”，它是用来简化和优
Html5学习教程，从入门到精通， HTML5超链接应用的详细语法知识点和案例代码（18）知识分享小能手网页开发前端开发编程语言如门 html5 学习前端 html java 后端 css3
HTML5超链接应用的详细语法知识点和案例代码超链接（Hyperlink），也称为跃点链接，是互联网和文档编辑中的一种重要概念。超链接的定义超链接是指从一个网页指向一个目标的连接关系，这个目标可以是另一个网页，也可以是相同网页上的不同位置，还可以是一个图片、动画、程序、电子邮件地址、文件，甚至是一个音视频文件。如果点击了这个链接，当前页面的位置就会跳转到被链接的目标位置。在文档编辑中，超链接可以链
Uniapp使用地图的时候滑动上层的view地图也滑动堕落年代 uniapp uni-app
问题根源分析原生组件层级：uniapp中的原生地图组件（如）默认处于最高层级，普通视图元素无法覆盖事件冒泡机制：触摸事件会穿透到下层组件滚动冲突：当内容滚动到底部/顶部时继续滑动会触发父容器滚动完整解决方案步骤1：结构优化到这里去步骤2：样式控制/*地图容器*/.map-container{position:fixed;width:100%;height:100vh;z-index:1;/*确保低
Java快排算法详解大梦谁先觉i 数据结构与算法算法 java 排序算法
快排算法底层基本思想：先取出数列中的第一个数作为基准数。将数列中比基准数大的数全部放在他的右边，比基准数小的数全部放在它的左边。然后在对左右两部分重复第二步，直到各个区间只有一个数。具体Java代码实现publicclassQuickSort{publicstaticvoidsort(int[]array,intlow,inthigh){if(low=benchmark){high--;}//比基
一张表多少记录，会成为大表？如何计算 18你磊哥 mysql 数据库 mysql
首先，“大表”的定义并不是绝对的。不同的数据库系统、不同的硬件配置、不同的查询模式，对“大”的定义可能都不一样。比如，对于MySQL来说，百万级别的记录可能已经算大表，而对于一些分布式数据库，可能处理十亿级别的数据才算挑战。接下来，用户可能想知道如何判断自己的表是否过大，以及如何计算这个阈值。这时候，我需要考虑几个方面：数据量、性能指标、存储引擎的特性、索引情况、查询复杂度等。数据量方面，表的记录
jvm的gc过程 18你磊哥 jvm
先回忆一下JVM的内存结构和GC的基本原理。JVM的内存主要分为堆、栈、方法区等，而GC主要发生在堆内存里。堆又分为新生代和老年代，新生代包括Eden区、Survivor区（From和To），老年代则是长期存活的对象所在。首先，用户可能想了解GC是如何工作的，不同的垃圾收集器有什么不同，比如Serial、Parallel、CMS、G1、ZGC等。但可能他们需要的是基础流程，比如标记-清除、复制、标
Django 初始化导入数据详解 jay丿 django sqlite 数据库
Django初始化导入数据详解在Django项目中，初始化数据导入是一个常见的需求，特别是在开发阶段或者部署新环境时，通常需要一些预置的数据来确保应用能够正常运行。Django提供了一种高效的方法来加载初始化数据，即通过fixtures机制。本文将详细介绍如何使用Django的fixtures功能来导入初始化数据。1.Fixtures机制概述Django默认会在应用的目录下查找名为fixtures
Django框架的全面指南：从入门到高级步入烟尘 Python超入门指南全册 django sqlite 数据库
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
Spring Boot 集成 Kettle m0_74824112 面试学习路线阿里巴巴 spring boot 后端 java
Kettle简介Kettle最初由MattCasters开发，是Pentaho数据集成平台的一部分。它提供了一个用户友好的界面和丰富的功能集，使用户能够轻松地设计、执行和监控ETL任务。Kettle通过其强大的功能和灵活性，帮助企业高效地处理大规模数据集成任务。主要组成部分Spoon：用途：Spoon是Kettle的图形化设计工具。用户可以使用Spoon设计和调试ETL转换和作业。功能：拖放式界面
PCB 制版的注意事项菜只因C stm32
一、设计阶段（一）布局规划元件间距：元件间距的设置在PCB设计中至关重要，它直接影响到电路板的可制造性、可维护性以及散热性能。对于手工焊接，元件引脚间距离不小于1mm是较为安全的标准，这能让操作人员有足够空间准确地将焊料施加到引脚连接处，避免因空间狭窄导致的焊接短路或虚焊问题。例如在一个采用直插式元件较多的电源模块中，电解电容、功率电阻等元件引脚间距如果小于1mm，焊接时电烙铁头很容易同时接触到相
Web前端发展史王珍岩笔记
1、静态页面阶段那是1990年的12月25日，恰是西方的圣诞节，TimBerners-Lee在他的NeXT电脑上部署了第一套“主机-网站-浏览器”构成的Web系统，这标志BS架构的网站应用软件的开端，也是前端工程的开端。1993年4月Mosaic浏览器作为第一款正式的浏览器发布。1994年11月，鼎鼎大名的Navigator浏览器发布发布了，到年底W3C在Berners-Lee的主持下成立，标志着
大模型全军覆没，中科院自动化所推出多图数学推理新基准 | CVPR 2025 量子位
关注前沿科技量子位挑战多图数学推理新基准，大模型直接全军覆没？！事情是这样的。近日，中国科学院自动化研究所推出多图数学推理全新基准MV-MATH（该工作已被CVPR2025录用），这是一个精心策划的多图数学推理数据集，旨在全面评估MLLM（多模态大语言模型）在多视觉场景中的数学推理能力。结果评估下来发现，GPT-4o仅得分32.1，类o1模型QvQ得分29.3，所有模型均不及格。具体咋回事，下面接
EMQ 启用 SSL/TLS 加密连接奋斗者潘 MQTT EMQ 启用 SSL/TLS 加密连接使用 WebSocket 客户端连接 MQTT 服务器
EMQ启用SSL/TLS加密连接使用加密连接的时候选择wss协议，并使用域名连接：绑定域名-证书之后，必须使用域名而非IP地址进行连接，这样浏览器才会根据域名去校验证书以在通过校验后建立连接。在EMQ上配置打开etc/emqx.conf配置文件，修改以下配置#wss监听地址listener.wss.external=8084#修改密钥文件地址listener.wss.external.keyfil
书籍-《车辆动力学的控制应用》自动驾驶人工智能无人驾驶汽车
书籍：ControlApplicationsofVehicleDynamics作者：JingshengYu，VladimirVantsevich出版：CRCPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《车辆动力学的控制应用》01书籍介绍本书介绍了汽车动力学和控制理论的基本知识，并结合NILabVIEW软件产品的应用，为设计先进的车辆动力学及车辆系统控制器提供了实用且高度技术性的指
项目风险分析报告怎么写项目风险评估
厘清项目背景、识别关键风险源、评估发生概率与影响、制定对应应对方案，是写好项目风险分析报告的四大核心步骤。看似简单的条目，却在实际操作中蕴含着深厚的方法论与经验积累。我个人特别强调“识别关键风险源”，因为若定位不准、范围过宽或过窄，都可能导致资源浪费或风险漏判。掌握准确的风险范围能帮助我们在后续的评估和应对阶段精准发力，避免将过多精力投入到不具备实际威胁的环节中。“识别关键风险源”的实质是通过系统
项目管理软件分类有哪些项目管理
按功能分类、按部署方式分类、按行业特点分类、按项目管理思想分类，是当下主流的项目管理软件分类方式。其中，按功能分类可细分为进度管理、任务协作、风险控制、成本管控等多种类型，能够针对项目所需功能进行精确选型。项目管理软件选择需匹配企业现状和管理需求，如同“好马配好鞍”，才能事半功倍、提高效率与质量。在众多分类中，我个人尤其推荐按功能分类，因为它能让不同部门或不同阶段的工作需要一目了然，也更容易帮助管
探索创新：CanvasParticles - 点燃你的网页动态效果柏赢安Simona
探索创新：CanvasParticles-点燃你的网页动态效果去发现同类优质开源项目:https://gitcode.com/是一个开源的JavaScript库，专注于在HTML5Canvas上创建引人入胜的粒子动画效果。如果你是Web开发者，正在寻找一种方法为你的网站增添独特的视觉吸引力，那么这个项目绝对值得你深入了解。项目简介CanvasParticles提供了一套简洁而强大的API，让你能够
探索Coco-Web：一款强大的H5创作工具岑晔含Dora
探索Coco-Web：一款强大的H5创作工具去发现同类优质开源项目:https://gitcode.com/是一个开源的、基于Web的H5（HTML5）创作平台，旨在让开发者和设计师能够轻松地创建互动式的内容和应用。通过其直观的界面和丰富的功能，无论你是编程高手还是初学者，都能够利用Coco-Web制作出富有吸引力的数字内容。技术分析Coco-Web基于现代Web技术构建，包括：React.js:
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul