kesalin

用Python编写博客导出工具

用Python编写博客导出工具

罗朝辉 (http://kesalin.github.io/)

CC 许可，转载请注明出处

写在前面的话

我在 github 上用 octopress 搭建了个人博客，octopress 使用Markdown语法编写博文。之前我在CSDN博客上也写过不少的技术博文，都说自己的孩子再丑也是个宝，所以就起了把CSDN博客里面的文章导出到个人博客上的念头。刚开始想找个工具把CSDN博客导出为xml或文本，然后再把xml或文本转换为Markdown博文。可惜搜了一下现有博客导出工具，大部分要收费才能将全部博文导出为xml格式，所以就只好发明轮子了：写个工具将全部博文导出为Markdown博文（也是txt格式的）。

我将详细介绍这个工具的编写过程，希望没有学习过编程的人也能够学会一些简单的Python语法来修改这个脚本工具，以满足他们将其他类型的博客导出为文本格式。这也是我第一次学习和使用Python，所以相信我，你一定也可以将自己的博客导出为想要的文本格式。

本文源代码在这里：ExportCSDNBlog.py

考虑到大部分非程序员使用Windows系统，下面将介绍在Windows下如何编写这个工具。

下载工具

在 Windows 下安装Python开发环境（Linux/Mac下用pip安装相应包即可，程序员自己解决咯）：

Python 2.7.3
请安装这个版本，更高版本的Python与一些库不兼容。
下载页面
下载完毕双击可执行文件进行安装，默认安装在C:\Python2.7。

six
下载页面下载完毕，解压到Python安装目录下，如C:\Python2.7\six-1.8.0目录下。

BeautifulSoup 4.3.2
下载页面，下载完毕，解压到Python安装目录下，如C:\Python2.7\BeautifulSoup目录下。

html5lib
下载页面下载完毕，解压到Python安装目录下，如C:\Python2.7\html5lib-0.999目录下。

安装工具

Windows下启动命令行，依次进入如下目录，执行setup.py install进行安装：

C:\Python2.7\six-1.8.0>setup.py install  
C:\Python2.7\html5lib-0.999>setup.py install  
C:\Python2.7\BeautifulSoup>setup.py install

参考文档

Python 2.X文档
BeautifulSoup文档
正则表达式文档
正则表达式在线测试

用到的Python语法

这个工具只用到了一些基本的Python语法，如果你没有Python基础，稍微了解一下如下博文是很有好处的。

string: 字符串操作，参考python: string的操作函数
list: 列表操作，参考Python list 操作
dictionary: 字典操作，参考Python中dict详解
datetime: 日期时间，参考python datetime处理时间

编写博客导出工具

分析

首先来分析这样一个工具的需求：

导出所有CSDN博客文章为Markdown文本。

这个总需求其实可以分两步来做：

* 获得CSDN博客文章
* 将文章转换为Markdown文本

针对第一步：如何获取博客文章呢？

打开任何一个CSDN博客，我们都可以看到下方的页面导航显示“XXX条数据共XXX页 1 2 3 … 尾页”，我们从这个地方入手考虑。每个页面上都会显示属于该页的文章标题及文章链接，如果我们依次访问这些页面链接，就能从每个页面链接中找出属于该页面的文章标题及文章链接。这样所有的文章标题以及文章链接就都获取到了，有了这些文章链接，我们就能获取对应文章的html内容，然后通过解析这些html页面来生成相应Markdown文本了。

实现

从上面的分析可以看出，首先我们需要根据首页获取所有的页面链接，然后遍历每一个页面链接来获取文章链接。

获取页面链接的代码：

 
      def getPageUrlList(url):  # 获取所有的页面的 url  request = urllib2.Request(url, None, header)  response = urllib2.urlopen(request)  data = response.read()   #print data  soup = BeautifulSoup(data)   lastArticleHref = None  pageListDocs = soup.find_all(id="papelist")  for pageList in pageListDocs:  hrefDocs = pageList.find_all("a")  if len(hrefDocs) > 0:  lastArticleHrefDoc = hrefDocs[len(hrefDocs) - 1]  lastArticleHref = lastArticleHrefDoc["href"].encode('UTF-8')   if lastArticleHref == None:  return []   #print " > last page href:" + lastArticleHref  lastPageIndex = lastArticleHref.rfind("/")  lastPageNum = int(lastArticleHref[lastPageIndex+1:])  urlInfo = "http://blog.csdn.net" + lastArticleHref[0:lastPageIndex]   pageUrlList = []  for x in xrange(1, lastPageNum + 1):  pageUrl = urlInfo + "/" + str(x)  pageUrlList.append(pageUrl)  log(" > page " + str(x) + ": " + pageUrl)   log("total pages: " + str(len(pageUrlList)) + "\n")  return pageUrlList

参数 url = “http://blog.csdn.net/” + username，即你首页的网址。通过urllib2库打开这个url发起一个web请求，从response中获取返回的html页面内容保存到data中。你可以被注释的 print data 来查看到底返回了什么内容。

有了html页面内容，接下来就用BeautifulSoup来解析它。BeautifulSoup极大地减少了我们的工作量。我会详细在这里介绍它的使用，后面再次出现类似的解析就会从略了。soup.find_all(id=“papelist”) 将会查找html页面中所有id=“papelist”的tag，然后返回包含这些tag的list。对应 CSDN 博文页面来说，只有一处地方：

 
     <div id="papelist" class="pagelist">  <span> 236条数据 共12页</span>  <strong>1</strong>  <a href="/kesalin/article/list/2">2</a>  <a href="/kesalin/article/list/3">3</a>  <a href="/kesalin/article/list/4">4</a>  <a href="/kesalin/article/list/5">5</a>  <a href="/kesalin/article/list/6">...</a>  <a href="/kesalin/article/list/2">下一页</a>  <a href="/kesalin/article/list/12">尾页</a> </div>

好，我们获得了papelist 的tag对象，通过这个tag对象我们能够找出尾页tag a对象，从这个tag a解析出对应的href属性，获得尾页的编号12，然后自己拼出所有page页面的访问url来，并保存在pageUrlList中返回。page页面的访问url形式示例如下：

> page 1: http://blog.csdn.net/kesalin/article/list/1

根据page来获取文章链接的代码：

 
      def getArticleList(url):  # 获取所有的文章的 url/title  pageUrlList = getPageUrlList(url)   articleListDocs = []   strPage = " > parsing page {0}"  pageNum = 0  global gRetryCount  for pageUrl in pageUrlList:  retryCount = 0  pageNum = pageNum + 1  pageNumStr = strPage.format(pageNum)  print pageNumStr   while retryCount <= gRetryCount:  try:  retryCount = retryCount + 1  time.sleep(1.0) #访问太快会不响应  request = urllib2.Request(pageUrl, None, header)  response = urllib2.urlopen(request)  data = response.read().decode('UTF-8')   #print data  soup = BeautifulSoup(data)   topArticleDocs = soup.find_all(id="article_toplist")  articleDocs = soup.find_all(id="article_list")  articleListDocs = articleListDocs + topArticleDocs + articleDocs  break  except Exception, e:  print "getArticleList exception:%s, url:%s, retry count:%d" % (e, pageUrl, retryCount)  pass   artices = []  topTile = "[置顶]"  for articleListDoc in articleListDocs:  linkDocs = articleListDoc.find_all("span", "link_title")  for linkDoc in linkDocs:  #print linkDoc.prettify().encode('UTF-8')  link = linkDoc.a  url = link["href"].encode('UTF-8')  title = link.get_text().encode('UTF-8')  title = title.replace(topTile, '').strip()  oneHref = "http://blog.csdn.net" + url  #log(" > title:" + title + ", url:" + oneHref)  artices.append([oneHref, title])   log("total articles: " + str(len(artices)) + "\n")  return artices

从第一步获得所有的page链接保存在pageUrlList中，接下来就根据这些page 页面来获取对应page的article链接和标题。关键代码是下面这三行：

topArticleDocs = soup.find_all(id="article_toplist")
articleDocs = soup.find_all(id="article_list")
articleListDocs = articleListDocs + topArticleDocs + articleDocs

从page的html内容中查找置顶的文章（article_toplist）以及普通的文章（article_list）的tag对象，然后将这些tag保存到articleListDocs中。

article_toplist示例：(article_list的格式是类似的)

 
     <div id="article_toplist" class="list">  <div class="list_item article_item">  <div class="article_title">  <span class="ico ico_type_Original"></span>  <h1>  <span class="link_title">  <a href="/kesalin/article/details/10474007">  <font color="red">[置顶]</font>  招聘：有兴趣做一个与Android对等的操作系统么？  </a>  </span>  </h1>  </div>  ... ...  </div>  ... ... </div>

然后遍历所有的保存到articleListDocs里的tag对象，从中解析出link_title的span tag对象保存到linkDocs中；然后从中解析出链接的url和标题，这里去掉了置顶文章标题中的“置顶”两字；最后将url和标题保存到artices列表中返回。artices列表中的每一项内容示例：

title:招聘：有兴趣做一个与Android对等的操作系统么？
url:http://blog.csdn.net/kesalin/article/details/10474007

根据文章链接获取文章html内容并解析转换为Markdown文本

 
      def download(url, output):  # 下载文章，并保存为 markdown 格式  log(" >> download: " + url)   data = None  title = ""  categories = ""  content = ""  postDate = datetime.datetime.now()   global gRetryCount  count = 0  while True:  if count >= gRetryCount:  break  count = count + 1  try:  time.sleep(2.0) #访问太快会不响应  request = urllib2.Request(url, None, header)  response = urllib2.urlopen(request)  data = response.read().decode('UTF-8')  break  except Exception,e:  exstr = traceback.format_exc()  log(" >> failed to download " + url + ", retry: " + str(count) + ", error:" + exstr)  pass   if data == None:  log(" >> failed to download " + url)  return   #print data  soup = BeautifulSoup(data)   topTile = "[置顶]"  titleDocs = soup.find_all("div", "article_title")  for titleDoc in titleDocs:  titleStr = titleDoc.a.get_text().encode('UTF-8')  title = titleStr.replace(topTile, '').strip()  #log(" >> title: " + title)   manageDocs = soup.find_all("div", "article_manage")  for managerDoc in manageDocs:  categoryDoc = managerDoc.find_all("span", "link_categories")  if len(categoryDoc) > 0:  categories = categoryDoc[0].a.get_text().encode('UTF-8').strip()   postDateDoc = managerDoc.find_all("span", "link_postdate")  if len(postDateDoc) > 0:  postDateStr = postDateDoc[0].string.encode('UTF-8').strip()  postDate = datetime.datetime.strptime(postDateStr, '%Y-%m-%d %H:%M')   contentDocs = soup.find_all(id="article_content")  for contentDoc in contentDocs:  htmlContent = contentDoc.prettify().encode('UTF-8')  content = htmlContent2String(htmlContent)   exportToMarkdown(output, postDate, categories, title, content)

同前面的分析类似，在这里通过访问具体文章页面获得html内容，从中解析出文章标题，分类，发表时间，文章内容信息。然后把这些内容传递给函数exportToMarkdown，在其中生成相应的Markdown文本文件。值得一提的是，在解析文章内容信息时，由于html文档内容有一些特殊的标签或转义符号，需要作特殊处理，这些特殊处理在函数htmlContent2String中进行。目前只导出了所有的文本内容，图片，url链接以及表格都没有处理，后续我会尽量完善这些转换。

 
      def htmlContent2String(contentStr):  patternImg = re.compile(r'(<img.+?src=")(.+?)(".+ />)')  patternHref = re.compile(r'(<a.+?href=")(.+?)(".+?>)(.+?)(</a>)')  patternRemoveHtml = re.compile(r'</?[^>]+>')   resultContent = patternImg.sub(r'![image_mark](\2)', contentStr)  resultContent = patternHref.sub(r'[\4](\2)', resultContent)  resultContent = re.sub(patternRemoveHtml, r'', resultContent)  resultContent = decodeHtmlSpecialCharacter(resultContent)  return resultContent

目前仅仅是删除所有的html标签，并在函数decodeHtmlSpecialCharacter中转换转义字符。

生成Markdown文本文件

 
      def exportToMarkdown(exportDir, postdate, categories, title, content):  titleDate = postdate.strftime('%Y-%m-%d')  contentDate = postdate.strftime('%Y-%m-%d %H:%M:%S %z')  filename = titleDate + '-' + title  filename = repalceInvalidCharInFilename(filename)  filepath = exportDir + '/' + filename + '.markdown'  log(" >> save as " + filename)   newFile = open(unicode(filepath, "utf8"), 'w')  newFile.write('---' + '\n')  newFile.write('layout: post' + '\n')  newFile.write('title: \"' + title + '\"\n')  newFile.write('date: ' + contentDate + '\n')  newFile.write('comments: true' + '\n')  newFile.write('categories: [' + categories + ']' + '\n')  newFile.write('tags: [' + categories + ']' + '\n')  newFile.write('description: \"' + title + '\"\n')  newFile.write('keywords: ' + categories + '\n')  newFile.write('---' + '\n\n')  newFile.write(content)  newFile.write('\n')  newFile.close()

生成Markdown文本文件就很简单了，在这里我需要生成github page用的Markdown博文形式，所以内容如此，你可以根据你的需要修改为其他形式的文本内容。

（头歌作业—python）3.2 个人所得税计算器(project) 摸鱼码 python 开发语言
第1关：个人所得税计算器任务描述本关任务：编写一个个人所得税计算器的小程序。相关知识个人所得税缴纳标准2018年10月1日以前，个税免征额为3500元/月，调整后，个税免征额为5000元/月，7级超额累进个人所得税税率表如下：全月应纳税所得额（含税级距）税率(%)速算扣除数不超过3,000元30超过3,000元至12,000元的部分10210超过12,000元至25,000元的部分201,410超
深入解析Python爬虫：抓取直播平台数据，包括观众数、弹幕等信息 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 java 大数据
引言随着直播行业的快速发展，直播平台成为了许多人分享与互动的地方。直播平台上不仅有精彩的内容，还有实时的观众互动、弹幕交流等重要数据。这些数据对于分析直播趋势、用户行为以及提升直播内容质量有着重要的价值。因此，如何通过Python爬虫抓取直播平台上的直播数据，尤其是观众数、弹幕内容等，成为了数据分析和机器学习中非常有趣且实用的任务。在本文中，我们将介绍如何使用Python构建一个高效的爬虫，抓取直
基于python爬虫：requests+BeautifulSoup+MySQL/MongoDB（或：CSV、JSON等格式的文件）+... Test-Sunny python 爬虫 beautifulsoup
爬虫技术（基于python介绍）-应用场景数据抓取、数据挖掘、搜索引擎优化http协议通过HTTP请求来获取网页数据-编程语言pythonpython库数据请求与解析requests、BeautifulSoup、Scrapy等requests（Python）：用于发送HTTP请求。BeautifulSoup：用于解析HTML和XML文档-数据存储数据库（如MySQL、MongoDB）：用于存储抓取
Python爬虫：开启数据抓取的奇幻之旅（一）小周不想卷 python
目录一、爬虫初印象：揭开神秘面纱二、工欲善其事：前期准备（一）Python环境搭建1.下载Python安装包：2.运行安装程序：3.配置环境变量（若自动添加失败）：（二）开发工具推荐1.PyCharm：2.JupyterNotebook：（三）必备库安装1.requests库：2.BeautifulSoup4库：3.Scrapy框架：4.Selenium库：三、爬虫原理剖析：探寻内在机制（一）发起
python切换安装源为国内源的方法 yy5560 python python 机器学习
嫌pythonr的pip安装实在太慢了，下面直接更换为国内源，速度会飞起来。具体方法为：第一步，根据当前用户创建pip.ini文件，如果没有，则新建pip.ini即可，不论python安装在哪个目录，只要新建这个即可。win系统C盘C:\Users\Administrator.PC文件夹下直接创建文件夹pip再创建pip.ini文件第二步，pip.ini文件写入保存即可，这里是阿里云[global
python更换国内镜像源三种实用方法乒乓球爱好AI python 开发语言 pip
方法1：（永久更改）在python的命令提示符中运行以下语句，该条语句将pip的下载源永久更改为某个镜像站，这里以清华大学开源镜像站为例：pipconfigsetglobal.index-urlhttps://pypi.tuna.tsinghua.edu.cn/simple/方法2：（永久更改）windows环境下，在用户目录中创建一个文件夹，该文件夹的命名为pip；在该pip文件夹中新建一个文件
Python更改为国内源 ZHOUZAIHUI Python
常见的国内源：清华：https://pypi.tuna.tsinghua.edu.cn/simple阿里云：http://mirrors.aliyun.com/pypi/simple/中国科技大学https://pypi.mirrors.ustc.edu.cn/simple/豆瓣：http://pypi.douban.com/simple/在Linux系统中，修改~/.pip/pip.conf文件
洛谷深基第1部分语言入门第2章顺序结构程序设计 dllglvzhenfeng 【入门2】分支结构计算机考研机试洛谷算法计算机考研 CSP-J 人工智能信奥
P5703【深基2.例5】苹果采购【深基2.例5】苹果采购-洛谷P5703【深基2.例5】苹果采购（python3实现）P5703【深基2.例5】苹果采购（python3实现）_青少年趣味编程-CSDN博客P5703【深基2.例5】苹果采购（python3实现）--2022.01.29P5703【深基2.例5】苹果采购（python3实现）--2022.01.29_青少年趣味编程-CSDN博客P5
LangChain入门：用Python构建大语言模型应用的完整指南 Python程序员罗宾 langchain python 语言模型自然语言处理人工智能开源架构
在两年的人工智能的浪潮中，大语言模型（如GPT）正逐渐改变我们与技术互动的方式。然而，如何将这些强大的模型应用到实际场景中，仍然是一个挑战。这就是LangChain的用武之地。LangChain是一个用Python构建的框架，旨在帮助开发者轻松集成和扩展大语言模型，构建智能应用。今天，我们将一起探索LangChain的核心功能，并学习如何使用它来构建自己的大语言模型应用。前排提示，文末有大模型AG
洛谷题单1-P5706 【深基2.例8】再分肥宅水-python-流程图重构独好紫罗兰 LuoGu-python python 开发语言算法
题目描述现在有ttt毫升肥宅快乐水，要均分给nnn名同学。每名同学需要222个杯子。现在想知道每名同学可以获得多少毫升饮料（严格精确到小数点后333位），以及一共需要多少个杯子。输入格式输入一个实数ttt和一个正整数nnn，使用空格隔开。输出格式输出两行。第一行输出一个三位小数，表示可以获得多少毫升饮料。第二行输出一个正整数，表示一共需要多少个杯子。输入输出样例输入500.03输出166.6676
洛谷题单1-P5705 【深基2.例7】数字反转-python-流程图重构独好紫罗兰 LuoGu-python python 算法开发语言
题目描述输入一个不小于100100100且小于100010001000，同时包括小数点后一位的一个浮点数，例如123.4123.4123.4，要求把这个数字翻转过来，变成4.3214.3214.321并输出。输入格式一行一个浮点数输出格式一行一个浮点数输入输出样例输入123.4输出4.321方式-字符串反转代码classSolution:@staticmethoddefoi_input():"""
python爬虫与pyecharts数据可视化不想被人懂的x python 爬虫信息可视化
一、爬虫介绍1、爬虫定义网络爬虫:又被称为网页蜘蛛，网络机器人，是一种按照一定的规则，自动地抓取网络信息的程序或者脚本，另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。通俗理解:简单来讲，爬虫就是一个探测机器，它的基本操作就是模拟人的行为去各个网站溜达，点点按钮，查查数据，或者把看到的信息背回来.就像一只虫子在一幢楼里不知疲倦地爬来爬去.百度:其实就是利用了这种爬虫技术,每天放出无数爬
Python实现MySQL数据库对象的血缘分析 weixin_30777913 数据库 python mysql 开发语言
Python控制台的程序，实现遍历MySQL中所有的SQL对象（表、视图、用户定义函数、存储过程和触发器等），并取得它们之间之前的依赖性关系，并列出三张表，第一张表的第一列是所有的SQL对象名称，第二列是它的数据的生成路径，路径中的相邻SQL对象之间用“->”隔开，如果有多条路径，就存储多条记录，第二张表是根据依赖性生成所有表的列表，依懒性从上到下依次递增，第三张表是根据依赖性生成所有第二张表中表
[推荐了解]各类游戏引擎入门选择说明 CodeCaptain Cocos Creator 经验分享游戏
开发一款属于自己的游戏其实是很多人的梦想，但市面上如此多的引擎如何选择却是很多人入门前的难题。因此，简单做了关于Godot、CocosCreator、Unity以及其他几类游戏引擎的学习曲线、未来发展趋势等信息的总结，以供参考。1.Godot•学习曲线：•初学者友好：Godot的学习曲线较为平缓，适合初学者和中级开发者。它使用GDScript作为主要的脚本语言，与Python语法相似，易于上手。•
Match-Case，Python中if-elif-else的最大竞争对手橙色小博 python的学习之旅 python 数据库开发语言
目录1.前言2.if-elif-else？switch-case？match-case！3.MatchCase基础语法4.MatchCase模式匹配的高级特性4.1字面量模式：精确匹配特定值4.2变量模式：捕获值并赋值给变量4.3序列模式：匹配序列中的元素4.4映射模式：匹配字典中的键值对4.5类模式：匹配对象的属性5.MatchCase的实际应用5.1简化命令（两个例子）1）处理用户输入2）处理
开发环境详解：那么多教搭建环境的文章视频，你有没有想过编程为什么要搭建环境？搭建环境一套操作下来究竟干了什么？北子ALF Python pytorch tensorflow python c语言 c++青少年编程开发语言
1.初识"环境"概念1.狭义理解：一个环境就是一个解释器或编译器搭建环境这件事，可能大部分人开始学python时才会注意到，而之前学C或C++的时候不太理会这回事，这是由于python语言的新颖性和特殊性，使得“环境”似乎更被强调了，具体我们后面细说。大部分学校计算机专业会从C开始，为的就是能对编程概念如编译、解释、调试、IDE这些基本概念以及程序从人写代码到机器执行的过程有个大体的认识，便于后面
linux里安装pip和conda Monee.. 做项目全流程的完整踩坑史 linux pip conda
安装pip1.更新包管理器：打开终端并输入以下命令来更新包管理器：sudoaptupdate2.安装pip：对于Python3，使用以下命令安装pip：sudoaptinstallpython3-pip安装完成后，你可以通过以下命令验证安装：pip3--version安装CondaConda通常通过Anaconda或Miniconda来安装。Miniconda是一个较小的安装包，适合只需要Cond
Python3特殊变量及用法详解晚枫~ python 开发语言
Python中有许多特殊变量和方法，它们通常以双下划线开头和结尾。这些特殊变量和方法在Python中有特定的用途，通常用于实现类的某些行为，支持运算符重载，以及提供有关对象的元信息。以下是一些常见的特殊变量和方法：特殊变量__name__:指示模块的名称。当模块被直接运行时，__name__的值为"__main__"。如果模块被导入，则__name__的值为模块的名称。_name_的用法：1、当模
Python中try except else finally语句用于捕捉和处理异常（错误）上趣工作室 python python 开发语言
在Python中，try语句用于捕捉和处理异常（错误）。try块中放置可能会引发异常的代码，同时可以用except块捕获并处理这些异常。下面是一些常见的try语句的写法和示例。基本结构try:#可能引发异常的代码result=10/0#这将引发一个ZeroDivisionErrorexceptZeroDivisionError:#处理特定的异常类型print("错误:不能除以零")exceptEx
关于Python和Matlab之间通信相关问题做完课题就打工 matlab python 开发语言
在进行通信之前需要进行相关准备工作：查询自己电脑的ip地址，调出电脑的终端输入ipconfig，IPV4地址就是自己电脑的ip端口号用默认的就行，保持服务器端和客户端一致即可本次通信只用于一台电脑上的python和matlab，两台电脑之间通信可以用一根网线,改变电脑ip地址的方法,将两台电脑ping通(终端输入ping+ip查询是否可以进行数据连接)，然后就可以通信（后续实验以后在分享）进行通信
202209青少年软件编程（Python）等级考试试卷（一级） MarcoPage Python考级真题解析 python 数据库开发语言
第1题【单选题】表达式len(“学史明理增信，读史终生受益”)>len("readinghistorywillbenefityou")的结果是？（）A:0B:TrueC:FalseD:1正确答案:C试题解析:第2题【单选题】在turtle画图中，常常使用turtle.color(color1,color2)指令进行画笔颜色和填充颜色的设置，下列关于该指令使用正确的是？（）A:turtle.colo
[MRCTF2020]pyFlag(详解附送多个python脚本) 迟来的幸运 python 开发语言
Hex：FFD95B5365637265742046696C65205061727420313A5DASCII：ÿÙ[SecretFilePart1:]发现Setsuna.jpg尾部有多余的一部分有左侧窗口pk头，前有一段ÿÙ[SecretFilePart1:]，提示是第一部分Hex：FFD95B5365637265742046696C65205061727420323A5DASCII：ÿÙ[Se
Linux Shell脚本自动化编程实战【1.3 bash中调用python expect】 wallacegen bash linux 自动化
在bash中调用python#!/usr/bin/bashping-c1114.114.114.114>/dev/null&&echo"success"/usr/bin/python<<-EOFprint("helloworld")EOFecho"hellobash"1.将python代码交给python解释器来执行2.EOF只是一个标记，换成<
python下载m3u8格式视频 fengchengwu2012 devops python 开发语言 m3u8
一、安装m3u8库pipinstallrequestspipinstallrequestsm3u8二、编码实现importosimportreimportrequestsimportsubprocess#下载ts文件defdown_ts_file(base_url,m3u8_url,download_dir):#从m3u8文件中获取所有ts的分片名称信息response=requests.get(
python制作简单小游戏代码 gpt886 pygame python 开发语言人工智能
这篇文章主要介绍了python制作简单小游戏代码，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。本篇文章给大家谈谈如何用python编写一个简单的小游戏，以及如何用Python做小游戏让别人玩，希望对各位有所帮助，不要忘了收藏本站喔。1、小恐龙玩法：上下控制起跳躲避importcfgimportsysimportrandomimportp
python安装方法郭仙玲笔记
python安装方法1.搜索“Python”进入官网，然后选中“Download”。2.进入“Download”页面，可以看到“DownloadPythonx.x.x”，单击就可以下载这个版本的Python安装包。3.双击我们下载的安装包。首先一定要勾选如图红色的地方，方便添加path路径。4.如图所示红色方框，是Python默认安装的选项。5.如果想要自定义安装，可以选择下面的选项。6.接着勾选
Redis in Python-----redis module sys_song Python redis
Redis学习Redis是一种Key-value数据库，支持多种语言，当然，包括Python，python中包含redismodule。1）首先，我们安装redis，下载redis源代码：http://pypi.python.org/pypi?%3Aaction=search&term=redis&submit=search源码下载完成后，执行pythonsetup.pyinstall命令，完成安
怎么知道Python包的依赖项 svygh123 python 编程 python 开发语言
要查看Python包的依赖项，有几种方法可以做到这一点：使用pip:pip是Python的包管理器，它允许你安装和管理Python库。要查看一个包的依赖关系，你可以使用pipshow命令加上包名，但请注意，直接用pipshow并不直接列出依赖项，它提供包的详细信息，包括它的安装路径。为了查看依赖项，可以尝试在安装时使用--dry-run选项，但这并不总是直接或方便。更推荐的做法是使用下面的方法。查
python包的安装气象泡泡 python 人工智能开发语言
使用conda安装包condainstall-cconda-forgepyhdfconda会自动解决包的依赖问题，且conda-forge渠道提供了最新和最广泛的软件包支持。-c是--channel的简写形式。conda-forge:这是一个社区驱动的Conda包管理频道，提供了许多科学计算和数据分析相关的软件包。conda-forge是一个很受欢迎的频道，通常比默认的defaults频道包含更多
orbbec 奥比中光相机单目及多目调用方式python代码一休哥※ 计算机视觉数码相机 python 开发语言
这篇文章会介绍使用orbbec相机的一些常用代码梯子orbbec奥比中光Astra相机单目及多目调用方式编译sdk调用单相机调用多相机orbbec奥比中光Astra相机单目及多目调用方式 Orbbec相机是一个专注于深度感知和计算机视觉应用的设备，通常用于3D扫描、手势识别、增强现实（AR）以及其他需要深度信息的场景。Orbbec相机的SDK（软件开发工具包）提供了丰富的API，支持多种编程语言
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

用Python编写博客导出工具