利用python同步github上的题解

前言

博客里有一篇Leetcode题解,想着要同步更新,没有思考过程,至少想把代码贴出来;结果自己很懒,并没有随声更新;但是自己一定会上传题解到github上,所以就写了一段代码将github上leetcode题解的链接爬取下来。

同步题解

这个代码不难,无非就是有正则表达式,所以不多废话,爬取部分的代码如下:

def crawl():
    r=requests.get("https://github.com/YunLambert/C-plus-Algorithm_Learning/tree/master/Leetcode题解/Leetcode_Solutions/Leetcode_Solutions",headers=headers)
    title_pattern=re.compile('/YunLambert/C-plus-Algorithm_Learning/blob/master/Leetcode%E9%A2%98%E8%A7%A3/Leetcode_Solutions/Leetcode_Solutions/([A-Za-z0-9_]*).cpp')
    titles=re.findall(title_pattern,r.text)
    #print(titles)
    link_pattern=re.compile('.*.href="(.*.cpp)"')
    links=re.findall(link_pattern,r.text)
    #print(links)
    return titles,links

def rename(problem_title,problem_url):
     for (title,url) in zip(problem_title,problem_url):
         s='['+title+']'+'('+base_url+url+')'
         save(s)

最后是强行手动转成markdown格式s='['+title+']'+'('+base_url+url+')',然后可以导出txt文件,也可以直接写进自己的博客里,都是ok的。
最后出现的结果是这样的:

2018-11-08_14-40-15.png

这样只要自己的github上有题解在更新,自己就能通过这段代码将题目和链接爬取下来,写进自己的博客里,算是辅助脚本吧,继续刷题了........

你可能感兴趣的:(利用python同步github上的题解)