我的个人数据存储与自动备份策略

image

我以前喜欢直接在公共平台上写东西,也就是打开网站或应用的编辑器直接敲键盘。无论那是只言片语的微博,一段心得感想又或者一篇文章。现在,我已经改掉了这个习惯。

我会先在本地编辑器生产所有数据,然后再拷贝到合适的公共平台发布;本地数据文件我采用 git 生成版本记录,并自动往 github 推送,进行云备份。

我的这些本地数据表现为一个个文件夹和文件。通常是 markdown 文件,少量的 ipynb 或 python 源码文件,以及一些文档文件、图片等。

我通常采用 Obsidian、Vscode 或是 Jupyter Lab 打开这些文件 …… 这些工具可统称为编辑器。前两个适合文本,后两个适合文本和源代码。

这些本地数据需要备份,以防本地设备异常损毁导致数据丢失。由于手动备份到另外一份物理介质上(比如说移动硬盘)非常费神,目前我只是把它们提交到 github 私有仓库上存档。

往 github 私有仓库存档,有 3 种操作方式,这三者的生产效率也越来越高。

最初,我会在 vscode 上访问这些私有仓库的本地文件夹,手动敲出几行命令并执行它。我总是需要等待命令执行完毕,才能切换并处置下一个私有仓库。

后来,我写了一段简单代码来自动执行。它采用 Python 写成:自动生成 git 命令,写入一个批处理的临时文件,然后执行该批处理文件,最后把临时文件删除。

这段 Python 代码长这样:


"""自动提交私有仓库到 github 上备份"""
import os

# 我的私有仓库
repos = [
    "D:\\MY-OBSIDIAN-DATA\\my_Timedata",
    "D:\\MY-OBSIDIAN-DATA\\my_Schedule",
    "D:\\MY-OBSIDIAN-DATA\\my_Writing",
]

# 我对私有仓库的 git 操作
cmds = {
    "status": "git status\n",
    "push": 'git add .\ngit commit -m "update"\ngit push origin master\n',
}

# 生成批量命令并执行
def auto_git(command):
    lines = []
    tempfile = r"D:\MY-OBSIDIAN-DATA\temp.bat"
    for repo in repos:
        lines.append(f"cd {repo}\n")
        lines.append(cmds[command])

    with open(tempfile, "w") as f:
        f.writelines(lines)
    os.system(tempfile)
    os.remove(tempfile)

asku = input("0 byebye.\n1 status\n2 push")
if asku == "0":
    print("byebye.")
elif asku == "1":
    command = "status"
else:
    command = "push"
    
auto_git(command)

它省掉了“打开编辑器、切换到不同仓库、手动敲下命令行、等待执行结束”的重复操作。这些重复操作毫无技术含量,用代码来自动执行正是我自学 Python 的一大成就感所在。

但它依然是一份手动触发的代码,我需要记住:不定期(比如尽量每天)多次执行该代码。想要进一步降低大脑负担,让它每天自动执行,那就可以用到 windows 的任务计划程序。具体如何设置呢?搜索“windows 任务计划程序”,网上有很多详尽的图文攻略。

最初的 Python 代码有 input() 来做人机交互,可以查看仓库状态和提交,还可以扩展更多操作。但如果转为定时任务,则直接执行提交即可。代码稍做调整后变成了:


"""自动提交私有仓库到 github 上备份"""
import os

# 我的私有仓库
repos = [
    "D:\\MY-OBSIDIAN-DATA\\my_Timedata",
    "D:\\MY-OBSIDIAN-DATA\\my_Schedule",
    "D:\\MY-OBSIDIAN-DATA\\my_Writing",
]

# 我对私有仓库的 git 操作
cmds = {
    "status": "git status\n",
    "push": 'git add .\ngit commit -m "update"\ngit push origin master\n',
}

# 生成批量命令并执行
def auto_git(command):
    lines = []
    tempfile = r"D:\MY-OBSIDIAN-DATA\my_auto_task\tempfile.bat"
    for repo in repos:
        lines.append(f"cd {repo}\n")
        lines.append(cmds[command])

    with open(tempfile, "w") as f:
        f.writelines(lines)
    os.system(tempfile)

def asku():
    """交互式获取命令,可查询状态或提交"""
    asku = input("0 byebye.\n1 status\n2 push")
    if asku == "0":
        return print("byebye.")
    elif asku == "1":
        command = "status"
    else:
        command = "push"
    auto_git(command)

auto_git("push")

一条定时任务,对于计算机和人类来说,依然是一份数据。你可以在任务计划程序的图形界面上手动设置,也可以导出已有任务得到一份 xml 文件作为模板,然后修改好参数后,回到任务计划程序的图形界面上导入它。当然,记得在界面上查看和修订参数,以确保参数符合预期。

一条定时任务的 xml 文件长这个样子:






 

 2019-09-17T12:54:56.301647

 MSI\75801

 \my_github_private_repo_push3

 

 

 

 2019-09-17T12:56:00

 true

 

 1

 

 

 

 

 

 S-1-5-21-4053500361-574701572-2713609324-1001

 InteractiveToken

 LeastPrivilege

 

 

 

 IgnoreNew

 true

 true

 true

 false

 false

 

 PT10M

 PT1H

 true

 false

 

 true

 true

 false

 true

 true

 PT0S

 7

 

 PT1M

 3

 

 

 

 

 C:\ProgramData\Anaconda3\python.exe

 D:\MY-OBSIDIAN-DATA\my_auto_task\github_private_repo_push.py

 D:\MY-OBSIDIAN-DATA\

 

 



现在,我再也不用耗费心力记住自己是否往 github 上提交私有仓库的数据备份,因为它已经被设定了自动执行。

笑来老师最近说到,同样的智能设备,在不同人手中发挥的作用截然不同。痴迷于熟悉自己的生产工具并提高生产效率,总归是件好事。希望我的分享带给你一点启发。

你可能感兴趣的:(我的个人数据存储与自动备份策略)