数据管理与个人搜索引擎

最近在逐渐复盘老业务,发现自己在信息收集上有很多问题

很多几年前亲自做的东西,找不到文档,找不到当年的分享ppt了,猛然间发现简直无法向别人证明这是我做过的东西了。

所以数据管理就很重要了,尽可能的往云端多上传数据。

总的原则,应该是,简便的收集数据,滞后整理数据

因为整理本身并不重要,树状的信息组织本来就不适合大规模的信息中的查找。用建立搜索引擎的方式进行相关搜索是最好的。

如何能更好的收集数据呢?要看数据在哪里

有价值的数据,无非是各种以pdf,ppt,doc,csv之类存在。这些数据无非是在PC或者手机上,微信里非常多。登录了PC端的微信,会默认缓存到某个文件夹下,那样倒是写个脚本就能自动上传到云端了。但是移动端的微信怎么办?某个群里的发的资料,是否有办法自动下载并同步过去?如果没有办法,可能只能常年挂着PC端,然后检测那个缓存文件夹下有没有新增文件了。

那么上传之后如何打标签呢?文件名直接分词做索引,pdf,ppt之类也都可以解析之后做全文检索。那么索引文件保存在哪里?也自动上传到云盘?

全套东西可以做个小脚本,练练编程。

你可能感兴趣的:(数据管理与个人搜索引擎)