引子

从去年(2017)起,由于工作涉及到OCR的项目, 以及销售预测,采购和库存优化。开始接触相关新知识。

之后,主导公司业务流程自动化的实施,涉及到其它一些新的技术。

现罗列如下新技术和新知识:

1. tesseract OCR  -  pytesseract, Pdfminer, python pandas.

2. OpenCV

3. Apache Zeppelin,

4. 预测相关的算法: traditional: EWMA, ARIMA.  Deep Learning: RNN-LSTM

5. HDP/HDFS, HIVE, HAWQ, SPARK/Scala

6. NiFi/HDF

7. Metabase(BI tool)

8. Python Flask Service Framework

9. NLP

10.TensorFlow

11. PaddlePaddle

我觉得有必要把近一年以来做的事情和一些干货做一个总结,希望也能做些思路梳理的工作。

接下来,我会结合所做的项目和实际的一些例子来展开!

2018-06-05

你可能感兴趣的:(引子)