B端产品 / 语言 / 大数据 / 数据处理名词解释

说明:

由于没有找到有完整的IT相关名词解释的词典,于是从网上搜索并整合常用的的名词解释,

1. 大部分来自于百度百科和个人文章,仅做整合使用,为摘抄而非原创,
2. 仅作为非技术人员浅层理解查询使用,有错误欢迎指出
3. 会持续更新
4. 请用搜索查找全文定位

内容摘抄来源在结尾,如果有比较好的内容可以推荐,谢谢。


业务产品

ERP
Enterprise Resource Planning | 企业资源计划

决策角度出发的,基于供应链的资源安排,侧重业绩管理,绩效评价

从MRP Ⅱ发展而来的新一代集成化企业资源管理系统横向的扩展――功能范围的增加,从供应链上游的供应商管理到下游的客户关第管理纵向的扩展――从低层的数据处理(手工自动化)到高层管理决策支持(职能化管理)行业的扩展――从传统的以制造业为主到面向所有的行业

会获取PDM / CAPP / 工时系统的数据

MRP
Material Requirement Planning | 物资需求计划

以每个物品为计划对象安排各层次物品的供应(先后顺序)计划,以完工时期为时间基准的需求排期


MRP Ⅱ
Manufacture Resource Plan | 制造资源计划

资金和资源安排生产管理的计划与控制模式,物流与资金流的信息集成,是在物料需求计划上发展出的一种规划方法和辅助软件


APS
Advanced Planning and Scheduling | 进阶生产规划及排程系统

柔性生产下的生产资源/需求/计划排程


SCM
Supply Chain Management | 供应链管理

把供应商、制造商、仓库、配送中心和渠道商等有效地组织在一起来进行的产品制造、转运、分销及销售的管理方法

计划、采购、制造、配送、退货


MES
Manufacturing Execution System|车间执行层的生产信息化管理系统

车间现场管理制造数据管理、计划排产管理、生产调度管理、库存管理、质量管理、人力资源管理、工作中心/设备管理、工具工装管理、采购管理、成本管理、项目看板管理、生产过程控制、底层数据集成分析、上层数据集成分解等管理模块


PLM
Product Lifecycle Management | 产品生命周期管理

包含PDM的全部内容,管理产品从需求到淘汰的全过程, 应用于在单一地点的企业内部、且分散在多个地点的企业内部,以及在产品研发领域具有协作关系的企业之间的,支持产品全生命周期的信息的创建、管理、分发和应用的一系列应用解决方案,它能够集成与产品相关的人力资源。

一些其他的生命周期管理软件比如:

CLM

Contract Lifecycle Management | 合同管理

PSLM

Product-Service Lifecycle Management | 产品服务生命周期管理


PDM
Product Data Management | 产品数据管理

管理所有与产品相关信息(包括零件信息、配置、文档、CAD文件、结构、权限信息等)和所有与产品相关过程(包括过程定义和管理)

EDM工程数据管理接入CAD等工程软件数据,进入ERP / CAPP(计算机辅助工艺计划)

CPS
Cyber-Physical Systems|信息物理系统

物联网智能,自主协调

通过传感、通信、计算和控制等信息单元和物理对象在网络环境下的高度集成与交互,提升信息系统的数据感知、实时通信、数据处理、分析决策、精准控制等方面的能力


SCADA

Supervisory Control And Data Acquisition | 数据采集与监视控制系统

生产过程控制与调度自动化系统,它可以对现场的运行设备进行监视和控制


WCS / WMS
Warehouse Control System / Warehouse Management System |仓储控制系统

 仓储和物流设备协调管理、监控


LIMS
Laboratory Information Management System |实验室信息管理系统

完成实验室数据和信息的收集、分析、报告和管理

KMS
Knowledge Management |知识管理

知识管理


BPM

Business Process Management | 业务流程管理

端到端流程优化


OA
Office Automation | 办公自动化

CRM
Customer Relationship Management | 客户关系管理

管理销售、营销和服务上与客户的交互,向客户提供创新式的个性化客户交互和服务的过程。其最终目标是吸引新客户、保留老客户以及将已有客户转为忠实客户,增加市场份额。

CEM

Customer Experience Management | 用户体验管理

VOC

Voice of Customer | 用户反馈管理 / 客户之声


BI

Business Intelligence | 商务智能

用报表将企业中现有的数据进行有效的整合,快速准确地提供报表并提出决策依据



语言

Scala

类似java,适用于高性能集群计算,查询效率高,spark采用Scala语言实现,使用Scala作为应用框架


R

常用于数据统计 / 数据可视化


Python

主流数据科学编程语言,python的库有很多,例如,numpy、pandas、scikit-learn、tensorflow、keras等


SQL

一般指结构化数据查询语言,和Hive天做之合





大数据

Hadoop
分布式存储

由Apache基金会所开发的分布式系统基础架构。Hadoop被设计成能够从单台服务器扩展到数以千计的服务器,每台服务器都有本地的计算和存储资源。Hadoop的高可用性并不依赖硬件,其代码库自身就能在应用层侦测并处理硬件故障,因此能基于服务器集群提供高可用性的服务。

用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储


HDFS
Hadoop Distributed File System

Hadoop生态底层存储架构,完成了分布式存储系统的逻辑

Spark / Hive / Hadoop基于相同的HDFS存储+ yarn(资源管理、任务调度)

DataNode 存储节点上管理数据的模块

NameNode 是对全局数据的名字信息做管理的模块

SecondaryNameNode 是它的从节点,以防挂掉


Map-reduce
进行任务调度,数据处理的并行计算框架

将作业分为mapping阶段和reduce阶段,其中每项任务都是单独的Java应用,能够访问数据并抽取有用信息


yarn

资源管理、任务调度(多机协同)

Hive

分布式数据库(数仓)类似于SQL的高级语言,解决海量结构化的日志数据查询/统计问题Hive允许不熟悉MapReduce的开发人员编写数据查询语句,它会将其翻译为Hadoop中的MapReduce作业

HBase

分布式kv(key/value键值)系统,以HDFS为介质,面向列的NoSQL数据库,对大量数据进行快速读取/写入

HMaster负责管理HRegionServer以实现负载均衡,负责管理和分配HRegion(数据分片),还负责管理命名空间和table元数据,以及权限控制

HRegionServer负责管理本地的HRegion、管理数据以及和hdfs交互。


Zookeeper

负责集群的协调(如HMaster主从的failover)以及集群状态信息的存储


Pig

大数据分析平台,为用户提供多种接口


AmbariHadoop

管理工具,可以快捷的监控、部署、管理集群


Sqoop

连通性工具,用于在关系型数据库和数据仓库与Hadoop之间移动数据


Spark

开源,分布式机器学习处理引擎采用Java,Scala,Python,R和SQL中的API,Spark运行程序比内存中的Apache Hadoop MapReduce高出100倍,Spark提供了一系列库,包括SQL,DataFrames和Datasets,用于机器学习的MLlib,用于图形处理的GraphX和Spark Streaming。您可以在相同的应用程序中无缝地组合这些库。

spark支持分布式数据集上的迭代式任务,实际上可以在hadoop文件系统上与hadoop一起运行(通过YARN,MESOS等实现)

kafka
开源流处理平台

由Apache软件基金会开发的一个开源流处理平台由Scala和Java编写高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据(网页浏览,搜索和其他用户的行动)

Redis

日志型、Key-Value数据库使用ANSI C语言编写、支持网络、可基于内存亦可持久化的数据库

Airflow

开源的,分布式任务调度框架,它将一个具有上下级依赖关系的工作流,组装成一个有向无环图



数据处理

Jupyter notebook

IDE的python编译插件支持运行超过40种编程语言的交互式笔记本

Jupyterlab

Jupyter notebook 升级版本,百度/阿里/腾讯等AI建模笔记本的内核均使用jupyterlab


PyCharm

IDE,基于python的集成的开发工具,编译环境是Anaconda


Anaconda

开源python版本,包括Conda、Python以及一大堆安装好的工具包,包含了Conda、NumPy、Pandas、Matplotlib、SciPy、Scikit-learn,等180多个科学包及其依赖项


NumPy 

是Python的一种开源的数值计算扩展
纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集


Pandas

基于NumPy,解决数据分析任务的工具


NumPy Matplotlib

基于NumPy 的可视化工具


keras

tensorflow封装后的API


tensorflow

python的机器学习库



来源

1. SCADA、MES、PLM、ERP,盘点各大系统,接口与集成方式
https://www.shangyexinzhi.com/article/1586248.html

2. CRM/PLM/SCM/MES与ERP内在区别与联系
http://www.opensoft.com.cn/mesyerpqb.asp

3. Hadoop生态系统架构
https://www.jianshu.com/p/e883684d24e4

4. Hadoop的生态系统
https://zhuanlan.zhihu.com/p/112758968

5. anaconda、pycharm、Jupyter、Spyder、python之间的关系
https://zhuanlan.zhihu.com/p/76942509

你可能感兴趣的:(B端产品 / 语言 / 大数据 / 数据处理名词解释)