AI科技大本营

大数据工程师手册：全面系统的掌握必备知识与工具

作者 | Phoebe Wong

译者 | 陆离

编辑 | Jane

出品 | AI科技大本营（ID：rgznai100）

前言

如何才能成为一名真正的“全栈（full-stack）”数据科学家？需要了解哪些知识？掌握哪些技能？

概括来讲，一名全能型选手要把数据科学过程中从数据存储到把预测模型投入正式生产的每一步都能 hold 住。一般来说，大家在学习过程中更注重机器学习或深度学习技术的理论学习与应用，数据管理方面的知识往往是“事后诸葛亮”；数据科学专业的学生们对如何处理、清洗数据等建模技术关注较多，忽略了如何制作“数据香肠”。

但是在真实工程环境中，有近 80%的工作都在围绕“如何从各种来源获取原始数据”这一步骤，从而为后续搭建模型做准备；此外，企业级的项目通常涉及大量数据，本地计算机并不具备处理这些数据的能力。

因此整个建模过程通常会在云上进行，大多应用和数据库也会托管在其它地方的数据中心服务器上，数据管理则成为数据工程团队非常关心的事情。

NIST大数据分类 (来源： WikiCommons)

由于很多数据科学家对数据存储和基础设施了解甚少，影响了他们在工作中做出正确决策的能力。而这篇文章就旨在提供一个线路图，从数据库类型、数据存储和处理的位置和方式，到当前的商业选择，给想成为一名数据科学家的开发者们分享必备的数据管理知识。

基于此文涉及面广，系统知识全面，对初级数据科学家、数据科学专业的学生、想转行进入数据科学领域的开发者们都很适合；对从业经验丰富，已深耕此领域的开发者来说，内容偏基础，不过大家可以基于此文进行更深入地研究，欢迎大家互动交流，分享你的观点和意见。

非结构化数据和大数据工具的兴起

IBM 305 RAMAC (来源： WikiCommons)

实际上，数据科学的本质就是数据存储。在进入数字时代之前，数据存储在我们的大脑中、陶片或纸上，这使得数据的收集和分析极其耗时。1956年，IBM推出了第一台带有磁盘的商用计算机，305 RAMAC。整个单元需要30英尺x 50英尺的物理空间，重量超过一吨，租一个这样的单元，每个月花费 3200 美元，可存储大约5MB的数据。

在随后60年的时间里，DRAM每GB价格从1965年的26.4亿美元大幅下降到2017年的4.9美元。数据存储设备不仅价格极其低廉，而且密度更大、体积更小。在305 RAMAC的一个磁盘中，每平方英寸存储100 比特的数据，对比之下，今天的一个普通磁盘，每平方英寸存储数据可超过1万亿比特。

数据存储的成本和规模的大幅降低正是现如今让大数据分析成为可能的主要原因。凭借超低的存储成本，建设数据科学基础设施，从海量数据中收集和提取有用的信息，这也成为了企业盈利的途径。

随着不断生产和传输用户数据的物联网（IoT）设备的大量涌现，企业们正在收集越来越多的用户行为数据，并创造大量的高容量、高速度和高多样性的信息资产（或称为“3V大数据”）。这些行为（如电子邮件、视频、音频、聊天信息、社交媒体帖子）大多产生了非结构化数据，这些数据占当今企业数据总量的近80%，增长速度是在过去十年中结构化数据的两倍。

图中显示了在2017年存储了125 EB的企业数据，80%是非结构化数据 (来源：Credit Suisse)

海量数据的增长极大地改变了数据存储和分析的方式，因为传统的工具和方法不具备处理“3V大数据”的能力。随着新技术的发展，有能力处理不断增长的数据量和数据种类，并且速度更快，成本更低。这些新的工具还对数据科学家的工作方式产生了深远的影响，使他们能够通过数据分析，以及开发前看起来不可能的应用程序来实现海量数据的变现。下面列举的是我们认为每个数据科学家都应该知道的大数据管理领域的创新方法。

关系数据库和 NoSQL

关系数据库管理系统（RDBMS） 出现于20世纪70年代，它将数据存储在具有行和列的表里面，使用结构化查询语言（SQL）进行查询和维护数据库。关系数据库基本上就是多个表的集合，每个表中都有一个模式（schema），模式严格定义了所存储数据的属性和类型，以及标识用于访问的特定行或列的键。RDBMS曾经由Oracle和IBM所统治，但现在，出现了许多开源的数据库系统，如MySQL、SQLite和PostgreSQL等等，也同样很受欢迎。

上图显示了RDBMS的受欢迎度排名 (来源：DB-Engines)

由于一些特性非常受欢迎，关系数据库在商业领域中找到了一席之地，而数据完整性是关系数据库中最重要的特性之一。RDBMS须满足原子性、一致性、隔离性和持久性（ACID）的要求，它利用一些约束来确保所存储数据是可靠的、准确的，这就使它们成为监测和存储一些诸如帐号、订单和付款等数据信息的理想选择。

但是，这些约束也带来了高昂的代价。由于模式和数据类型的限制，RDBMS在存储非结构化或半结构化数据方面的表现非常糟糕。死板的模式也使得RDBMS在创建、维护和升级等方面的成本变得更高。建立RDBMS需要用户预先拥有特定的用例，对模式的任何更改通常都是非常困难和耗时的。另外，传统的RDBMS被设计用在一个单机上运行，这意味着它们在处理大量数据时的速度要慢得多。在保证ACID特性的同时，水平扩展RDBMS（分库分表）也是一项非常具有挑战性的任务。所有的这些属性使得传统关系型数据库管理系统无法处理现如今的大数据。

截止到2000年，一些互联网公司开发了大量的非关系型（NoSQL）数据库，因为已有的 RDBMS 可能无法长时间地支撑一个成功的互联网公司（下图是一个关于Facebook在数据量开始增长之后如何应对MySQL限制的例子）。在当时没有任何已有解决方案的情况下，这些互联网公司创造了新的方法和工具来处理收集到的大量非结构化数据：谷歌发布了GFS、MapReduce和BigTable；亚马逊发布了DynamoDB；雅虎发布了Hadoop；Facebook发布了Cassandra和Hive；LinkedIn发布了Kafka。其中一些公司开放了他们的源代码，一些公司则发布了他们详细的研究设计论文，这也就促进了各种新数据库与新技术的激增，而NoSQL数据库成为了行业中的一个主要的参与者。

上图显示了自2000年以来各种数据库系统激增的情况。来源：Korflatis et. al (2016)

NoSQL数据库与模式无关，它提供了存储和操作大量非结构化和半结构化数据所需的灵活性。用户不需要知道在创建数据库的时候将存储哪些类型的数据，系统可以适应数据类型和模式的变化。NoSQL数据库可以跨节点分发数据，它通常具有更高的水平伸缩性和分区容错性。但是，这些性能优势同时也还伴随着成本的开销。NoSQL数据库不符合ACID特性，因而，数据一致性也无法得到保证。

相反，它们提供了“最终一致性”：当旧数据被覆盖时，它们将返回暂时有些出入的结果。例如，当人们同时搜索同一个词的时候，谷歌的搜索引擎索引不能更新这个词的相关数据，因此它在我们搜索时不会返回给我们最新的数据结果，但它会返回最合适的结果。虽然这个特性在绝对需要保证数据一致性的情况下（如金融交易）不太适合，但对于那些需要效率而不是精确度的任务的场景，它却非常的适合。

现在，NoSQL分为几个不同的类别，每个类别都有其特定的作用。

键值存储 ，如Redis、DynamoDB和Cosmos DB，只用于存储键值对，并提供检索与已知键相关联的值的基本功能。当速度因素很重要的时候，它们在简单的数据库模式下执行的效率最高。
宽列存储 ，如Cassandra、Scylla和HBase，将数据存储在列族或表中，并用来为大型分布式系统管理PB级的数据量。
文档存储 ，如MongoDB和Couchbase，以XML或JSON格式存储数据，文档名称作为主键，文档内容作为值。文档可以包含许多不同的值类型，并且可以嵌套，使它们特别适用于管理分布式系统的半结构化数据。
图形数据 库，如Neo4J和Amazon Neptune 等将数据表示为相关联节点或对象的网络，以便于数据的可视化和图形化分析。图形数据库对于分析异构数据点之间的关系特别的有用，例如防欺诈或Facebook的好友关系图。

MongoDB是目前最流行的NoSQL数据库 ，它为一些一直在使用传统RDBMS方法处理非结构化数据的企业带来了巨大的帮助。

这里有两个行业例子：MetLife花费了多年的时间，试图在一个可以处理其所有保险产品的RDBMS上建立一个集中式的客户数据库，之后，一个Hackathon的人在数小时内就用MongoDB创建了一个数据库，该数据库在不到90天就投入了生产。YouGov是一家每小时收集5GB数据的市场调查公司，它将所有的数据从RDBMS迁移到了MongoDB，存储空间节省了70%。

数据仓库、数据湖和数据沼泽

随着数据源的不断增多，使用多个数据库进行数据分析的工作变得效率低下、成本高昂。在2000年之后，出现了一种称为数据仓库（Data Warehouse）的解决方案，它能将企业所有数据库中的数据集中起来。数据仓库通过创建一个来自不同数据源（内部和外部）数据的存储库，支持从操作系统到分析和决策系统的数据流。

在大多数的情况下，数据仓库是一个关系型数据库，它存储了为收集业务信息而优化的已处理数据。它收集了来自交易系统和业务应用系统的具有预定结构和模式的数据，这些数据通常用于生成经营报告和分析结果。

但是，由于进入数据仓库的数据需要在存储之前就进行处理，还存在着大量的非结构化数据，这可能需要耗费大量的时间和资源。因此，企业开始维护数据湖（Data Lakes），它能以任何规模存储企业的所有结构化和非结构化的数据。创建一个能存储原始数据的数据湖，无需一开始就定义数据结构和模式。

数据湖允许用户执行分析任务，而无需将数据迁移到单独的分析系统上，从而使企业能够从以前不能用于分析的新数据源中获得信息，例如，通过使用日志文件、访问数据、社交媒体和物联网设备中的数据来创建机器学习模型。通过随时都可以分析企业所有的数据，数据科学家们可以回答更多的新业务问题，或者用新数据解决旧问题。

上图是数据仓库与数据湖的对比(来源：AWS)

数据湖的体系结构面临的一个常见挑战是，如果没有合适的数据质量和数据治理框架，当数以TB计的结构化和非结构化的数据流入数据湖时，往往很难对其内容进行分类和排序。数据湖就变成了数据沼泽（Data Swamps），因为它们变得太乱了，无法使用。许多组织现在要求进行更多的数据治理和元数据管理。

分布式和并行计算：Hadoop、 Spark和MPP

虽然企业对数据存储和计算的需求在过去几十年里突飞猛进地增长，但传统硬件的发展还远远跟不上要求。企业数据不再适合标准存储，处理大多数的大数据分析任务所需要的计算能力可能需要数周、数月，或者根本不可能在普通计算机上完成。

为了解决这一问题，许多新技术已经发展到多台计算机协同工作，将数据库分发给数千台商品服务器来进行处理。当多个计算机连接起来形成一个网络并共同完成同一任务的时候，这些计算机就形成了一个集群。

一个集群可以看作是一台计算能力强大的计算机，它可以使用普通的硬件，非常低廉的成本，但可以显著地提高性能、可用性和可扩展性。Apache Hadoop是分布式数据基础设施的一个例子，它利用集群来存储和处理海量的数据，并支持数据湖体系结构。

数据库技术的发展过程(来源：Business Analytic 3.0)

当你想到Hadoop的时候，就想想“数据分发”。Hadoop由三个主要的部分组成：Hadoop分布式文件系统（HDFS），它是一种跨多个（分布式）物理硬盘来存储和监测数据的方式；MapReduce，是一种跨分布式处理器处理数据的框架；还有另一个是资源协商者（YARN），这是一个集群管理框架，它在分布式系统上协调资源，如CPU的大小、内存的多少和网络带宽分配等等。

Hadoop的处理层是一个特别值得注意的创新 ：MapReduce使用一种两步计算的方式，用于以一个可靠的、容错的方式处理分布在大型商用集群中的大数据集。第一步是将数据分发到多台计算机（Map）上，每台计算机对分发的数据片执行并行计算。第二步是以成对的方式合并这些计算结果（Reduce）。

谷歌在2004年发表了一篇关于MapReduce的论文，2006年的时候，在开源Apache环境中实现了MapReduce的一个Yahoo程序员看到了这篇论文，得以为每个企业提供了使用商业硬件来存储前所未有的数据量的能力。尽管这个想法有很多开源的实现，但Google的MapReduce却一直保持着优势，有点像Jacuzzi或Kleenex。

Hadoop是为迭代计算而设计的 ，它在一次操作中从磁盘扫描大量的数据，将处理任务分发到多个节点，并将结果返回并存储到磁盘上。使用Hadoop和HBase，查询ZB级的索引数据可以在10-12秒内完成，而在传统数据仓库环境中运行则需要4个小时。Hadoop通常用于生成复杂的分析模型或海量数据存储的应用程序，例如回顾性和预测性分析、机器学习和模式匹配、客户细分和客户流失分析，以及活动归档等等。

但是，MapReduce用于处理批量的数据，因此它不适合处理实时数据。 Apache Spark是在2012年发布的，可以用来填补这一空白。Spark是一种并行数据处理工具，它通过在内存中处理数据来提高运行速度和效率。它与MapReduce的原理相同，但通过在内存中完成大部分的计算工作，并且仅在内存已满或计算完成的时候才会写入磁盘，因此，它的运行速度会快得多。这种内存计算允许Spark“在内存中运行程序比在Hadoop MapReduce中快100倍，比在磁盘上快10倍”。

然而，当数据集太大而导致内存不足（通常是数百GB以上）的时候，Hadoop MapReduce可能比Spark表现的更好。Spark还拥有一套强大的数据分析库，涵盖了广泛的功能：用于SQL的Spark SQL和结构化数据，用于机器学习的MLib，用于流式计算的Spark Streaming和用于图形分析的GraphX。由于 Spark的重点是计算 ，所以它没有自带的存储系统，而是运行在各种存储系统之上，如 Amazon S3、Azure Storage和Hadoop’s HDFS。

在MPP系统中，所有的节点都是互连的，数据可以通过网络进行交换(来源：IBM)

Hadoop和Spark并不是唯一利用集群处理海量数据的技术。另一个流行的分布式查询处理方法称为大规模并行处理（Massively Parallel Processing ，MPP）。类似于MapReduce，MPP跨多个节点分发数据处理任务，并且节点利用更加快速的并行处理方式。

但与Hadoop不同的是，MPP是在RDBMS中使用的，并使用“无共享”式的体系结构，每个节点使用多核处理器处理自己的数据片，使它们比传统的RDBMS快很多倍。一些MPP数据库，如Pivotal Greenplum，拥有成熟的机器学习库，允许进行库内数据分析。

然而，与传统的RDBMS一样，大多数MPP数据库不支持非结构化数据，甚至结构化数据也需要通过一些处理之后才能适应MPP的基础结构。因此，为MPP数据库设置数据管道需要花费额外的时间和资源。

由于MPP数据库是支持ACID特性的，并且比传统的RDBMS执行速度要快得多，因此它们通常用于高级企业数据仓库解决方案，如Amazon Redshift、 Pivotal Greenplum和 Snowflake。

作为一个行业案例，纽约证券交易所每天接收4~5TB的数据量，并进行复杂的分析、市场调查、容量规划和监测。该公司一直在使用一个几乎无法承担数据处理工作的传统数据库系统，它需要数小时才能加载完成，查询速度也非常的差。迁移到MPP数据库后，他们每日的运行数据分析时间减少了8个小时。

云服务

另一个彻底改变的企业大数据分析能力的创新是云服务的兴起。 在云服务出现之前，企业不得不从软件和硬件的供应商那里购买本地数据存储软件、设备和数据分析解决方案，这通常要支付永久性的软件许可费用以及每年的硬件维护费和技术服务费。

除此之外，还有电力、空调、网络安全、容灾保护、IT技术人员等方面的成本，用于建设和维护内部基础设施。即使在技术上有能力存储和处理大数据的时候，大多数企业也会发现海量数据的存储和处理的成本太高了。

另外，扩展内部基础设施还需要一个设计和采购的过程，这需要很长的时间来实施，并需要大量的资金预算。许多潜在有价值的数据收集和分析可能就因此被放弃了。

云服务的提供商：例如基础设施即服务（IaaS）和存储即服务（SaaS）(来源：IMELGRAT.ME)

当云服务在2000年末被引入的时候，内部自建模式开始迅速地失去了市场份额——在过去十年里，全球云服务市场份额每年增长15%。云服务平台提供对各种服务（从虚拟计算到存储基础设施再到数据库）的定制，这些服务在线通过用多少付多少的方式提供，为用户灵活快速地访问和低成本的数据存储，以及为虚拟计算资源提供了便利条件。

云服务提供商负责其所有硬件和软件的采购和维护，他们通常拥有庞大的服务器网络和技术支持团队来提供可靠的服务。许多企业在使用之后发现，他们可以通过云服务显著降低运营成本和提高运营效率，并且能够利用现成的云资源和内置的可伸缩性更快地开发和生产产品。不仅没有了自建基础设施的巨大成本和周期，云服务还避免了搭建大数据平台的麻烦，并有效地使中小企业的大数据分析工作更加的灵活。

这里有几种云服务模型，其中公有云是最常见的。

在公有云中，所有硬件、软件和其它的支撑基础设施都由云服务提供商自行搭建和管理。用户与其他的“云租户”共享云基础设施，并可以通过Web浏览器访问他们的服务。

而具有特殊安全需求的组织通常会使用私有云，如政府机构和金融机构等。在私有云中，服务和基础设施仅提供给一个组织使用，并在私有网络上进行维护。私有云可以是本地的，也可以由第三方服务提供商托管。

混合云将私有云与公有云结合起来，使组织能够同时获得两者的优势。在混合云中，数据和应用程序可以在私有云和公有云之间进行传输和访问以获得更大的灵活性：例如，公有云可用于高访问量、低安全性的数据，而私有云可用于敏感的、业务关键型的数据，如财务报告、金融数据等等。
多云模型则涉及到多个云平台，每个平台都提供特定的应用服务。多云可以是公有云、私有云和混合云的组合，以实现组织的目标为目的。组织通常选择多云是为了满足一些特定的业务，以及位置和时间上的需求，并避免供应商的局限性。

案例研究：构建端到端的数据科学基础设施

设计一个可行的数据产品，不仅仅是用Scikit-Learn（Scikit-learn是专门面向机器学习的Python开源框架）构建一个机器学习模型，还要对其进行反复优化，并加载到服务器上。

不同数据环境下的机器学习包(来源： Kosyakov (2016))

它需要了解企业生态系统的所有部分是如何协同工作的，从数据流入的位置和方式、数据处理和转换的环境、企业可视化和展现数据的惯例，以及如何将模型输出转换为某些其它的企业应用的输入。

它的主要目标包括创建一个易于维护的过程，在这个过程中，模型可以被迭代，性能是可复制的，模型的输出可以可视化地展现出来并能让老板们轻松地理解，以便他们能做出更加明智的业务决策。

实现这些目标需要选择正确的工具，并了解同行们都正在做什么以及做出了什么成果。 接下来，我们用一个场景来加以说明。

假设你刚刚被一家度假推荐App的初创公司聘为首席数据科学家，该公司预计将收集数百GB的关于用户每天的数据，包括结构化的（客户资料、温度、价格和交易记录）和非结构化的（客户的帖子、评论和图片文件）。你的预测模型需要每周都重新训练新的数据，并根据需要即时提出合理化建议。想让自己的这款 APP 应用能大受欢迎，数据的收集、存储和分析能力必须是可扩展的。

你将如何设计数据处理过程和模型产品化呢？你需要什么样的工具来完成工作呢？既然这是一家初创公司，而你是数据科学家中的首席，或许也是唯一的数据科学家，那么就只能由你来做这些决定。

首先，你必须了解如何设置数据管道，管道接收来自数据源的原始数据，并进行数据处理，然后将处理过的数据写入数据库。

理想化的数据管道具有较低的事件延迟（在收集到数据后能够立即进行数据查询）、可伸缩性（能够在产品扩展时处理海量数据）、交互式查询功能（支持批量查询和较小规模的交互式查询，使数据科学家能够查找表和模式）、版本控制功能（在不关闭管道和丢失数据的情况下对管道进行修改的能力）；监控功能（数据一旦停止输入管道应促发警报）、可测试性（在不中断的情况下测试管道的能力）。

或许最重要的是它最好不要干扰日常的业务操作，例如，如果你正在测试新的模型，进而导致数据库操作停止，则操作会回滚。创建和维护数据管道通常是数据工程师的职责（本文对初创公司创建数据管道有一个更详细的概述），但是数据科学家至少也应该熟悉这个过程和它的局限性，以及对处理过的数据进行分析的工具。

接下来 ，你必须决定企业是要自建基础设施还是使用云服务。对于初创公司来说，首要任务是在不增加有限资源的情况下扩大数据收集量。如前面所说，自建基础设施需要巨大的前期投入和维护成本，因此云服务往往是初创公司更好的选择。云服务允许自由扩展来满足需求，并且只需要很少的维护工作，这样你的小团队就可以专注于产品设计和数据分析工作了，而不是对基础设施的管理。

上图显示了一些提供基于Hadoop解决方案的供应商 (来源：WikiCommons)

为了选择一个云服务商，你必须先确定要分析的数据，然后再确定最适合这些数据类型的数据库和基础设施。 由于在数据分析的管道当中既有结构化数据，也有非结构化数据，所以你可能希望同时建立数据仓库和数据湖。

数据科学家需要考虑的一个重要问题是，存储层是否支持构建模型所需要的大数据工具，以及数据库是否提供了有效的库内分析功能。例如，Spark的MLlib等一些机器学习库不能有效地将数据库作为主要接口使用，必须先从数据库中把数据下载下来，然后才能对其进行操作，这可能会随着数据量的增长而越来越耗时，而当你不得不定期重新训练模型的时候，这就将会成为性能的瓶颈。

对于云端的数据科学，大多数云服务提供商正在努力开发他们的本地机器学习功能，这就允许数据科学家可以使用存储在自己平台上的数据来轻松构建和部署机器学习模型（亚马逊有SageMaker，谷歌有BigQuery ML，微软有 Azure Machine Learning）。

但是这些工具集目前仍然处于开发完善阶段，而且功能上时常不太完整，例如，BigQuery ML目前只支持线性回归、二元逻辑回归和多类逻辑回归、K-means聚类和TensorFlow模型导入。如果决定使用这些工具，你必须完整地测试一下它们的功能，以确保能完成你的任务。

选择云服务提供商时要考虑的另一个重要问题是产品供应商的选择。如果选择专有的云数据库解决方案，则很可能无法访问本地环境中的应用或数据，而更换供应商则需要迁移到其它的数据库系统，这很可能会产生高昂的成本。解决这个问题的一个方法是选择支持开源技术的供应商（这里是Netflix解释为什么使用开源软件的理由）。

使用开源技术的另一个优势是，它们往往会吸引更多的用户，这意味着可以更容易地找到熟悉你的基础架构并具有相关工作经验和技能的技术人员。还有另外一个方法,就是选择一个第三方供应商（如Pivotal Greenplum和Snowflake），他们使用一些主要的云服务提供商作为数据存储端来提供云数据库解决方案，这将允许你把数据同时存储在多个云平台上，如果这适合你的初创公司的需求。

最后，由于你是这家初创公司的首席数据科学家，并且希望公司能够发展壮大，那么你必须建立一个强大的云服务管理机制来保护你的云安全，防止数据的丢失和泄漏，比如管理数据访问权限、保护各种数据接口和API。当然你还希望实现最佳的数据治理效果，以维护数据的质量，并确保数据湖不会变成数据沼泽。

正如我们所看到的那样，在企业数据科学项目中调整的超参数的数量要比在机器学习模型中的多得多。我们希望这个较高水平的概述能让你有兴趣了解更多关于数据管理领域方面的知识，能学到一些东西吸引更多的开发者们成为数据工程师。

原文链接：

https://towardsdatascience.com/everything-a-data-scientist-should-know-about-data-management-6877788c6a42

(*本文为AI科技大本营编译文章，转载请微信联系 1092722531)

◆

精彩推荐

◆

如何少走弯路，利用不同区块链的数据结构实现项目上链？

9月19日，【dfuse小聚：区块链数据应用讨论会】将在上海举行，dfuse CTO&联合创始人、EOS加拿大联合创始人 Alex Bourget；慢雾科技合伙人兼安全产品负责人启富（Keywolf）；MYKET联合创始人/EOS Cannon联合创始人Ricky胖哥，与你一起深度探索区块链应用搭建以及区块链数据结构的奥秘，让你明白到底你的业务该如何上链！

推荐阅读

知乎算法团队负责人孙付伟：Graph Embedding在知乎的应用实践
必看，61篇NeurIPS深度强化学习论文解读都这里了
打破深度学习局限，强化学习、深度森林或是企业AI决策技术的“良药”
激光雷达，马斯克看不上，却又无可替代？
卷积神经网络中十大拍案叫绝的操作
Docker是啥？容器变革的火花？
5大必知的图算法，附Python代码实现
阿里云弹性计算负责人蒋林泉：亿级场景驱动的技术自研之路
40 岁身体死亡，11 年后成“硅谷霍金”，他用一块屏幕改变 100 万人！
AI大神如何用区块链解决模型训练痛点, AI+区块链的正确玩法原来是这样…… | 人物志

你点的每个“在看”，我都认真当成了喜欢

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

大数据工程师手册：全面系统的掌握必备知识与工具

知乎算法团队负责人孙付伟：Graph Embedding在知乎的应用实践

必看，61篇NeurIPS深度强化学习论文解读都这里了

打破深度学习局限，强化学习、深度森林或是企业AI决策技术的“良药”

激光雷达，马斯克看不上，却又无可替代？

卷积神经网络中十大拍案叫绝的操作

Docker是啥？容器变革的火花？

5大必知的图算法，附Python代码实现

阿里云弹性计算负责人蒋林泉：亿级场景驱动的技术自研之路

40 岁身体死亡，11 年后成“硅谷霍金”，他用一块屏幕改变 100 万人！

AI大神如何用区块链解决模型训练痛点, AI+区块链的正确玩法原来是这样…… | 人物志

你可能感兴趣的:(大数据工程师手册：全面系统的掌握必备知识与工具)