Omni-Space

用区块链改变人工智能：去中心化带来数据新范式

近年，从围棋到人类水平的语音识别，人工智能（AI）研究者终于在他们几十年一直努力探索的领域取得了突破。取得突破进展的关键一点是研究者们可以收集巨量的数据并「学习」这些数据，从而将错误率降低到可接受范围以内。
简而言之，大数据大为改观了人工智能的发展，将其推到一个几乎难以置信的高度。
区块链技术同样能够变革人工智能——当然以它自己的特定方式进行。部分将区块链用于人工智能方式目前还很单一，比如在人工智能模型上进行审计跟踪（audit trail）。有些应用几乎是难以置信的，比如拥有自己的人工智能——人工智能去中心化自治组织（AI DAO）。这些都是发展的机会。这篇文章将具体探讨这些应用。
作为蓝海数据库的区块链（blockchain）
在讨论这些应用之前，我们先来了解一下区块链与传统大数据的分布式数据库（比如 MongoDB）之间的差异。
我们可以将区块链视为「蓝海」数据库：它们逃离了现有市场上有鲨鱼竞争的「红海」，而是没有市场竞争的蓝海。蓝海的著名例子是视频游戏主机 Wii（妥协了原始性能，但添加了新的互动模式），或 Yellow Tail 葡萄酒（忽略了葡萄酒爱好者矫揉造作的繁复规范，使葡萄酒更容易被啤酒爱好者接受）。
根据传统的数据库标准，传统的区块链（如比特币）是糟糕的：低吞吐量、低容量、高延迟、糟糕的查询支持等。但在蓝海思维中，这是可以接受的，因为区块链引入了三个新特性：去中心化/共享控制、不变性/审计跟踪和本地资产/交换。受比特币启发的人们乐于忽视传统的以数据库为主的缺点，因为这些新的好处有可能以全新的方式影响整个行业和社会。
这三个新的「区块链」数据库特征对于人工智能应用也有潜在的借鉴意义。但是大多数实际的人工智能工作涉及大量的数据，如大数据集训练或高吞吐量流处理（stream processing）。因此，对于区块链在人工智能领域的应用，需要具有大数据可扩展性和查询的区块链技术。像 BigchainDB 这样的新兴技术及其公共网络 IPDB（Internet Pinball Machine Database）正是如此。这使得获得区块链的好处时不再需要舍弃传统的大数据数据库的优点。
人工智能区块链的概述
大规模的区块链技术解锁了其在人工智能应用上的潜力。从区块链的三点好处开始，我们来探讨一下这些潜力。
这些区块链的好处为人工智能实践者带来了以下机会：
去中心化/共享控制激励了数据共享：
（1）带来更多的数据，因此可以训练出更好的模型。
（2）带来新的定性数据，因此新的定性模型。
（3）允许共享控制人工智能的训练数据和模型。
不变性/审计跟踪：
（4）为训练/测试数据和模型提供了保证，提高数据和模型的可信度。数据也需要声誉。
本地资产/交换：
（5）使训练/测试数据和模型成为知识产权（Intellectual Property/IP）资产，这可以带来去中心化的数据和模型交换。能更好地控制数据的上游使用。
还有一个机会：（6）人工智能与区块链解锁人工智能去中心化自治组织（AI DAO/Decentralized Autonomous Organizations）的可能性。这些人工智能可以积累财富。在很大程度上，它们就是软件即服务（Software-as-a-Service）。
区块链还可以以更多的方式帮助人工智能。反过来，人工智能可以有许多方法帮助区块链，如挖掘区块链数据（例如 Silk Road 调查）。这是另外的讨论话题: )
许多这些机会是关于人工智能与数据的特殊关系。让我们先来探讨一下。在此之后，我们将更详细地探讨区块链在人工智能领域的应用。
人工智能 & 数据
在这里，我将描述现代人工智能为了产生好的结果是怎样利用大量数据的。（虽然不总是这样，但它很常见并值得描述。）
「传统」人工智能 & 数据的历史
当我在 90 年代开始做人工智能研究时，一个典型的方法是：
找到一个固定的数据集（通常很小）。
设计一种算法来提高性能，例如为支持向量机分类器设计一个新的核函数，以提高 AUC 值。
在会议或期刊上发表该算法。「最小可发表的改进程度」只需要相对提高 10％，只要你的算法本身足够花哨。如果你的提高程度在 2 倍-10 倍 之间，你可以发表到该领域最好的期刊了，特别是如果算法真的很花哨（复杂）的话。
如果这听起来很学术，那是因为它本身就很学术。大多数人工智能工作仍然在学术界，虽然有实际的应用场景。在我的经验中，许多人工智能子领域中都是这样的，包括神经网络、模糊系统（fuzzy system）、进化计算（evolutionary computation），甚至不那么人工智能的技术，如非线性规划或凸优化。
在我第一篇发表的论文《Genetic Programming with Least Squares for Fast, Precise Modeling of Polynomial Time Series》（1997）中，我自豪地展示了我新发明的算法与最先进的神经网络、遗传编程等相比在最小的固定数据集上有最好的结果。
走向现代人工智能 & 数据
但是，世界变化了。2001 年，微软研究人员 Banko 和 Brill 发表了一篇有着显著成果的论文。首先，他们描述了大多数自然语言处理领域的工作基于小于 100 万字的小数据集上的情况。在这种情况下，对于旧/无聊/不那么花哨的算法，错误率为 25％，如朴素贝叶斯（Naive Bayes）和感知器（Perceptron），而花哨的较新的基于记忆的算法（memory-based algorithms）实现了 19％的错误率。这是下面最左边的四个数据点。
到目前为止，还没有什么让人惊讶的。但是，Banko 和 Brill 揭示了一些不同寻常的东西：当你添加更多的数据——不仅仅是一点数据，而是多达数倍的数据——并保持算法相同，那么错误率会持续下降很多。到数据集大到三个数量级时，误差小于 5％。在许多领域，这是 18％到 5％之间的差异，但是只有后者对于实际应用是足够好的。
此外，最好的算法是最简单的；最糟糕的算法是最花哨的。来自 20 世纪 50 年代的无聊的感知器算法正在击败最先进的技术。
现代人工智能 & 数据
Banko 和 Brill 并不是唯一发现这个规律的人。例如，在 2007 年，谷歌研究人员 Halevy、Norvig 和 Pereira 发表了一篇文章，显示数据可以如何「不合理地有效」跨越许多人工智能领域。
这就像原子弹一样冲击了人工智能领域。
数据才是关键！
于是收集更多的数据的竞赛开始了。需要大量的努力才能获得好数据。如果你有资源，就可以得到数据。有时甚至可以锁定数据。在这个新世界里，数据是壕沟，人工智能算法是一种商品。出于这些原因，「更多数据」是谷歌、Facebook 等公司的关键。
「越多数据，越多财富」——每个人
一旦你了解这些动态，具体行动就有了简单的解释。谷歌收购卫星成像公司不是因为它喜欢卫星图像；而谷歌又开放了 TensorFlow。
深度学习直接适用于这种情境：如果给定一个足够大的数据集，它能弄清楚如何获取相互影响和潜在变量。有趣的是，如果给予相同的大规模数据集，来自上世纪 80 年代的反向传播神经网络有时能与最新的技术媲美。参考论文《Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition》。所以说数据才是关键。
作为一个人工智能研究员我自己成熟的年龄是类似的。当我遇到现实世界的问题时，我学会了如何吞下我的骄傲，放弃「炫酷」的算法，仅仅满足能够解决手头上问题，并学会了热爱数据和规模。我们将重心从自动化的创意设计转向了「无聊」的参数优化；同时当用户要求我们从 10 个变量增加到 1000 和变量时，我们在匆忙应对中变得不那么无聊——我的第一家公司 ADA（1998–2004）的情况就是这样。我们将重心从华丽的建模方法转移到超级简单但可完全扩展的机器学习算法（如 FFX）；当用户要求从 100 个变量增加到 100000 个，从 100 亿蒙特卡洛样本增加到 10 亿（有效样本），我们同样不无聊——这发生在我的第二家公司 Solido（2004—至今）。即使是我第三家也是目前的公司的产品 BigchainDB，也体现了对规模的需要（2013—至今）。扩展功能，扩大规模。
机会 1：数据共享→更好的模型
总之：去中心化/共享控制能促进数据共享，这反过来又带来更好的模型、更高的利润/更低的成本/等。阐述如下：
人工智能热衷数据。数据越多，模型越好。然而，数据往往是孤立的，尤其是在这个新世界里，数据可能是难以逾越的鸿沟。
但是如果有足够的正面效益，区块链鼓励传统的独立体间数据共享。区块链的去中心化本质鼓励数据共享：如果没有单一的实体控制存储数据的基础设施，共享就会有更少的冲突。之后我会举出更多好处。
数据共享可能发生在一个企业中（如在区域办公室）、一个生态系统内（如一个「财团」数据库）或整个星球（例如共享行星数据库，即公开区块链）。
下面给出了每个对应的例子：
企业内：使用区块链技术来合并来自不同区域办公室的数据，因为它能降低企业审核自己数据的成本，并和审计员共享数据。随着新的数据到位，企业可以建立人工智能模型，例如，相比以前只建立在区域办公室水平的模型，新模型能更好地预测客户流失的模型。每个区域办公室的「数据集市」？
生态系统内：竞争对手（例如，银行或唱片公司）过去永远不会分享他们的数据。但现在可能坦率地展示，结合几个银行的数据，可以做更好的模型以预防信用卡欺诈。或者供应链机构通过区块链共享数据，对供应链中更早地数据使用人工智能，可以更好地确定在供应链中导致失败的根本原因。例如，大肠杆菌的菌株究竟出现在哪里？
在整个星球范围内（公共区块链数据库）：考虑不同生态系统之间的数据共享（例如能源使用数据+汽车零部件供应链数据）；或个人参与者在一个行星尺度的生态系统（如网络）。更多的数据来源可以改善模型。例如，在中国一些工厂能源使用量的峰值可能与非法汽车零部件花了一天在市场运输有关。总的来说，我们看到公司汇总数据，进行洗白，重新包装并出售的行径；从 Bloomberg 终端到几十（或几百个）初创企业通过 http APIs 销售数据。我在稍后阐述这一未来。
敌人们共享他们的数据来喂养一个人工智能。2016 多么有趣！
机会 2：数据共享→新模型
在某些情况下，当独立的数据被合并，你不只是得到一个更好的数据集，还得到一个新的数据集。这能带来全新的模型，从中你可以收集新的见解、进行新的业务应用。也就是说，你可以做一些你以前不能做的事情。
这里有一个用于识别钻石欺诈例子。如果你是一家提供钻石保险的银行，你想开发一个识别钻石是否欺诈的分类器。在地球上有四个值得信赖的钻石认证实验室（当然取决于你问谁）。如果你只能访问其中一个实验室的钻石数据，那么你就看不到其他三家的数据，你的分类器可能很容易把其他家的钻石标记为欺诈（见下图，左）。你的误报率会使你的系统不可用。
相反如果区块链促进四个认证实验室共享他们的数据，你就有所有的合法数据，从利用它们你将建立一个分类器（右下）。任何输入的钻石，例如在 eBay 上看到，将遍历系统，并与分类器中的每一类进行比较。该分类器可以检测真实的欺诈行为，避免误报，从而降低误报率，使保险供应商和认证实验室受益。这可以简单地作为一个查找框，即不需要人工智能。但使用人工智能进一步提高了它，例如基于颜色、克拉预测价格，然后用「价格和价值的接近程度」作为主要欺诈分类器的输入。
这里的第二个例子是，去中心化系统中的一个适当的 token 激励机制（token-incentive scheme）可以激励先前未标记的数据集得到标记，或者是以一个更经济的方式进行标记。这基本上就是去中心化的 Mechanical Turk（亚马逊的众包服务平台）。有了新标签，我们就得到了新数据集；我们使用新数据集进行训练以获得新模型。第三个例子是，token 激励机制可能会导致来自物联网设备的直接数据输入。这些设备控制数据并可以将其交换为资产，比如能源。同样地，这个新数据可能会带来新模型。
囤积 vs 分享？此处的两个相反动机之间有一个紧张关系。一个是囤积数据——即「数据是新护城河」的观点；另一个是共享数据，为了得到更好的/新的模式。分享行为必须要有一个超过「护城河」效益的足够驱动力。技术驱动力是得到更好的模式或新的模式，但这个驱动力必须要有商业价值。可能带来的利益包括降低原材料或供应链中的保险储蓄诈骗；将 Mechanical Turk 作为赚钱副业；数据/模型交换；或是对抗强大的核心玩家的集体行动，就像唱片公司合力对抗苹果的 iTunes 一样，等等；它需要创造性的商业策略。
中心化 vs 去中心化？即使一些组织选择分享数据，他们也可以在无需区块链技术的情况下这样做。例如，他们可以简单地将其囤入 S3 实例中并提供出 API。但在某些情况下，去中心化带来了新的好处。首先是基础设施的直接共享，这样共享联盟中的任一组织就不会自己控制所有的「共享数据」。（这在几年前是一个主要的障碍，那时唱片公司尝试过为一个公共注册系统而合作。）另一个好处是让数据 & 模型转变为资产变得更加容易，然后这样可以进行外部授权以获利。我下文会详细阐述这一点。
如前所述，数据 & 模型共享会发生在三个层次：在一家企业内部（跨国公司的情况比你想象的要难）；在一个生态系统或联合体中；或在这个星球中（相当于成为一个公用事业）。让我们更深入地探索这个行星尺度的分享吧。
机会 2A：行星层次的新数据 → 行星层次的新见解
整个星球层面的数据共享可能是最有趣的。让我们进一步深入这个问题。
IPDB 是全球范围的结构化数据，而不是零碎的。将万维网视为互联网上的文件系统；IPDB 是其数据库副本。（我认为我们没有看到更多相关工作的原因，在于语义上的 Web 工作试图以升级文件系统的角度去实现它。但通过「升级」文件系统来建立数据库是相当困难的！如果从一开始就说你正在建立一个数据库并设计它之类的话，这样更有效果。）「全局变量（Global variable）」会得到更加字面上的解释 : )（注：global 也有「全球」的意思）
那么，当我们有一个行星尺度的、像 IPDB 那样的数据库共享服务，或是怎样一番景象？我们有几个参考点。
第一个参考点是，在企业界的公共数据管理与重新包装使其更易被消费方面，从简单的天气或网络时间的 API，到股票和货币之类的金融数据 API，最近已经有一个十亿美元的市场了。想象一下，所有这些数据都可通过一个单一的数据库以一种类似的结构化方式（即使只是一个 API 的通行证）进行访问。就好像有了 1000 个彭博社。不用担心受制于某个单一的实体。
第二个参考点来自于区块链，即通过一个区块链来「oraclize」外部数据使其易于消费的概念。但我们可以 oraclize 一切。去中心化的彭博社只是开始。
总体而言，我们得到了数据集与数据源多样性的一个全新规模。因此从性质上讲，我们有了新数据。行星层次的结构化数据。由此从性质上讲，我们可以建立新的模型，使得之前没有联系的输入 & 输出之间产生关联。有了模型，我们将获得性质上的新见解。
我希望此处可以说得更具体一些，但是它太新了，我想不出任何例子。不过，它们会出现的！
还会有一个 Bot 角度的。我们一直假定区块链 API 的主要消费者会是人类。但如果是机器呢？现代 DNS 的创造者 David Holtzman 最近说，「IPDB 是人工智能的饲料（kibbles）」。分析一下，这是由于 IPDB 实现并鼓励了行星层次的数据共享，而人工智能实在是很喜欢吃数据。
机会 3：数据 & 模型中的审计跟踪使预测结果更加值得信赖
此应用针对的是这样一个事实：如果你使用垃圾数据进行训练，那么你将得到一个垃圾模型。数据测试同理：垃圾进，垃圾出。
垃圾可能来自于恶意行事者/可能篡改了数据的拜占庭式故障。想一下大众汽车的排放丑闻。垃圾也可能来自于无恶意的演员/崩溃式故障，例如有缺陷的物联网传感器、一个出错的输入数据，或是环境辐射引起的一点波动（没有良好的纠错行为）。
你怎么知道 X / y 训练数据没有缺陷？现场使用呢，在现场输入的数据上运行模型的情况？那么模型预测（yhat）呢？简而言之：进入模型以及来自模型的数据都经历了什么？数据也要名誉。
区块链技术可以给以帮助。下面讲具体做法。在过程的每一步中都建立模型，并在该领域运行模型，该数据的创造者可以简单地为模型加上区块链数据库的时间戳，包括数字签字以声明「我相信这一点上的此数据/模型是没问题的」。再具体一点就是…
建模来源：
传感器数据（包括物联网）。你相信你的物联网传感器对你说的话吗？
训练输入/输出（X / y）数据。
建模本身，比如你可以使用可信执行（Trusted execution）基础设施，或是进行复核计算的 TrueBit 式的市场。至少有建模型收敛曲线的建模证据（例如 nmse* *vs. epoch）。
模型本身。
测试过程/该领域中的来源：
测试输入（X）数据。
模型仿真。可信执行、TrueBit 等。
测试输出（yhat）数据。
我们可以在模型的建立与应用过程中得到其来源。其结果是更可信的人工智能训练数据 & 模型。我们还可以拥有这样的连锁结构。模型的模型，就像在半导体电路设计中那样一直到底。现在，一切都有出处了。
好处包括：
（在最广泛的意义上）捕捉所有层次上的数据供应链中的漏洞。例如你可以判断传感器是否在说谎。
你知道数据和模型的来历，并且是以密码验证的方式。
您可以在数据供应链中发现漏洞。这样一来，如果发生错误，我们能更好地了解其位置以及如何应对。你可以将其当做银行式的和解，不过针对的是人工智能模型。
数据有了名誉，因为多双眼睛都可以检查那个源，并甚至声称自己的数据判断如何有效。相应地，模型也有了声誉。
机会 4：训练数据 & 模型全球共享注册系统
但是如果我们有一个可以方便管理另一个数据集或数据馈送（免费或其他）的全球数据库呢？这包括一系列出自各种机器学习比赛的 Kaggle 数据集、斯坦福 ImageNet 数据集及其他不计其数的数据集。
这正是 IPDB 可以做到的。人们可以提交数据集并使用其他人的数据。数据本身会在一个去中心化的文件系统中，就像 IPFS ；而元数据（及数据指针本身）将会在 IPDB 中。我们会获得一个人工智能数据集的全局共享空间。这有助于实现打造数据开放社区的梦想。
我们无需停留在数据集层面；我们也可以包括从这些数据集中建立起来的模型。抓取和运行他人的模型并提交自己的模型应该很容易。一个全球性的数据库可以大大方便这一过程。我们可以得到行星所拥有的模型。
机会 5：作为 IP 资产的数据 & 模型→数据 & 模型交换
让我们基于训练数据和模型的「全局共享注册系统」这一应用。数据 & 模型可以成为公共共享内容的一部分。但它们也可以进行购买与出售！
数据和人工智能模型可以被用来作为知识产权（IP）资产，因为它们受到版权法的保护。这意味着：
如果你创建了数据或模型就可以要版权。无论你是否想进行任何商业行为。
如果你拥有数据或模型的版权，那么你可以将使用权限授权给其他人。例如，你可以将你的数据授权给其他人来构建他们自己的模型。或者你可以将你的模型授权给其他人并计入他们的移动应用程序。次级授权、次次级授权等也是可能的。当然你也可以从他人那里获得数据或模型授权。
我认为能够拥有一个人工智能模型的版权并进行授权，这是相当棒的。数据已被公认为是一个潜在的巨大市场；模型会紧跟其上。在区块链技术之前是可以对数据 & 模型宣称版权与许可的。相关法律的出台已经有一段时间了。但区块链技术使它变得更好，因为：
版权声明提供了一张防篡改的全球公共注册表；你的版权声明是数字化/加密了的签名。此注册表也可以包括数据 & 模型。
对于你的授权交易，它也提供了一张防篡改的全球公共注册表。这次不仅仅是数字签名；相反除非你有私钥，否则你甚至不能转让权利。权利转移是作为一个区块链式的资产转换进行的。
在我 2013 年致力于使用 ascribe 来帮助数字艺术家们获得报酬的过程中，区块链上的 IP 与我心心相映。最初的方法有规模和许可灵活度的上的问题。现在这些都已经被克服，我最近写的相关文章有谈到这点（https://medium.com/ipdb-blog/a-decentralized-content-registry-for-the-decentralized-web-99cf1335291f#.v3jl6f9om）。这项技术包括：
Coala IP 是一个灵活的、区块链友好的 IP 协议。
IPDB（及 BigchainDB）是一个公共的区块链共享数据库，用来存储权利信息及其他网络规模的元数据。
IPFS +物理存储（比如 Storj 或 Filecoin）是一个去中心化的文件系统，用来存储大数据 & 模型斑点。
有了这个，我们就有了数据与模型作为 IP 资产。
例如使用 ascribe 时，我声明了于几年前建立的一个人工智能模型的版权。该人工智能模型是一个决定使用哪种模拟电路拓扑的 CART（决策树）。这是它的密码防伪证书（Certificate of Authenticity /COA）。
一旦我们有了数据和模型作为资产，我们就可以开始进行资产交换。
一次交换可以是中心化的，像 DatastreamX 处理数据那样。但到目前为止，它们确实只能使用公共数据源，因为很多企业觉得分享的风险比效益要多。
那么去中心化的数据 & 模型交换呢？对「交换」过程中所共享的数据进行去中心化，这样做有新的好处。去中心化过程没有一个单一的实体去控制数据存储基础设施，也没有谁拥有什么的分类账本，如前所述，这更易于组织合作或数据共享。比如用于 Deep Nets 的 OpenBazaar。
有了这样一个去中心化的交换，我们会看到一个真正的开放数据市场的出现。这实现了数据与人工智能团体间的（包括你的）长期以来的一个梦想。
当然在这些交换之上也会产生一些基于人工智能算法的交易：用人工智能算法购买人工智能模型。人工智能交易算法甚至会变成这个样子：购买算法来交易人工智能模型，然后自己进行更新！
机会 5A：在上游控制你的数据 & 模型
这是之前应用的重复。在你登录 Facebook 时就授予了它非常具体的权利，包括对你输入进其系统中的任何数据的处置权限。它会对你的个人资料施加许可。
当一个音乐家用一个标签来签名时，他们就是在授予标签非常具体的权利：编辑音乐、分发音乐等等。（通常该标签会试图攫取所有版权，这个任务非常繁重，但那是另一回事了！）
人工智能数据和人工智能模型也同理。当你创建可用于建模的数据以及创建模型本身时，你可以预先指定许可从而在上游限制其他人的使用权限。
对于所有用例，从个人资料到音乐、从人工智能数据到人工智能模型，区块链技术使这个过程变得更加容易。在区块链数据库中，你是将权限作为资产，例如一个读取权限或查看某条数据/模型的权利。你作为权利持有人可以将这些作为资产的权限转让给系统中的其他人，类似于比特币的转让：创建转让交易并用你的私人密钥签名。
有了这个，你就有可以更好地从上游控制你的人工智能训练数据、你的人工智能模型等等。「例如，你可以将这些数据进行混合却不能进行深入学习。」
这和 DeepMind 在其医疗保健区块链项目（healthcare blockchain project）中所采用的部分战略有点像。在数据挖掘中，医疗数据会带来监管和反垄断问题的风险（尤其是在欧洲）。但如果用户可以真正拥有自己的医疗数据并控制其上游使用，那么 DeepMind 就可以仅仅告诉消费者和监管机构说「嘿，实际上客户拥有自己的数据，我们只是拿来用而已」。我的朋友 Lawrence Lundy 提供了这个好例子，然后他进一步推断：
完全可能的是，政府会允许数据私有（人类或 AGI）的唯一方式是一个数据共享基础设施，「网络中立」规则，就像 AT&T 公司和原始的那种电话线。在这个意义上，越来越多的自主人工智能会要求政府接受区块链及其他数据共享基础设施，从而实现长远的可持续性。- Lawrence Lundy
机会 6：人工智能去中心化自治组织（Decentralized Autonomous Organization/DAO）——可以积累财富且无法关闭的人工智能
这是一个谎言。一个 AI DAO 属于人工智能自身，你无法关闭它。我下文会总结「如何做」。感兴趣的读者可以继续阅读深入该话题。
到目前为止，我们谈论了区块链作为去中心化数据库的内容。但我们也可以去中心化处理过程：基本上就是一个状态机的存储状态。周围有一些基础设施的话做起来更容易，而那就是「智能合同（smart contracts）」技术（比如 Ethereum）的本质。
我们之前已经以计算机病毒的形式进行了过程去中心化。没有单个实体拥有或控制它们，而且你不能将其关闭。但它们有限制——它们主要是会试图攻破你的计算机，就是这些。
但是，如果你可以与过程进行更丰富的互动，且过程本身可以积累财富呢？目前，通过在过程中使用更好的 API（如智能合同语言）和去中心化价值储存（如公共区块链）就可以实现它。
一个 DAO 是一个体现这些特征的过程。其代码可以拥有自己的东西。
是什么把我们带向了人工智能。最有可能的是被称为「人工通用智能」（Artificial General Intelligence/AGI）的人工智能子领域。AGI 和环境中的交互的自主代理有关。AGI 可以被模型化为一个反馈控制系统。这是个好消息，因为控制系统有很多优点。首先它们有深厚的数学基础，这可以追溯到 20 世纪 50 年代（Wiener 的「控制论（Cybernetics）」）。它们捕捉与世界之间的互动（驱动和传感），并（基于内部模型和外部传感器来更新状态）适应它。控制系统得到了广泛的应用。它们决定了一个简单的恒温器如何去适应目标温度。它们消除了高价耳机中的噪音。它们处于成千上万的设备的中心，从烤箱到车里的刹车装置。
人工智能社区最近对控制系统的接受程度更加热烈了。比如，它们是 AlphaGo 的关键所在。而且 AGI 本身就是控制系统。
一个 AI DAO 就是一个运行在去中心化处理 & 存储载体之上的 AGI 式控制系统。其反馈回路会自行进行继续，输入、更新状态、执行输出，循环往复地使用这些资源。
我们可以从一个人工智能入手来得到一个 AI DAO（一个 AGI 代理），并使其去中心化。或者我们可以从一个 DAO 入手并赋予其人工智能的决策能力。
人工智能获取其丢失的链接：资源。DAO 得到其丢失的链接：自主决策。正因为如此，AI DAO 的使用范围比 AI 或 DAO 本身更大。其潜在影响也是成倍的。
这里有一些应用：
一个 ArtDAO，创建自己的数字艺术并进行销售。概括地说，它可以做 3D 设计、音乐、视频甚至是整部电影。
有自我身份的自动驾驶汽车。概括地说就是之前的任何人工智能应用现在是「属于自己」的了。未来的情况或许是人类一无所有而只是向 AI DAO 租用服务。
任何注入人工智能的 DAO 应用程序。
有更多自主性的任何去中心化 SaaS 应用程序。
详情见 AI DAOs Part II . 有一些非常可怕的… https://medium.com/@trentmc0/wild-wooly-ai-daos-d1719e040956#.r6akj4ne0
总结
本文基于我个人在人工智能和区块链研究方面的经验，描述了区块链技术可以如何辅助人工智能。二者结合一处即发！区块链技术——尤其是行星尺度的——可以帮助实现人工智能和数据团体长期以来的一些梦想，并打开一些机会。
总结如下：
机器之心编译 作者： Trent Mcconaghy 
   

https://zhuanlan.zhihu.com/p/24623623

你可能感兴趣的:(区块链,(Block,Chain),区块链,人工智能,数据库,大数据)

Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
FPGA 设计中的 “Create HDL Wrapper“ 和 “Generating Output Products“ 的区别行者.................. fpga开发
CreateHDLWrapper(创建HDL包装器)目的：为顶层设计模块（通常是BlockDesign/IPIntegrator设计）创建一个HDL包装文件功能：将图形化/框图设计的BlockDesign转换为可综合的HDL代码（Verilog或VHDL）创建一个顶层模块，将所有IP核和连接实例化使用场景：当使用IPIntegrator创建BlockDesign后需要将图形化设计转换为HDL代码以
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL 知识大胖 NVIDIA GPU和大语言模型开发教程 mysql postgresql 数据库 anythingllm ollama
简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。本文将介绍如何在AnythingLLM上将Ollama与MySQL+PostgreSQL连接起来。系列文章如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI应用程序，可以执行RAG、A
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo