基于数据的决策:使用数据库内机器学习预测未来

在短短几年内,机器学习 (ML) 已成为公司在其业务的几乎所有方面部署的一项基本技术。ML 市场以前是财力雄厚的大型机构的领地,现在正在迅速开放。现在,每种业务都可以利用 ML 来最大程度地减少重复的手动流程、自动化决策制定和预测未来趋势。在任何业务任务的几乎每个阶段,机器学习都在使流程更智能、更精简、更快速。 

近年来,技术进步通过减少获得 ML 驱动的预测所需的时间、技能水平和步骤数,帮助使访问民主化并推动 ML 的采用。增长如此之快,以至于全球 ML 市场预计将从 2022 年的 210 亿美元扩大到 2029 年的 2090 亿美元。声明式 ML 和 AutoML 等工具正在帮助企业获得强大的业务关键型预测分析。将这些方法更进一步,数据库内 ML 是一项正在取得进展的新技术。它允许企业轻松地对其数据提出问题,并使用标准 SQL 查询快速获得答案。

01

什么是数据库内 ML?

传统上,构建 ML 模型一直是一项技术含量高、耗时长、资源密集型的工作。ML 计划的典型时间框架以月为单位。项目花费超过六个月的时间并不少见,其中有相当多的时间用于从数据库中提取、清理和准备数据。 

相比之下,数据库内 ML 将分析带入数据库,使企业能够获得您期望从传统的、完全定制的 ML 模型获得的洞察力,但有一些重要的区别。数据库内 ML 可以更快地(几天或几周,而不是几个月)获得这些结果,因为数据永远不需要离开数据库。另一个区别是数据库内建模是使用常规的现有数据库技能(如 SQL)完成的,这使得更广泛的 IT 团队更容易处理。 

基于数据的决策:使用数据库内机器学习预测未来_第1张图片

虽然是一个相对较新的领域,但它现在是 ML 中 GitHub star 认可增长最快的部分。事实上,现在所有主要数据库供应商、ML 框架、BI 工具和笔记本都有数据库内 ML 集成。 

02

企业如何使用数据库内 ML?

从人力资源到市场营销到销售再到生产的每个业务领域都有用例,数据库中得出的预测正在帮助公司磨练客户体验,改进产品个性化,优化客户生命周期价值,提高员工保留率,更准确地评估风险,并提高工作场所生产力。 

举一个生产力软件领域的例子:Rize 是一种智能时间跟踪器,可以提高用户的工作效率和工作效率,它使用数据库内 ML 开发了一项强大的功能,以响应用户在几周内的反馈。由此产生的能力——由 ML 生成的洞察力驱动——提高了客户保留率和转化率。它还帮助 Rize 在竞争激烈的市场中脱颖而出,巩固了其作为真正智能时间跟踪器的地位。 

03

数据库内 ML 重塑行业的速度和规模

尽管这些用例中的许多用例无论在哪个行业或地点都能使企业受益,但特定的行业应用正在不断涌现,它们可以实时提供未来洞察力,其设置成本仅为传统 ML 算法的一小部分,并开始颠覆这些市场中的现有价值链。

金融部门- 一个快速实施传统 ML 建模的行业 - 现在正在转向数据库内建模以提高敏捷性。金融服务和金融科技公司正在使用数据库内机器学习来检测欺诈、帮助收回贷款、提高信用评分和批准贷款。因此,他们能够更快地对市场状况做出反应,调整他们提供的服务,甚至开辟新的收入来源。 

例如,下一代多户租金支付处理平台 Domuso 使用数据库内 ML 每年可节省 500,000 美元。Domuso 训练并部署了一个数据库内 ML 模型,以准确预测是否可能因资金不足而退还租金。“通过数据库内 ML,我们可以更快、更复杂地实施高级模型,”时任 Domuso 产品和运营执行副总裁的 Sameer Nayyar 说。“它对我们的业务产生了积极影响。我们在两个月内减少了 95,000 美元的退单,并在第一年节省了 500,000 美元。” 此外,随着新用例的出现,Domuso 现在能够在几周而不是几个月内创建和实施新的 ML 模型。

零售、快速消费品和食品生产等行业已经迅速实现了数据库内建模的实时预测,帮助他们通过“及时”和特定位置的报价来响应市场状况。管理库存、预测特定项目的需求、优化人员配备水平和预测未来定价只是零售和其他企业如何转向数据库内 ML 算法来应对日常挑战的几个例子。 

以 Journey Foods 为例,这是一个用于食品开发和创新的供应链和食品科学软件平台,它使用数据库内 ML 来应对不断变化的原料价格的挑战。他们希望利用其包含 22,000 家供应商的 130,000 种食品成分的数据库,预测其客户在 1、3、6 和 12 个月后的食品成本。由于配料和供应商总是在变化,他们担心映射这些复杂的“多对多”关系所需的预测分析将需要大量时间来建立,并且需要持续维护和重新培训。Journey Foods 转向在数据库 ML 中开发其成本预测模型,从而对食品成分进行高精度预测。

04

提高业务敏捷性和创新

还有更多特定于行业的例子,但推动这一快速发展的开源运动的共同因素是速度和规模。数据库内 ML 使复杂的预测分析可用于任何拥有数据库的企业。 

基于数据的决策:使用数据库内机器学习预测未来_第2张图片

例如,在最近的开源数据库内 ML 黑客马拉松 Hacktoberfest 上,不断壮大的数据库内 ML 程序员社区恰当地展示了创新的潜力。在活动期间,团队提交了 20 多个新的数据库处理程序——包括与 Apache Impala 和 Solr、PlanetScale 和 Teradata 的连接,以及 10 多个新的机器学习处理程序——包括 PyCaret、Ray Server 和 Salesforce。

数据库内分析仍处于早期阶段。就像更广泛的人工智能行业一样,机器学习领域对炒作并不陌生。然而,随着对复杂问题的快速解答不再只是理论上可行,而是各种规模和预算的企业在短期内都可以实现,数据库内 ML 值得认真考虑。通过缩短构建模型所需的时间并使没有数据科学背景的人员能够运行项目,它大大降低了与预测分析相关的成本。基于数据的决策为企业提供了一种可行的替代传统 ML 技术的方法:完全可定制的速度和规模预测能力。

原文章来源:https://dzone.com/articles/data-based-decision-making-predicting-the-future-u

你可能感兴趣的:(数据库,人工智能)