最新!SQL Server 2019将结合Spark创建统一数据平台!

根据其官网最新消息,微软公布了SQL Server 2019预览版。在该预览中,SQL Server不仅通过统一图形和关系数据来进行查询,还通过R和Python模型将机器学习带入数据库。随着数据量和种类的增加,用户需要轻松地跨所有类型的数据集成和分析,SQL Server 2019的目的就在于此。

虽然很多数据库已经集成了Spark,但这对微软来说绝对是有史以来的第一次。SQL Server 2019创建了统一数据平台。其中,Apache Spark和Hadoop分布式文件系统(HDFS)与SQL Server一起打包为集成解决方案,通过增加大数据集群能力,SQL Server 2019提供了令人难以置信的数据库管理功能扩展,进一步重新定义了SQL Server,完全超越了传统的关系型数据库。与其他版本一样,SQL Server 2019通过智能查询处理,数据合规性工具和对持久性内存的支持,继续为工作负载突破安全性,可用性和性能界限。SQL Server 2019可以承担任何数据项目,从传统的SQL Server工作负载(如OLTP,数据仓库和BI)到AI和高级数据分析。

SQL Server提供了一个真正的混合平台,具有从数据中心到公有云的一致表示,使其易于在任何位置运行。由于SQL Server 2019大数据集群作为Kubernetes上的容器部署并具有内置管理服务,因此用户可以在本地和云上的各种支持平台获得一致的管理和部署体验:OpenShift或Kubernetes, Azure Kubernetes服务(AKS),Azure Stack(在AKS上)和Azure上的OpenShift。借助Azure Hybrid Benefit许可证和可移植性,用户可以选择在本地或Azure中运行SQL Server工作负载,而成本只是其他云提供商的一小部分。

SQL Server——对所有数据的洞察能力

SQL Server将继续开源,从SQL Server 2017支持Linux和容器到SQL Server 2019拥抱Spark和HDFS进而带来统一的数据平台体验。使用SQL Server 2019,数据分析所需组件都将内置在托管集群中,托管集群易于部署且可根据业务需求扩展。HDFS,Spark,Knox,Ranger,Livy与SQL Server一起打包,快速轻松地部署为Kubernetes上的Linux容器。SQL Server通过消除结构化数据和非结构化数据之间存在的障碍,简化对所有企业数据的管理。

以下是打破数据实现洞察力的障碍,在整个企业中提供的数据视图:

  最新!SQL Server 2019将结合Spark创建统一数据平台!_第1张图片

  • 简化SQL Server用户的大数据分析。SQL Server 2019使管理大数据环境变得更加容易,提供了创建数据湖所需的一切,包括HDFS和Spark,都与SQL Server深度集成,并得到微软的全面支持。现在,用户可以在结构化和非结构化数据上运行应用程序,分析和使用AI能力,用户可使用熟悉的T-SQL查询,熟悉Spark也可以使用Python、R、Scala或Java运行Spark作业以进行数据准备或分析,所有这些都集成在同一个集群中。

  • 用户可自选喜欢的工具,为数据分析师和工程师提供所有数据(结构化和非结构化)的单一来源。使用SQL Server 2019,数据科学家可以通过Spark作业轻松分析SQL Server和HDFS中的数据。分析师可以使用SQL Server机器学习服务对大数据运行高级分析:在Hadoop中训练大型数据集并在SQL Server中操作。数据科学家可以在Azure Data Studio扩展中使用在Jupyter notebook引擎上运行的全新notebook体验,以交互方式执行数据的高级分析,并轻松与他人共享分析。

  • 利用数据虚拟化打破数据孤岛并在所有数据中提供统一视图。从SQL Server 2016开始,PolyBase能够在SQL Server中运行T-SQL查询,从数据湖中提取数据并以结构化格式返回,所有这些都无需移动或复制数据。现在,在SQL Server 2019中,我们正在将数据虚拟化的概念扩展到其他数据源,包括Oracle,Teradata,MongoDB,PostgreSQL等。使用新的PolyBase,我们可以使用虚拟化分解数据孤岛并轻松组合多个来源的数据,从而避免数据移动和复制所产生的时间,精力,安全风险和重复数据。新的可弹性扩展的“数据池”和“计算池”通过缓存数据和跨SQL Server多实例分发查询执行,可以快速查询虚拟化数据。

“从一开始,Sloan Digital Sky Survey数据库就在SQL Server上运行,而SQL Server也存储了对象目录。我们很高兴SQL Server 2019实现了当初对大数据集群的承诺,这将使我们能够增强该数据库以包括所有大数据集。SQL Server 2019的分布式特性使我们能够扩展新型仿真和下一代天文测量,数据集高达10PB或更多,远远超出我们当前数据库解决方案的限制。“ - Gerard Lemson博士 ,约翰斯·霍普金斯大学Data Intensive Engineering and Science。

增强的性能,安全性和可用性

SQL Server 2019引擎将在关键任务性能,安全性,合规性,数据库可用性,Linux上的SQL Server和容器,通用引擎方面提供新的增强功能。

性能提升 - 智能数据库

  • 智能查询处理系列功能基于SQL Server 2017中的自适应查询处理,包括行模式内存反馈,近似COUNT DISTINCT,行存储上的批处理模式和表变量延迟编译。

  • 此版本中的持久化内存支持得到改进,新的I/O优化路径可用于与持久性内存存储交互。

  • 现在,默认情况下启用轻量级查询分析基础结构,以便随时随地为每个查询运算符提供统计信息。

高级安全性 - 加密计算

  • 使用安全区域进行加密扩展了SQL Server 2016中引入的客户端加密技术。安全区域保护数据库内硬件或软件创建的安全区中的敏感数据,使其免受恶意软件和特权用户的攻击,同时对加密数据启用高级操作。

  • SQL数据发现和分类内置于SQL Server引擎中,具有新的元数据和审计支持,可帮助满足GDPR和其他合规性需求。

  • 使用SQL Server配置管理器可以更轻松地进行认证管理。

关键任务可用性 - 高可用

  • 在可用性方面增强,包括基于读/写意图自动重定向到主服务器的连接。

  • 可以使用Kubernetes的Always On Availability Groups启用在容器中运行的SQL Server高可用性配置。

  • Resumable在线索引支持创建操作并包括数据库作用域默认值。

开发

  • SQLGraph的增强功能包括对T-SQL MERGE和边缘约束的匹配支持。

  • 新的UTF-8支持使用户能够减少SQL Server字符数据存储空间。

  • 新的Java语言扩展允许调用预编译Java程序,并使用SQL Server在同一服务器上安全执行Java代码。通过使工作负载更接近数据实际所需空间,减少移动数据的需求并提高应用程序性能。

  • MachineLearning Services具有多项增强功能,包括Windows故障转移集群支持,分区模型以及Linux上对SQL Server的支持。

平台选择

  • Linux上的SQL Server附加功能包括分布式事务、复制、Polybase、机器学习服务、内存通知和OpenLDAP支持。

  • 容器具有新的增强功能,包括使用支持RedHat Enterprise Linux映像的新Microsoft Container Registry和支持Kubernetes的Always On Availability Groups。

Azure Data Studio中的SQL Server 2019支持

SQL Server扩展了对更多数据工作负载的支持,由于微软已经与其数据平台用户合作,我们可以看到许多不同于以前的角色:数据库管理员,数据科学家,数据开发人员,数据分析师和其他正在被定义的新角色。这些用户越来越希望使用相同的工具,无缝跨内部部署和云的使用结构和非结构化数据,使用OLTP、ETL分析和流式工作负载协同工作。

Azure Data Studio提供现代编辑器体验,具有闪电般的智能感知,源代码控制和终端集成。它以数据平台用户为设计理念,内置查询结果图表,集成notebook和可自定义仪表板。目前,Azure Data Studio内置对SQL Server内部部署和Azure SQL数据库的支持,以及对Azure SQL托管实例和Azure SQL数据仓库的预览支持。

Azure Data Studio发布了一个新的SQL Server 2019预览扩展,以添加对选定SQL Server 2019功能的支持。该扩展为SQL Server大数据集群提供连接和工具,包括预览SQL Server工具的首个notebook体验,以及新的PolyBase创建外部表向导,使远程SQL Server和Oracle实例数据可轻松快速访问。

如何获取最新版?

通过访问以下链接可立即开始:

  • 预览适用于Windows,Linux或Docker的SQL Server 2019。(https://www.microsoft.com/en-us/sql-server/sql-server-2019)

  • 注册以便从SQL Server中获取对项目的建议和支持,或者尝试使用SQL Server 2019大数据集群。(https://sqlservervnexteap.azurewebsites.net/)

  • 下载Azure Data Studio以开始使用新的SQL Server大数据功能,如数据虚拟化。(https://docs.microsoft.com/zh-cn/sql/azure-data-studio/what-is?view=sql-server-2017)


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31077337/viewspace-2214805/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/31077337/viewspace-2214805/

你可能感兴趣的:(最新!SQL Server 2019将结合Spark创建统一数据平台!)