时空数据挖掘九

Towards Factorized SVM with Gaussian Kernels over Normalized Data

将机器学习(ML)技术集成到数据库系统(DB)中是一个新兴的趋势。考虑到几乎所有的ML工具包都假设ML算法的输入是一个单表,即使许多真实世界的数据集由于在DB中的规范化而存储为多个表。因此,数据科学家必须在学习机器学习模型之前执行连接操作。这种策略称为连接后学习(learning after join),通过规范化来避免冗余。在机器学习领域,支持向量机(SVM)是最标准的分类工具之一。本文主要研究归一化数据上的高斯核分解SVM。本文通过分解高斯核函数计算,提出了两种主要的SVM优化方法的分解学习方法,即梯度下降(GD)和序列最小优化(SMO)。然后,将归一化后的数据转化为矩阵,通过线性代数运算提高SVM的学习效率。在9个真实的归一化数据集上进行了广泛的实验,验证了所提出方法的有效性和可扩展性。 

Effective and Efficient Reuse of Past Travel Behavior for Route Recommendation 

随着移动对象跟踪数据的可用性越来越高,使用这些数据进行路线搜索和推荐变得越来越重要。本文提出一种新的并行拆分合并方法来实现按位置进行路线搜索(RSL-Psc)。给定一组路线,一组要访问的地点O和一个阈值θ,我们检索由(i)相似度不小于θ且(ii)包含最小数量的子路线组合组成的路线。由此产生的功能面向广泛的应用,包括路线规划和推荐、拼车和基于位置的服务

为了在海量路由数据上实现高效和有效的RSL-Psc计算,本文开发了新的搜索空间修剪技术,并使现代处理器的并行处理能力得以利用。具体地,我们开发了两种并行算法,完全拆分并行搜索(FSPS)和分组拆分并行搜索(GSPS)。 

<

你可能感兴趣的:(时空数据预测(基于图神经网络),时空轨迹数据,机器学习,支持向量机,人工智能)