今天的大部分数据都是时间序列数据。 无论您是在查看 物联网数据 ,金融服务数据还是来自IT基础架构的数据,有时都会定期创建数据。 Vertica具有一整套内置分析功能,包括时间序列,地理空间,模式匹配等。 这些功能可以帮助您完成许多任务,以便对这种不同类型的数据执行分析。

时间序列

时间序列分析评估一组给定变量的值随时间的变化,并将这些值分组到一个窗口中进行分析和聚合。Vertica分析平台是一种可扩展,快速的时间序列分析解决方案。 Vertica列式特性及平台结构和分析能力的优化,使得时间序列数据可以通过排序、压缩和分区达到最佳性能。

更重要的是,Vertica提供了一些关键功能,使时间序列更易于管理和分析。 例如,Vertica提供间隙填充功能,可作为插值方案填充缺失数据点。 这是在一组离散的已知数据点范围内构建新数据点的一种方法。 平台在数据中插入非时间序列列(如通过时间片计算的分析函数结果),并将缺失的数据点添加到输出。

基于事件的窗口

基于事件的窗口函数是Vertica标准SQL分析的一部分。 这些功能简化了时间序列数据中事件的检测。 基于事件的窗口允许您将时间序列数据分解为标记重要事件的窗口。 这在财务数据中尤为重要,因为分析通常将特定事件作为其他活动的触发因素。 例如,给定股票报价的输入,只要差价(卖出价和买入价之间的差额)超过0.05美元,股票分析师就可能将输入报价放入新的组中。 如果我们将每个这样的组视为事件窗口,则窗口端点就可以由某些事件类型的出现来定义。

分析 在Vertica中受支持
地理空间 ✔
时间序列 ✔

基于事件的窗口

  • 有条件的变化
  • 条件真实
✔
活动系列加入 ✔
模式匹配 ✔

机器学习(预测)

  • 物流回归
  • 线性回归
  • SVM
✔

机器学习(分类)

  • 朴素贝叶斯
  • K均值聚类
  • 随机森林
  • SVM
✔

事件序列连接

Vertica支持典型的数据仓库查询连接。 平台还提供INTERPOLATE谓词,允许特殊类型的连接。 事件序列连接是一个Vertica SQL扩展,它允许您在测量间隔未精确对齐(如时间戳不匹配)时分析两个事件序列。 这些连接提供了一种自然而有效的方法来对非对齐数据进行直接查询,而不必将它们标准化为统一的测量间隔。

模式匹配

Vertica通过事件序列模式匹配扩展来实现对路径和模式分析的支持。 SQL MATCH扩展允许您在搜索事件模式时筛选大量历史数据。 您可以将模式指定为正则表达式,然后在输入事件序列中进行搜索。 MATCH提供了分析数据分区和排序的子句,可以在一组连续的记录上进行模式匹配。

机器学习

除时间序列分析外,组织机构还将预测分析应用在提高机器正常运行时间、减少客户流失等各个方面。借助Vertica,分析工程师现在可以利用SQL在本地创建和部署基于更大数据集的机器学习模型,而无需进行下采样以加速决策进程。

物联网挑战需要一种新的数据管理和分析方法

大数据的时间序列分析:Vertica如何帮助您从大规模的大型时间序列数据集中获得洞察力

Vertica如何帮助金融服务机构处理大数据并取得成功。