数据模型管理

更新时间:2018-01-31 16:30:32

概述

在为开发者提供的数据开发工具中,数据模型管理用于提供大数据计算服务,帮助开发者实现对实时数据秒级别的计算,同时为帮助实现大量历史数据分析和挖掘,提供离线数据周期性统计计算服务,且以可视化操作的功能来减低开发成本,使得开发者能够简单快速的实现实时数据模型搭建和离线分析性模型搭建。

模型相关名称解释

名词 解释
主表 模型所依赖产生约束的核心表
关联表 与主表关联表
维度 是指对象的描述性属性或特征,例如设备的产品类型,在模型中可按一个维度进行计算和统计
度量 是指按统一单位衡量的计量,在模型中指构建可以参与计算的值

模型查询

开发者可根据模型名称进行模糊查询;同时支持按模型类型和状态进行筛选。

针对每个模型,可根据状态进行不同的操作,如预跑模型、发布模型、撤回模型、复制模型等。

image.png | center | 704x305

模型预跑

模型的预跑是指模型在未发布前,进行试运行,以排除模型建立是否合理,是否有模型依赖的问题和风险。目前只有离线模型可进行模型预跑。关于模型预跑需注意以下几点:

-当启动模型预跑后,预跑需要一段时间,所以预跑状态需通过页面刷新来获取;

-如果预跑成功,可以预览结果,状态变成待发布;如果预跑失败,显示失败原因,可以再次预跑或重新编辑;

-预跑需要所有离线表都有数据,否则会预跑失败,所以在预跑时需关注模型中的相关表是否正常有数据。

模型发布

模型发布才意味着该模型进行提交正式运行,所以只有“待发布”状态的模型可以进行发布操作。发布成功之后,后台会生成调度任务定期调度,实时模型是实时调度,离线模型按天级别进行调度。调度的开始时间是在模型中设置的周期性启动时间。

模型同步

模型的创建在开发环境中进行,当模型在开发环境中被验证成功后,那么开发者可将此模型发布到生产环境中,以供正式环境使用。
在模型同步时,需关注:

  • “已发布”状态的模型可以同步到生产环境

  • 发布时,要求模型依赖的数据表在生产和开发环境完全一致,如生产环境没有模型依赖的表,需要先将依赖的表同步到生产环境中。

模型生产环境管理

模型同步到生产环境后,可进行如下操作,在生产环境模型不能被编辑:

  • 发布:对于撤回状态的模型可以再次发布

  • 撤回:对于发布状态的模型可以撤回

  • 查看运行记录:点击之后可以看历史的运行记录

image.png | center | 704x249

image.png | center | 704x306

results matching ""

    No results matching ""