上云无忧 > 文档中心 > 天翼云数据治理中心 DataArts Studio 数据质量监控 - 查看质量报告
数据治理中心 DataArts Studio
天翼云数据治理中心 DataArts Studio 数据质量监控 - 查看质量报告

文档简介:
本章节主要介绍查看质量报告的操作。 您可以查询业务指标、数据质量中数据对象的质量评分,来判断各个对象是否质量达标。
*产品来源:中国电信天翼云。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

您可以查询业务指标、数据质量中数据对象的质量评分,来判断各个对象是否质量达标。

查询业务质量评分

质量评分的满分可设置为5分,10分,100分。默认为5分制,是以表关联的规则为基础进行评分的。而表、业务对象、主题域等不同维度的评分,本质上是基于规则评分在不同维度下的加权平均值进行计算的。

您可以查询主题域分组、主题域、业务对象、表以及表关联的规则评分,具体评分对象的计算公式,详请参见下表。

对象评分计算公式

对象 评分计算公式
规则 创建质量作业时,包含“比率”、“值率”的系统内置规则及用户自定义规则可以生成质量评分报告。
包含“比率”、“值率”的规则可以分为正向规则及反向规则,正向规则即比值越高,代表数据质量越好;反向规则即比值越高,则数据质量越差。
正向规则包含唯一值率、重复值率、合法比率规则,反向规则包含空值率规则。
正向规则评分=满足规则的数据行数/数据总行数*满分(5,10,100)。
反向规则评分=(1-满足规则的数据行数/数据总行数)*满分(5,10,100)。
当表为空,即总行数为0时,正向规则评分固定为满分,反向评分固定为0分。
表评分计算公式:∑(表关联的所有规则评分*规则权重)/∑规则权重
业务对象 业务对象下所有表评分的加权求平均值,即:∑业务对象下所有表评分/表的数量。
主题域 主题域下所有业务对象评分的加权求平均值,即:∑主题域下所有业务对象评分/业务对象的数量。
主题域分组 分组下所有主题域评分的加权求平均值,即:∑分组下所有主题域评分/主题域的数量。

1.在DataArts Studio控制台首页,选择实例,点击“进入控制台”,选择对应工作空间的“数据质量”模块,进入数据质量页面。

详见下图:选择数据质量

2.选择“数据质量监控 > 质量报告”。

3.单击“业务报告”页签,选择主题及截至日期,查询截至日期前7天的数据质量评分,如下图所示。

说明
  • 以评分满分为5分为例。其中4-5分评价为优秀,3-4分为良好,2-3分为中等,1-2分为及格,0-1分为不及格。

  • 当天质量评分数据在次日凌晨生成。

  • 质量评分历史趋势中的实线为截至日期前7天质量评分组成的连线,虚线为这7天质量评分的平均分。

  • 若一天多次运行该作业,当天的质量评分为最后一次的得分。

4.单击“表评分”列的评分值链接,展开该表关联的规则评分。

5.单击“规则评分”列的评分值链接,展开该规则关联的字段评分,如下图所示。

表关联规则评分

查看数据质量评分

质量评分的满分可设置为5分,10分,100分。默认为5分制,是以表关联的规则为基础进行评分的。而表、数据库等不同维度的评分均基于规则评分,本质上是基于规则评分在不同维度下的加权平均值进行计算的。

您可以查询所创建数据连接下数据库、数据库下的数据表以及数据表所关联规则的评分,具体评分对象的计算公式,请参见下表。

对象评分计算公式

对象 评分计算公式
规则 创建质量作业时,作业关联的规则中结果说明列包含“比率”、“值率”的系统内置规则及用户自定义规则可以生成质量评分报告。
包含“比率”、“值率”的规则可以分为正向规则及反向规则,正向规则即比值越高,代表数据质量越好;反向规则即比值越高,则数据质量越差。
正向规则包含唯一值率、重复值率、合法比率规则,反向规则包含空值率规则。
正向规则评分=满足规则的数据行数/数据总行数*满分(5,10,100)。
反向规则评分=(1-满足规则的数据行数/数据总行数)*满分(5,10,100)。
数据表 表评分计算公式:∑(表关联的所有规则评分*规则权重)/∑规则权重
数据库 数据库下所有数据表评分的加权求平均值,即:∑数据库下所有数据表评分/表的数量。

1.在DataArts Studio控制台首页,选择实例,点击“进入控制台”,选择对应工作空间的“数据质量”模块,进入数据质量页面。

选择数据质量

2.选择“数据质量监控 > 质量报告”。

3.在“技术报告”页签,选择数据连接及截至日期,查询截至日期前7天的数据质量评分,如下图所示。

选择数据连接

说明
  • 以评分满分为5分为例。其中4-5分评价为优秀,3-4分为良好,2-3分为不及格,1-2分为较差,0-1分为极差。

  • 当天质量评分数据在次日凌晨生成。

  • 质量评分历史趋势中的实线为截至日期前7天质量评分组成的连线,虚线为这7天质量评分的平均分。

  • 若一天多次运行该作业,当天的质量评分为最后一次的得分。

4.单击“表评分”列的评分值链接,展开该表关联的规则评分。

5.单击“规则评分”列的评分值链接,展开该规则关联的字段评分,如下图所示。

表关联规则评分界面

相似文档
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部