上虞第一城市门户欢迎您!   手机上虞广播网

数据留痕的两种使用场景

来源:上虞门户网  2022-01-25 17:02

编辑导语:数据在变动之后有可能留下痕迹,此时这类痕迹就称为“数据留痕”。而数据留痕在一定程度上可以帮助业务人员寻找易混淆的信息,寻找数据可能出错的起点。本篇文章里,作者就对数据留痕的定义和场景做了解读,一起来看一下。

一、背景

医学科研中,原始数据经过解析,完成数据的首次填充。然后经过多轮校验和修改,最终形成高准确度的数据。但是数据演进的过程越长,出现错误的概率也就越大。使用错误数据进行科研,科研结果的准确性就会受到影响。

当数据出现问题时,由于没有记录数据演进过程,所以无法了解数据是“何人何时修改了何种信息”,缺少了寻找错误的起点。

例如,数据库中记录患者李明的“就诊年龄=61岁”,但是医生通过其他资料查询,认为就诊年龄应该是59岁。由于没有记录中间演进过程,所以不知道是什么原因产生了这种差异。也不知道是谁因为什么修改的这个数据。

其实,数据的演进过程是这样的。其中“61岁”是通过身份证号和当时的就诊日期自动计算出来的。后面经过数据核查,“李明的身份证年龄比实际年龄小2岁”,于是修改李明的“就诊年龄=59岁”。

上述案例中,“就诊年龄=61岁”,“就诊年龄=59岁”是数据的痕迹。“由身份证号和就诊日期计算所得”“身份证年龄比实际年龄小2岁”是数据修改的原因。

由于缺乏数据修改记录和数据修改原因,这种情况下可能会产生两个后果。

  1. 医生手动将61岁修改为59岁。原本正确的数据,被修改错误。如果筛选年龄介于18-60的患者。该患者就会被误选进入研究样本中,对研究结果产生干扰。
  2. 医生无法确定哪个数据准确,为了保证数据的准确性,则不适用该数据。那么研究的样本中就会少一例。当可供研究的样本数量较少时,减少一个研究样本就少了一份可用数据。

如果系统记录了数据修改记录和数据修改原因,了解“就诊年龄”字段的演进过程,就可以根据科研需求,决定是否使用该患者数据。

这就是我们今天讨论的话题,数据留痕。

二、数据留痕

指的是记录数据的每一次变动,让每一次数据变化都留下痕迹。一条留痕记录包括两部分内容,变动信息和变动原因。

变动信息,指的是用户在提交数据时,提交后的数据相较于提交前上一次数据,发生变动的地方。主要数据有变动变量、变动前的结果(原值)、变动后结果(现值)、变动时间、修改人。变动信息具备事实性,能够准确的反应数据发生变动时的场景。

变动原因,指的是产生本次数据修改的原因。该部分信息是由用户手动填写完成,在数据提交时由系统记录的。数据的信息量大,价值高。主观性较强,准确性无法保证。

举例:

在表单“基本信息”中,点击提交按钮,“首次就诊年龄“从原值“61岁”变更为现值“59岁”。同时,系统产生一条留痕记录。

留痕记录中,变动信息:

① 变动时间:2021-2-2 19:04,记录执行提交任务的时刻。

② 修改人:张三医生,记录执行数据提交任务的人。

③ 变动变量:就诊年龄,记录修改的变量。

④ 原值:61岁,记录变量修改前的结果。

⑤现值:59岁,记录变量修改后的结果。

变动原因:

⑥变动原因:李明的身份证年龄比实际年龄大2岁,61岁是根据身份证号计算出来。

当对“首次就诊年龄”变量的准确性产生质疑时,通过点击“首次就诊年龄”旁的“留痕记录”icon,查看历次留痕。该方法为判断该结果的准确性提供了一种获取信息的途径。

三、典型应用场景

数据留痕记录下数据变动的全过程,提供了查找错误的入口。典型的应用场景包括重要文档修改、重要业务流转过程等。

场景一:电子文档修改

在企业内部,重要的文档、客户信息、费用信息经过首次校验后,数据保存至系统中。由于合同变更、客户信息更新、劳务合同修订等原因,需要调整原始纸质数据,同时更新系统中数据。

重要的电子文档具有重要程度高、数据使用频率低的特点。

例如,CRM系统中记录了大客户的资料,这些客户为公司创造了营收,所以大客户数据至关重要。可能会因为业务方人员变更、采购量发生变化等原因,公司需要更新客户资料。但是业务方人员变更或采购量的变化,这些事情该生的概率都比较低。

正是由于这种特点,数据被修改后至再次被使用时,极可能经历较长时间。此时人脑记忆变得模糊,当模糊的记忆与系统记录的数据不一致时,对系统的数据准确性产生质疑。问题严重时,为避免造成损失,企业可能会暂停与该数据相关的业务。

例如,采购经理记忆中合同额是300万,但是系统中显示的是310万,纸质合同也显示结果是310万。由于“300”和“310”具有高度相似性,所以导致了本次的记忆混淆。

数据留痕记录了合同额的变化过程,“2021.1.3日 首次签订合同,金额200万;2021.2.15 补签两年期维保合同,金额110万”。采购经理将维保合同的金额记为100万。如果未发现该错误,财务就会少打款给供应商,来回沟通造成货物供应迟滞,进而耽误了生产进度。

电子文档中相似的数字,相近含义的文案,都容易让人记忆混淆。数据留痕提供了一条重要的获取信息的途径,结合其他信息,便于找到准确结果。

场景二:流程留痕

企业会为重要且高频的业务建立业务流程,从而让重要业务在无人管理的情况下正常运行。当业务需求发生变更时,为了保证系统数据与实际情况一致,就需要更新业务流程信息。

例如,公司完成项目立项流程以后,新项目进入实施阶段。运行过程中发现,由于最开始的调研时间有限,对于客户的需求挖掘深度不够。为了保证项目能够达到客户要求,对项目范围、项目完成时间和里程碑节点做出调整。系统同步发生修改。

业务流程完成以后,很多流程基本不会被再次打开;再次打开时,流程可能已经结束很长时间。此时很有可能对项目过程记忆模糊,对系统记录的信息产生质疑。问题严重时,当再次发生该类项目时,可能产生错误的项目评估。

例如,技术经理记忆中该项目的持续时间是3个月。但是系统中却显示从开始时间到结束时间,持续了6个月时间。由于技术经理前期参与项目较多,后期参与较少,对于项目的结束时间产生了记忆错误。

流程留痕记录了流程的变化过程,“2021.7.15日 项目变更项目范围 预计项目结束日期为2021.12.1;变更原因:项目前期调研时间紧张,未充分调研”。如果未发现该错误,下次需要评估同类型项目时,就有可能评估不准确,造成项目延期,有可能面临违约赔偿。

四、总结

由于人脑记忆的混乱所带来的代价比较高,所以数据留痕功能的必要性是有的。但是数据提交后被再次使用的概率和用户记忆混淆的发生概率比较低。为了避免低频的信息打扰用户的主操作,需要将该功能进行刻意的隐藏。

Copyright 2012-2013 上虞第一城市门户网站 版权所有

郑重声明:网站资源摘自互联网,如有侵权,麻烦通知删除,谢谢!