datenqualität im reporting
公司要求对于supply chain reporting中的datenqualität分析, 可以从哪些方面分析啊? 本帖最后由 guoz100 于 2012-4-16 19:03 编辑不是搞物流的哈,只是个人觉得可以考虑以下几个方面,说错了就当我是个外行好了
我觉得数据质量,可能不是让你分析吧,可能是让你审计数据
比如检查下data type有没有错,比如日期是不是定义成了字符串类型
比如检查下有没有junk data, 比如有的日期少月份,导致计算机不认识这条数据,处理的时候会报错误;如果没有垃圾数据,那有没有丢失原始数据,数据量够不够
再比如看下这个数据是什么阶段的数据,是原始数据?经过clean的数据?clean以后有没有standardize?
如果以下都看过了,没有问题,可以考虑下数据的有用性,比如是不是有很多null value
其他方面,比如分析数据是否是normalized,以此类推,都一个道理,挨个检查,如果你的责任只是发现错误而不是解决错误,你就挑毛病,挑完了汇报给老板就好,如果你的任务是挑出来毛病并解决的话,那你工作量就要大点了,得编几个程序了
汗,你这是实习的问题还是毕业论文的课题啊?
要是前者,可以参考下我的答案,要是后者,我的答案你可以跳过了 楼主可以围绕下面三个概念来写(具体去放狗搜吧):
Data integrity
Data consistency
Data reliability 恩,多谢楼上2位的帮助,我没写清楚,这个是我要面试实习的一个任务之一,看了你们的回帖我有点方向了。{:5_342:}
页:
[1]