数据科学视角下数据溯源研究与实践进展
Research and Practice Progress of Data Provenance from the Perspective of Data Science
作 者:王芳[1];赵洪[1];马嘉悦[1];李晓阳[1];张晓玥[1]
WANG Fang;ZHAO Hong;MA Jiayue;LI Xiaoyang;ZHANG Xiaoyue(不详)
作者机构:[1]南开大学商学院信息资源管理系,天津300071
出 版 物:中国图书馆学报
年 卷 期:2019年 第5期
摘 要:真实性和可靠性是当前各领域对数据的根本要求,基于数据溯源实现数据的质量控制与可信管理具有重要的研究价值和实践意义。数据溯源不仅是一个技术问题,同时也是一个管理问题,在数据科学范式下应当受到信息资源管理研究的关注和重视。鉴于此,本文结合相关领域的最新研究进展,系统阐述了数据溯源的概念发展与内涵;梳理了面向数据溯源管理的信息描述模型、通用表达模型、领域应用模型、安全管理模型与区块链溯源管理模型;描述了关系数据库、科学工作流、大数据平台、云计算和区块链等典型应用环境下的数据溯源计算方法。此外,本文还重点分析了数据溯源在数字图书馆、档案信息管理、网络信息资源管理、科学数据共享管理及电子商务信息系统等信息资源管理研究领域中的应用价值与相关实践,并对数据溯源技术方法、标准规范、信息安全、区块链融合以及模型扩展验证等方面的发展进行了展望,以期为数据管理和数据科学领域的研究人员提供参考。
页 码:79-100页
主 题 词:数据科学;数据溯源;区块链;数据质量;大数据平台
因篇幅问题不能全部显示,请点此查看更多更全内容