PDS(Process-oriented Data Science)和LDS(Lifecycle-oriented Data Science)都是数据科学领域重要的方法论,各自有着优缺点。
PDS重视建立反复迭代、贯穿整个数据处理流程的数据挖掘和机器学习模型,并跟踪和管理整个数据流。
LDS则强调从项目开始到结束的全生命周期管理,从需求、设计到开发、测试和发布全面把握数据处理的各个环节。
PDS更关注数据科学家本身的技术能力和经验,可以更快速地挖掘出模型中的重要特征,适用于数据分析、模型测试和优化。
LDS相对而言注重项目管理和治理等商业化方面,更加适合大型数据平台的应用。