来自一个视频:
https://www.youtube.com/watch?v=xC-c7E5PK0Y
数据科学家的需求层次,从底层往上层依次需要:
- COLLECT,数据收集
- MOVE/STORE,数据传输和存储
- EXPLORE/TRANSOFRM,数据探索、清洗、异常检测过滤等
- AGGREGATE/LABEL,分析、指标、聚合、特征工程、输出训练数据
- LEARN/OPTIMIZE,AB测试、试验、简单的机器学习算法
- AI/DEEP LEARNING,人工智能,深度学习
数据科学家的核心要义:
不需要复杂的算法,只需要你用任何手段解决公司的问题
一切都是为了解决问题