- 电子商务:识别客户在一段时间内的购买模式,以推荐相关产品
- 制造业:机器的预测性维护,通过整合数据孤岛并结合外部因素来改进和优化供应链。
- 银行业——数据是银行数字化转型的动力。认知人工智能支出将从2015年的9.84亿美元增长十倍,到2020年达到93亿美元。
- 保险:基于远程信息处理和 特殊数据库机器学习的汽车保险承保
行业内,您的大数据典型客户是谁?是首席技术官、首席信息官、首席营销官,还是数据领域的专家?
Ambuj Kathuria:这取决于我们要为客户解决什么问题。
- 数据科学——主要是 CMO、CPO 或 COO
- 数据工程——主要是 CIO 或 CTO
- 数据战略、数据治理、主数据管理——主要由首席数据官负责
对有志于成为数据科学家的人的建议
科学家需要具备哪些最重要的技能,包括技术技能和软技能?
Ambuj Kathuria: 数据分析 文章的长度取决于你的目的和 师和数据科学家是两种不同的技能组合。数据分析师应该具备统计学/机器学习知识,但更重要的是,他/她应该擅长领域/数据理解。而数据科学家应该是纯粹的数学家,应该以旁观者的身份,洞察数据的模式和相关性,并基于此提供建议,而不是局限于领域知识。
技术技能:Excel、R、Python、Azure ML、可视化工具、统计数据、任何分析工作台
软技能:领域、商业和沟通技能,将数据分析的结果与商业环境联系起来。
有志于成为数据从业者的人应该在处理混乱、嘈杂的数据时投入多少精力?他们还必须在哪些领域积累专业知识?
Ambuj Kathuria: 根据我的经验,数据分析师/科学家大约 60% 到 70% 的时间都花在了数据准备上,因为数据噪声大或杂乱 邮寄线索。市面上有很多即将推出或已经推出的数据准备工具,例如 Alteryx、Talend 等,我们应该好好利用这些工具,以便将更多精力放在运用最佳数据科学算法来获取洞察上。
您对新手、数据科学学生或希望在数据分析行业建立职业生涯的从业者有什么建议?
Ambuj Kathuria:
- 编程和软件技能——R、Python、SAS
- 可视化工具 – Power BI、Qliksense、Tableau、Spotfire、
- 统计基础和应用知识——回归、相关性、聚类、概率、正态分布等。
- 机器学习——线性回归、神经网络、随机森林、XG Boost、SVM 等。
- 数据准备工具——Alteryx、Talend