成为数据科学家的学习和训练过程通常包括以下步骤:
在数据科学项目中,还需注意以下方面:
1,收集数据,2,训练模型(不断优化,直到足够好),3,派送模型(测试并更新数据与模型),[heading5]数据科学项目的工作流程[content]1,收集数据,2,分析数据(迭代多次获得正确的见解),3,提出假设与行动(调整,不断分析新的阶段数据)[heading5]每个工作职能都需要学习如何使用数据[content]数据科学家与人工智能,在销售,农场主,网站优化等各个方面均有强大作用,前者通过数据做决策,后者通过数据完成训练,并形成输入输出的程序。[heading5]如何选择人工智能项目[content]找到AI可以完成,并且你的商业领域可以运用的项目。召集一个人工智能专业与业务领域专家组成的团队第一,思考可以自动化的任务而不是自动化的岗位(细化可自动化任务)第二,思考什么是驱动商业价值的核心第三,思考什么是你商业领域的主要痛点破除数据迷信:1,有更多的数据基本没有坏处,2,数据让有些商业模式具有护城河(网络搜索),3,但即使少量数据集也可以取得进展。(有时错误数据的代价太高,或者资源太少)Due diligence on project:技术:1,确定AI系统可达到理想表现。2,需要多少数据?能获得多少?3,开发时间表,清晰所需时间,人员商业:1,降低成本,提升效率,2,增加收入,3,推出新业务或产品。使用电子财务模型以定量估算价值购买还是建造。这是一个重要的议题。现实情况是,人工智能项目可以外包而数据科学一般内部成立。[heading5]与人工智能团队合作[content]1,为项目提供验收标准,如检测废品成功率95%,需要另准备测试数据集。标准尽量以数据衡量。有时人工智能团队需要两个测试集。验收标准基本不可能100%正确,因为数据太少,技术不成熟,数据标注错误,模糊的标签(人为判断是否正确)都会成为不能100%准确的原因。[heading5]人工智能团队的技术工具(可选)