在数据科学与决策价值方面:
当我们进入生成式AI应用的下一波时,我们预计将看到从信息生成转向信息综合的焦点转变。在知识工作中,决策具有巨大的价值。员工得到报酬是为了根据不完美的信息做出决策,而不一定是生成执行或解释这些决策的内容的数量。在许多情况下,更长并不意味着更好,它只是更长而已。许多格言支持这一点:编写的代码行数并不是衡量工程生产力的良好指标;更长的产品规格并不一定能更清晰地说明需要构建什么;更长的幻灯片也不一定总是提供更多的洞察。[Hex](https://hex.tech/)的首席执行官和联合创始人Barry McCardel相信人机共生,并强调了大型语言模型(LLMs)如何改进我们的工作方式:“AI的存在是为了增强和改进人类,而不是取代人类。在理解世界和做决策时,你需要人类参与其中。AI能做的是帮助我们将更多的脑力应用于有价值的、富有创造性的工作,这样我们不仅可以每天花更多的时间在重要的工作上,还能让自己自由地做到最好。”
a.需求侧过去,需求集中在数据收集-分析;过去对数据的利用集中在收集、转换、存储等,即对历史和当下情况的分析;随行业发展,需求流向数据应用-预测;随着模型Scale up带来推理能力增强,企业用大数据驱动业务的价值提高,对决策的科学性、客观性要求提高,企业希望使用数据对未来情况进行预测、模拟。此外,AI/ML技术的突破,带来应用端对数据的新需求;据Epoch AI Research预测,到2026年,现存的用于AI模型训练的高质量语言数据将耗尽;据Gartner预测(下图),到2030年,合成数据将成为AI模型的主要训练数据来源。b.供给侧数据行业可分为infra层和应用层,后一层的爆发依赖于前一层的成熟,包括:底层的云;数据湖、数据仓库以及围绕其创造出来的工具和生态;数据应用的上游供给成熟,而其本身仍处于发展期;根据Fortune Business和Reprotlinker,2021年全球数据科学市场规模为570.8亿美元,预计在2026年可达到2,142.4亿美元;
在探讨信息、知识、智慧的本质之前,我们首先需要明白这三者之间既有区别又有联系。它们共同构成了人类理解世界、做出决策的基础框架。现代社会的快速发展,尤其是在人工智能时代,使得对这三者的理解和应用变得尤为重要。信息:数据的呈现信息是知识和智慧的基础,它是对事物属性的描述,是数据的集合或加工结果。信息可以是一串数字、一段文字、一张图片或是一段视频,它们是原始的、未经加工解释的。在日常生活中,我们不断接收和处理信息,比如阅读新闻、查看天气预报等。信息的价值在于它是被传递和理解的基础,但单独的信息往往不能直接支持决策。