以下是为您整合的相关内容:
应用开发方面:
Markdown 分页策略:
处理结构化数组对象数据:
金融服务业与生成式 AI:
最近做活动正好用到,因为明星比较多,要每天统计一堆微博话题指数,就临时捣鼓了一下,做了个简易的爬虫工具下来。由于外显的数据只支持30天,所以可以爬到30天内每天的数据(不过一般也够了)由于脚本太简单了,就大概说一下解题思路:举个例子,首先我们随便看一个热搜话题点击“详情”可以看到话题的具体数据,这里面有些数据单位是“万”,为了避免数字过大爆屏,但后台应该是有具体数据的。[heading1]分析页面[content]在浏览器预览界面(CTRL+SHIFT+I)找到它的真实数据地址复制出来打开,里面可以找到页面上的各种数据,比如阅读量19.1万,搜“191”可以看到对应'read'字段可以看到具体的数据是191286(这个数据是实时的,会不断更新)并且仔细看浏览器显示的url会发现,原来微博的话题页命名规则还挺简单的~[heading1]给GPT下Brief[content]搞清楚规则以后,就可以让AI帮我们写代码了~需求是:我想抓取微博话题30天的分日数据,微博话题页命名的规则是:https://m.s.weibo.com/ajax_topic/detail?q={topic_name}&show_rank_info=1在执行代码的时候,topic_name是用户手动输入的。由于我在colab上运行,在爬取数据之后需要存储数据到excel并自动下载到本地。丢给4o(o1也可以,但是没什么必要,我连canvas也没用,claude应该表现会更好一些),来回改了3-4次下面是AI生成的代码,经过一些细节优化(比如将excel的原始标题字段替换成阅读量,互动量之类)
🫧宝玉日报「12月27日」✨✨✨✨✨✨✨✨1⃣️📄Markdown的分页策略参考LangChain提供多种文本分页策略:参考链接[https://python.langchain.com/docs/how_to/#text-splitters](https://python.langchain.com/docs/how_to/#text-splitters)分页流程:1.按Headers或“章”划分2.合并相邻较小部分3.对大的“章”按“节”继续拆分4.对大的“节”按“段”、“句”、“词”逐步拆分,直到满足长度要求✨亮点:LangChain文档详尽,清晰解释了RAG和AI实现思路是否使用LangChain实现并非关键,关键在于理解方法论🔗[https://x.com/dotey/status/1872465612561437175](https://x.com/dotey/status/1872465612561437175)2⃣️🧠Q&A:让AI更好地读Prompt里的结构化数组对象数据建议:1.提供数据结构描述2.用必要的示例数据,避免提供完整数据3.明确说明分析需求4.让AI编写代码完成分析✨亮点:Claude和ChatGPT支持直接运行代码,处理结构化数据更高效通过示例数据和需求明确性提升AI的理解能力
除了能够帮助回答财务问题外,LLMs还可以帮助金融服务团队改进自己的内部流程,简化财务团队的日常工作流程。尽管金融的几乎每个其他方面都取得了进展,但现代财务团队的日常工作流程仍然依赖于像Excel、电子邮件和需要人工输入的商业智能工具这样的手动流程。由于缺乏数据科学资源,基本任务尚未被自动化,CFO及其直接报告人因此在繁琐的记录和报告任务上花费太多时间,而他们应该专注于[金字塔顶端](https://a16z.com/2020/04/15/new-cfo-tools/)的战略决策。总体而言,生成式AI可以帮助这些团队从更多的数据源中获取数据,并自动化突出趋势、生成预测和报告的过程。以下是一些例子:预测:生成式AI可以帮助编写Excel、SQL和BI工具中的公式和查询,从而实现分析的自动化。此外,这些工具可以帮助发现模式,并从更广泛、更复杂的数据集中为预测建议输入(例如,考虑宏观经济因素),并建议如何更容易地适应这些模型,以便为公司决策提供依据。报告:生成式AI可以帮助自动创建文本、图表、图形等内容,并根据不同的示例调整此类报告,而无需手动将数据和分析整合到外部和内部报告中(例如,董事会材料、投资者报告、周报表)。会计和税务:会计和税务团队需要花时间咨询规则并了解如何应用它们。生成式AI可以帮助综合、总结,并就税法和潜在的扣除项提出可能的答案。采购和应付账款:生成式AI可以帮助自动生成和调整合同、采购订单和发票以及提醒。