Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有一个飞书文档,是每天更新AI发展新闻动态的,怎么看?

Answer

以下是关于如何查看每天更新 AI 发展新闻动态的飞书文档的相关信息:

  • 有一个名为《通往 AGI 之路》的飞书文档,它不仅是一个简单的文档,更像是一个知识库。其内容丰富,涵盖了从入门到精通、实践以及延展阅读等关于 AI 的几乎所有方面。自去年 4 月创建至今,已有近 500 万的阅读量,任何时候都有上百人在线围观。
  • 相关媒体报道的链接有:央广网:https://mp.weixin.qq.com/s/ADeVCCmaF_Kbhqx9FA9HwA ;量子位:https://mp.weixin.qq.com/s/wlODtkoHRd3Pa7XvKVAx2w 。
  • 飞书官方推荐的报道:《AI 科普在飞书:一众知识付费内容的免费源头找到了!》(2024 年 2 月 26 日飞书公众号)
Content generated by AI large model, please carefully verify (powered by aily)

References

活动、奖项及媒体报道

《[AI科普在飞书:一众知识付费内容的免费源头找到了!](https://mp.weixin.qq.com/s/3DVgBCMzrqZUnkk8ASfi2Q)》(2024年2月26日飞书公众号)面对突然到来的AI革命,普通人该如何面对?正因为普通人不知道答案,所以诞生了非常多的“专家”和“老师”,带着价格特惠的课程和实操训练营刷爆了各大社交媒体平台。与此同时,这几天一个飞书文档悄悄火了起来——《通往AGI之路》不,这已经不算是简单的文档了,而是一个知识库。一打开,就让人禁不住直呼厉害。其内容丰富程度简直可以出本书,从入门到精通,到实践,再到延展阅读,关于AI的“一切”,几乎都被作者收罗了进来。任何时候都有上百人在线围观,去年4月创建至今,已经有了近500万的阅读量。央广网:https://mp.weixin.qq.com/s/ADeVCCmaF_Kbhqx9FA9HwA量子位:https://mp.weixin.qq.com/s/wlODtkoHRd3Pa7XvKVAx2w

知识库有什么|感谢银海 inhai

《[AI科普在飞书:一众知识付费内容的免费源头找到了!](https://mp.weixin.qq.com/s/3DVgBCMzrqZUnkk8ASfi2Q)》(2024年2月26日飞书公众号)面对突然到来的AI革命,普通人该如何面对?正因为普通人不知道答案,所以诞生了非常多的“专家”和“老师”,带着价格特惠的课程和实操训练营刷爆了各大社交媒体平台。与此同时,这几天一个飞书文档悄悄火了起来——《通往AGI之路》不,这已经不算是简单的文档了,而是一个知识库。一打开,就让人禁不住直呼厉害。其内容丰富程度简直可以出本书,从入门到精通,到实践,再到延展阅读,关于AI的“一切”,几乎都被作者收罗了进来。任何时候都有上百人在线围观,去年4月创建至今,已经有了近500万的阅读量。央广网:https://mp.weixin.qq.com/s/ADeVCCmaF_Kbhqx9FA9HwA量子位:https://mp.weixin.qq.com/s/wlODtkoHRd3Pa7XvKVAx2w

XiaoHu.AI日报

🔔小互的推特11月7日更新✨✨✨✨✨✨✨✨0️⃣OpenAI开发者大会后收集了一些有趣的案例⚡️ GPT-4-Turbo速度演示🌟 GPTs示范🎙️创建AI体育解说员🤖创建一个NPC交互👁️利用GPT-4视觉API实时地识别正在发生的事情https://x.com/xiaohuggg/status/1721781696474083436?s=201⃣️ 🛠️ OpenAI开源工具:发布了Consistency Decoder工具改进AI图像生成针对稳定扩散VAE模型,提升图像清晰度和连贯性对需高质量图像生成者有大用🔗[https://github.com/openai/consistencydecoder](https://github.com/openai/consistencydecoder)🔗[https://x.com/xiaohuggg/status/1721745108838834264?s=20](https://x.com/xiaohuggg/status/1721745108838834264?s=20)2⃣️ 🌟 AI时代见证:描述了身处AI技术飞速发展的时代的感受OpenAI科学家表达了对GPT发展速度的无法预测

Others are asking
我是否可以在飞书上传我的相关文档,然后把这些文档作为知识库进行对话,若可以,如何操作
在飞书上可以上传您的相关文档并将其作为知识库进行对话。具体操作如下: 1. 您需要一个额外的软件:AnythingLLM。其安装地址为:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 2. 在 AnythingLLM 中,有一个 Workspace 的概念,您可以创建自己独有的 Workspace 与其他项目数据进行隔离。操作步骤为: 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式,AnythingLLM 提供了两种对话模式: Chat 模式:大模型会根据自己的训练数据和您上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 测试对话。 3. 另外,您还可以参考以下操作在飞书上创建知识库并上传文本内容: 登录 。 在左侧导航栏的工作区区域,选择进入指定团队。 在页面顶部进入知识库页面,并单击创建知识库。在弹出的页面配置知识库名称、描述,并单击确认(一个团队内的知识库名称不可重复,必须是唯一的)。 在单元页面,单击新增单元。 在弹出的页面选择要上传的数据格式(默认是文本格式),然后选择一种文本内容上传方式完成内容上传。上传方式如下: 本地文档: 在文本格式页签下,选择本地文档,然后单击下一步。 将要上传的文档拖拽到上传区,或单击上传区域选择要上传的文档。目前支持上传.txt、.pdf、.docx 格式的文件内容,每个文件不得大于 20M,一次最多可上传 10 个文件。当上传完成后单击下一步。 选择内容分段方式: 自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。 自定义:手动设置分段规则和预处理规则。分段标识符:选择符合实际所需的标识符。分段最大长度:设置每个片段内的字符数上限。文本预处理规则:替换掉连续的空格、换行符和制表符,删除所有 URL 和电子邮箱地址。单击下一步完成内容上传和分片。
2025-01-07
飞书如何接入大模型?
飞书接入大模型的步骤如下: 1. 搭建,用于汇聚整合多种大模型接口,并获取白嫖大模型接口的方法。 2. 搭建作为知识库问答系统,将知识文件放入其中,并接入上面的大模型。如果不想接入微信,搭建到这里即可,它有问答界面。 3. 搭建接入微信,并配置FastGpt将知识库问答系统接入微信。建议先用小号以防封禁风险。完成上述3步即可。 另外,对于将相关内容发布到飞书: 1. 目标是发布到飞书并在飞书中调用。 2. 尝试发布,在页面右上角点击发布,若飞书未授权则点击配置,然后再次点击发布。 3. 发布成功后可在飞书工作台中找到并使用。但可能存在与所说步骤不完全一致的情况,可通过workflow解决。 对于重度用户,工作流的最好教程参见官方文档:https://www.coze.cn/docs/guides/welcome 。工作流可以解决大模型调用写邮件插件时可能出现的速度慢和可能出错等问题,例如采取工作流+代码的组合方法,将用户原始输入直接传送给插件WebPilot,并通过另一个工作流AI Project进行样式注入等。
2025-01-07
怎么把小ai接进飞书里?
要将小 AI 接入飞书,可参考以下步骤: 1. 注册 AI 模型: 进入智普 AI:https://open.bigmodel.cn/ 。 点击开始使用,注册登录。 按照要求进行认证,点击控制台,查看 API key,点击添加新的 API key 并复制,将编码暂时保存备用。 2. 注册云服务器: 新用户点击去注册腾讯云: 。 微信扫码注册,首次注册选择第一个,地域随便选择,镜像选择下拉框最上边的宝塔 8.1.0 后点击立即试用。 进入腾讯云服务台登录,可直接登录或微信扫码登录。 在当前页面,复制 sudo/etc/init.d/bt default 粘贴回车,保存输出内容。 返回服务器控制台,点击箭头指示的空白区域,选择“防火墙”菜单栏,点击【添加规则】按钮,点击新增,手动输入图中大红框内的内容并确定。 3. 开始部署(这里继续): 删除上图文件里的所有代码,复制下边的代码粘贴到文件里,找到第 4 行,把注册并保存好的智谱 API key 粘贴到双引号里,修改完点击保存关闭文件。 依然在当前文件的【终端】里,依次复制粘贴:cd plugins/godcmd ,cp config.json.template config.json 。 操作完成后,退出窗口,刷新一下。进入/root/chatgptonwechat/plugins/godcmd ,双击 config.json,进入后设置 password 和 admin_users ,可设置为和示例一样,点击保存后关闭。 重新回到/root/chatgptonwechat/这个文件路径下,点击终端,依次粘贴:touch nohup.out ,nohup python3 app.py&tail f nohup.out 。 最下方会出现一个二维码,使用想要做机器人的微信扫码登录。 4. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复。如果想为这个 AI 赋予什么样的提示词,可以返回“目录 4 里的第 17 步”,其中的中文部分,便是设置 AI 提示词的地方,可以进行更改。此后,进行任何更改,都需要“返回首页 右上角 点击重启,重启一下服务器”。 5. 再往后就是添加插件了, 。
2024-12-30
在coze中如何接入飞书插件
在 Coze 中接入飞书插件的步骤如下: 1. 企业微信群聊机器人插件: 到语聚 ai 的第三方 api 集成平台上添加工具动作。 在平台上测试相关动作,获得返回的 API 请求的 python 代码。 按步骤集成到 Coze 的插件创建平台中。 2. 飞书多维表格插件: 使用 Coze 在 Coze IDE 中创建模式创建插件。 根据飞书开放者文档的要求在 Coze IDE 平台中用 handler 的方式编写 python 代码,配置项目依赖。 在 metadata 中配置输入和输出端信息。 最后测试发布成功。 此外,还有以下相关内容供您参考: 1. 通过已有服务 api 创建 Coze 插件: 进入 Coze,个人空间中,选择插件。新建一个插件,起个名字 api_1(名字可随意,描述叫 test)。 在插件的 URL 部分,填入刚才 ngrok 随机生成的 https 的链接地址。 按照指引配置输出参数,测试后发布插件。 手捏插件搞定之后,就可以创建 bot,将创建的插件接进来,在 prompt 里面让它调用插件。 2. 大聪明的保姆级教程: 先创建第一个 bot,然后不断精进。 如创建一个 Coze Bot 帮查阅 Hacker News 并中文返回,可引入联网插件 WebPilot 实现。
2024-12-23
如何用coze的智能体自动存储在飞书智能表格里
要将 Coze 的智能体自动存储在飞书智能表格里,可参考以下步骤: 1. 前期准备: 设计 AI 稍后读助手的方案思路,包括简化“收集”,实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作,输入 URL 完成收集,借鉴微信文件传输助手通过聊天窗口输入;自动化“整理入库”,系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态,且支持跨平台查看;智能“选择”推荐,根据收藏记录和用户阅读兴趣生成阅读计划。 发现同在字节生态中的 Coze、飞书、飞书多维表格可构建完整的 AI 工作流,通过飞书机器人与 Coze 搭建的智能体对话,在聊天窗口完成链接输入和阅读计划输出,由 Coze 调用大模型、插件完成内容整理、推荐,利用飞书多维表格存储和管理稍后读数据,理论上无需开发插件、APP 就能实现跨平台的稍后读收集与智能阅读计划推荐。 2. 逐步搭建 AI 智能体: 搭建整理入库工作流,设置大模型节点提取稍后读元数据,使用 MiniMax 6.5s 245k,设置最大回复长度至 50000 以解析长内容网页。 进行日期转时间戳,使用「日期转时间戳time_stamp_13」插件进行格式转化,因后续的飞书多维表格插件节点入库日期字段只支持 13 位时间戳。 把稍后读元数据转换为飞书多维表格插件可用的格式,飞书多维表格插件目前只支持带有转义符的 string,以 Array<Object>格式输入,需将元数据数组进行格式转换。 添加「飞书多维表格add_records」插件,设置{{app_token}}与{{records}}参数。 结束节点返回入库结果,「飞书多维表格add_records」插件返回入库结果,用于通知外层 bot 工作流的入库是否成功,别忘了对整个工作流进行测试。
2024-12-17
怎么对飞书知识库进行对话问答
以下是关于飞书知识库进行对话问答的相关内容: 1. 关于飞书智能伙伴创建平台: 飞书智能伙伴创建平台(Aily)是飞书团队旗下的企业级 AI 应用开发平台,提供简单、安全且高效的环境,帮助企业构建和发布 AI 应用,推动业务创新和效率提升。 云雀是字节跳动研发的语言模型,能通过自然语言交互高效完成互动对话、信息获取、协助创作等任务。 2. 如何使用问答机器人: 方法 1:在 WaytoAGI 飞书知识库首页找到加入飞书群的链接(最新二维码在知识库首页),加入后直接@机器人。 方法 2:在 WaytoAGI.com 的网站首页,直接输入问题即可得到回答。 3. 问答机器人的作用: 知识库内容庞大,新用户难以快速找到所需内容。 传统搜索基于关键词及相关性,存在局限性。 采用更先进的 RAG 技术,在群中提供便捷的信息检索方式。 4. 在 AI 商用级问答场景中让回答更准确: 问答机器人的配置包括 AI 模型、提示词和知识库。 大语言模型如同拥有无穷智慧的人,提示词可让其成为所需“员工”,知识库则是工作手册。 例如设定使用阿里千问模型,提示词角色为“美嘉”,知识库为《爱情公寓》全季剧情。 5. 实现知识库问答: 知识库问答利用大模型的 RAG 机制,即“检索增强生成”技术,结合检索和生成提高机器对话和信息处理能力。 先从大型数据集中检索与问题相关的信息,再利用这些信息生成回答,可想象成先在巨大图书馆找相关书籍再给出详细回答。 基于 RAG 机制,创建包含大量文章和资料的知识库,通过手工录入上传内容,并在设计 Bot 中添加知识库,设置合适的搜索策略、最大召回数量和最小匹配度,以结合知识库内容进行回答。
2024-12-03
ai提示词生成网站
以下是一些 AI 提示词生成网站: :AI 艺术提示词生成器。 :玩游戏也能练习 Prompt 书写。 NovelAI tag 生成器:设计类 Prompt 提词生成器,地址。 魔咒百科词典:魔法导论必备工具,简单易用的 AI 绘画 tag 生成器,地址。 KREA:设计 AI 的 Prompt 集合站,create better prompts,地址。 Public Prompts:免费的 prompt 合集,收集高质量的提示词,地址。 AcceleratorI Prompt:AI 词汇加速器,加速 Prompt 书写,通过按钮帮助优化和填充提示词,地址。 MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库,地址。 MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分,地址。 OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词,地址。 AIart 魔法生成器:中文版的艺术作品 Prompt 生成器,地址。 IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器,地址。 Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney,地址。 OpenArt:AI 人工智能图像生成器,地址。 img2prompt:根据图片提取 Prompt,地址。 MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用,地址。 PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板,地址。 AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择,地址。
2025-01-08
ai提示词生成
以下是关于 AI 提示词生成的相关内容: 有 108 个舞蹈音乐提示词,涵盖各种舞曲子流派,如“Punchy 4/4 beats,electro bass,catchy synths,pop vocals,bright pads,clubready mixes,energetic drops”,并对其中的元素进行了详细解释,如“Punchy 4/4 beats”指节奏感强的四四拍鼓点等。 一泽 Eze 提出样例驱动的渐进式引导法,其核心要点是发挥 AI 的逻辑分析和抽象总结能力,从用户提供的样例中总结方法论,用户进行判断和提出意见,为提示词爱好者提供低门槛途径。在某些特定场景下,能让 AI 主动理解需求,不依赖 Prompt 工程师。 由于 LLM 有上下文长度限制,在长对话中使用渐进式引导法可能会触碰限制,影响输出质量,所以引入“提示词递归”的概念与方法,具体步骤包括初始提示、定期总结、重新引入、细化和拓展、验证和优化,并给出了例如说明。
2025-01-08
推荐一些适合零基础的小学生、初中生学习的实用的Ai课程
以下是为零基础的小学生、初中生推荐的实用 AI 课程: 1. 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能及其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 在「」中,有一系列为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 野菩萨的 AIGC 资深课也是不错的选择,这门课程由工信部下属单位【人民邮电出版社】开设,是市面上为数不多的值得推荐的 AI 课程之一,也是全网技术更新最快的课程。课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识。预习周课程包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。基础操作课涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。核心范式课程涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。SD WebUi 体系课程包括 SD 基础部署、SD 文生图、图生图、局部重绘等。ChatGPT 体系课程有 ChatGPT 基础、核心 文风、格式、思维模型等内容。ComfyUI 与 AI 动画课程包含部署和基本概念、基础工作流搭建、动画工作流搭建等。应对 SORA 的视听语言课程涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 4. 如果想要免费获得这门课程,可以来参与 video battle,这是唯一一个获胜者就可以拥有课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。冠军奖励:4980 课程一份;亚军奖励:3980 课程一份;季军奖励:1980 课程一份;入围奖励:598 野神殿门票一张。 在学习过程中,您可以根据自己的兴趣选择特定的模块深入学习,一定要掌握提示词的技巧,它上手容易且很有用。理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。同时,与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。
2025-01-08
AI学习路径
以下是为新手提供的 AI 学习路径: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人进行互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 另外,如果您偏向技术研究方向,学习路径包括: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 如果您偏向应用方向,学习路径包括: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-08
我想用AI生成一份海报
以下是一些可以帮助您用 AI 生成海报的信息: 设计海报的 AI 产品: Canva(可画):https://www.canva.cn/ 是一个受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案。 VistaCreate:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 Microsoft Designer:https://designer.microsoft.com/ 具有简单拖放界面,能快速创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 用 AI 快速做一张满意海报的方法: 需求场景:如想发条有吸引力的朋友圈等,网上找图可能存在质量和独特性问题。 大致流程: 确定主题与文案,可借助 ChatGPT 等文本类 AI 工具协助完成。 选择风格与布局,背景可灵活调整。 使用无界 AI 输入关键词生成并筛选海报底图。 进行配文与排版,合理组合素材得到成品,排版可参考 AIGC 海报成果。 1 分钟搞定海报设计的思路案例: 确定如将老北京糖葫芦做成北京建筑等思路。 借助 AI 生成海报,挑选喜欢的。 确定风格后,替换同材质的北京建筑物延续风格设计一系列海报,调整关键词生成单个建筑物,用 PS 稍作处理。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-08
AI中常说的token是什么
Token 是大模型语言体系中的最小单元。 在人类语言中,不同语言都有最小的字词单元,如汉语的字/词、英语的字母/单词。而在大模型语言体系中,Token 就相当于这样的最小单元。 当我们向大模型发送文本时,大模型会先将文本转换为它自己的语言,并推理生成答案,然后再翻译为我们能看懂的语言输出。 不同厂商的大模型对中文文本的切分方法不同,通常情况下,1 个 Token 约等于 1 2 个汉字。 大模型的收费计算方法以及对输入输出长度的限制,都是以 Token 为单位计量的。 例如,在英文中,单词“hamburger”会被分解成“ham”“bur”和“ger”这样的 Token,而常见的短单词如“pear”则是一个 Token。对于英文文本,1 个 Token 大约相当于 4 个字符或 0.75 个单词。但要注意,在给定的 API 请求中,文本提示词和生成的补合起来不能超过模型的最大上下文长度(对于大多数模型,约为 2048 个 Token 或 1500 个单词)。
2025-01-08
请给我推荐最适合翻译PDF文档的AI平台
以下是一些适合翻译 PDF 文档的 AI 平台: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。还能一键开启网页中 Youtube 视频的双语字幕。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式,但进阶功能基本需要付费。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译,有免费次数限制且进阶功能需要付费。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-06
如何搭建一个本地的ai助手,通过学习本地文档进行训练
搭建一个本地的 AI 助手并通过学习本地文档进行训练,可参考以下步骤: 1. 设计 AI 机器人: 编写【prompt】提示词,设定 Bot 的身份和目标。 2. 创建知识库: 整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。 创建知识库路径:个人空间 知识库 创建知识库。 知识库文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。 按照操作指引上传文档、分段设置、确认数据处理。 小技巧:在内容中加上特殊分割符“”,以便于自动切分数据。分段标识符号选择“自定义”,内容填“”。 同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。 3. 创建工作流: 告诉 AI 机器人应该按什么流程处理信息。 创建工作流路径:个人空间 工作流 创建工作流。 工作流设计好后,先点击右上角“试运行”,测试工作流无误后,就可以点击发布。 如果任务和逻辑复杂,可以结合左边“节点”工具来实现。比如:可以在工作流中再次调用【大模型】,总结分析知识库内容;可以调用【数据库】存储用户输入的信息;可以调用【代码】来处理复杂逻辑等。 个人建议:工作流不必复杂,能实现目的即可,所以在设计 Bot 前“确定目的”和“确定功能范围”很重要。 另外,您还可以参考以下 10 分钟在网站上增加一个 AI 助手的方法: 1. 搭建示例网站: 点击打开提供的函数计算应用模板,参考下图选择直接部署、并填写前面获取到的百炼应用 ID 以及 APIKEY。 其他表单项保持默认,点击页面左下角的创建并部署默认环境,等待项目部署完成(预计耗时 1 分钟)。 2. 为网站增加 AI 助手: 增加 AI 助手相关代码:回到应用详情页,在环境详情的最底部找到函数资源,点击函数名称,进入函数详情页。在代码视图中找到 public/index.html 文件,然后取消③所在位置的代码注释即可。最后点击部署代码,等待部署完成。 验证网站上的 AI 助手:重新访问示例网站页面以查看最新效果。此时您会发现网站的右下角出现了 AI 助手图标,点击即可唤起 AI 助手。
2025-01-06
哪款AI 工具可以梳理文档知识形成知识库
以下是一些可以梳理文档知识形成知识库的 AI 工具: 1. Cursor:对于非开发性质的问答,它是一个天然的 RAG 引擎。能针对大的代码库精准找到相关函数,并利用其信息撰写代码。在问答窗口使用 Command 加回车发出问题时,会先在当前文件夹下搜索并显示相关文档和相关度,最后用这些信息构建提示词完成生成。对于非开发任务,也能与私有文档结合问答,并将新生成的 insights 沉淀成新文档,形成知识闭环,提升知识管理效率。 2. 百炼:通过以下步骤为 AI 助手增加私有知识形成知识库: 上传文件:在百炼控制台的中的非结构化数据页签中点击导入数据,根据引导上传虚构的产品介绍。 建立索引:进入,创建新的知识库并选择上传的文件,其他参数保持默认。 引用知识:完成知识库创建后,在中设置,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。 3. kimichat:可以让 AI 拆解书籍的章节并按照 markdown 产出内容,然后将内容复制到在线思维导图 Markmap 中,一键生成思维导图,并可自定义微调内容及免费导出图片。
2025-01-04
如何用AI梳理文档知识
以下是关于如何用 AI 梳理文档知识的一些方法和步骤: 使用 Kimi 梳理文档: Kimi 是月之暗面公司推出的类似 ChatGPT 的大模型聊天机器人,支持超长上下文,能输入长达 20 万字。 可以让 Kimi 梳理全书,与目录对照,脉络会更清晰。 能要求 Kimi 更细致地梳理,虽然目前不能生成思维导图,但可借助 MarkMap 获得。 针对具体章节或知识点,可让 Kimi 展开讲解,还能让其给出例子和代码。 可以让 Kimi 出题测试对知识点的掌握程度。 在网站上增加 AI 助手梳理文档: 上传文件:在百炼控制台的中的非结构化数据页签中点击导入数据,根据引导上传相关文档。 建立索引:进入,创建新的知识库并选择上传的文件,其他参数保持默认。 引用知识:完成知识库创建后,在中进行相关设置,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。 AI 梳理文档的检索原理: 信息筛选与确认:对检索器提供的信息进行评估,筛选出最相关和最可信的内容,验证信息的来源、时效性和相关性。 消除冗余:识别和去除多个文档或数据源中的重复信息。 关系映射:分析不同信息片段之间的逻辑和事实关系。 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。 语义融合:合并意义相近但表达不同的信息片段。 预备生成阶段:将整合好的上下文信息编码成适合生成器处理的格式。 大模型生成回答:大语言模型根据提供的信息来回答问题。
2025-01-04
语料库训练相关文档
以下是为您提供的语料库训练相关文档: 中文数据集 |ID|标题|更新日期|数据集提供者|许可|说明|关键字|类别|论文地址|备注| ||||||||||| |6||2020 年|CLUE||CLUENER2020 数据集,是在清华大学开源的文本分类数据集 THUCTC 基础上,选出部分数据进行细粒度命名实体标注,原数据来源于 Sina News RSS。数据包含 10 个标签类别,训练集共有 10748 条语料,验证集共有 1343 条语料|细粒度;CULE|命名实体识别|\\|中文| |7||英文| |8||||EMNLP2015|命名实体识别||| |9||2005 年|MSR/PKU|||bakeoff2005|命名实体识别||| TTS 超全教程 音库制作和文本前端 音库制作 音频录制 音频的录制对合成语音的表现较为重要,较差的语音甚至会导致端到端声学模型无法正常收敛。用于训练的录音至少要保证录音环境和设备始终保持一致,无混响、背景噪音;原始录音不可截幅;如果希望合成出来的语音干净,则要删除含口水音、呼吸音、杂音、模糊等,但对于目前的端到端合成模型,有时会学习到在合适的位置合成呼吸音、口水音,反而会增加语音自然度。录音尽可能不要事先处理,语速的调节尚可,但调节音效等有时会造成奇怪的问题,甚至导致声学模型无法收敛。音频的录制可以参考录音公司的标准,购买专业麦克风,并保持录音环境安静即可。在音库录制过程中,可尽早提前尝试声学模型,比如音库录制 2 个小时语音后,就可尝试训练基线语音合成系统,以防止录音不符合最终的需求。 语料整理 检查文本和录制的语音是否一一对应,录制的音频本身一句话是否能量渐弱,参与训练的语音前后静音段要保持一致,能量要进行规范化。可使用预训练的语音活动检测(Voice Activity Detection,VAD)工具,或者直接根据语音起止的电平值确定前后静音段。可以使用一些开源的工具,比如统一所有语音的整体能量,这将有助于声学模型的收敛。当然,在声学模型模型训练时,首先就要对所有语料计算均值方差,进行统一的规范化,但是这里最好实现统一能量水平,防止一句话前后能量不一致。能量规整的示例代码如下。
2025-01-02