Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

构建新闻收集的 Agent 工具

Answer

以下是构建新闻收集的 Agent 工具的相关内容:

  1. 可以通过 Coze 建立定时任务,执行工作流二,并添加分析文章和搜索文章等能力,变成一个消息情报官的 Agent,能够获得想要的领域或行业情报,还能深入挖掘相关情报信息。然后发布到 Coze 商店、豆包、飞书、微信、微信公众号、微信小程序等平台即可使用。可以构建多个分身,收集整理不同领域和行业的情报信息。
  2. 最近 wiseflow 首席情报官很火,但几乎没有教程和搭建成功案例,其代码存在问题且依赖收费的 OpenAI API。可行的 Free 方案是通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答。
  3. 可以通过读 SQLiteDB 或者获取 RSS XML 页面 http://127.0.0.1:4000/feeds/all.atom 来获取更新的公众号。在公众号订阅不多时,建议使用分析 XML 页面。由于本地部署无法直接将文章同步到 Coze,可以选择使用多维表格及飞书机器人 API 的方式来实现中间数据的传递。在多维表格中设置状态转换,以了解文章是否已被解读和推送。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI实战:搭建信息情报官Agent

最后我们可以通过Coze,建定时任务,执行工作流二,并添加其他如分析文章和搜索文章的能力,即可变成一个消息情报官的Agent,我们即可以获得想要的领域或行业情报,也可以深入挖掘相关情报的信息(CoT)。然后发布到想要的,如:Coze商店、豆包、飞书、微信、微信公众号、微信小程序等,即可使用了。可以构建多个分身,就能收集整理不同领域和行业的情报信息了。如感兴趣欢迎联系交流合作。介绍齐码蓝智能Focusing on Technology,Life,and Truth可以试试在公众号发消息向AI学伴提问,发消息加群可交流合作加AM聊天机器人(微信号:ZiMacroQubit)文章部分内容、图片、代码由AM帮助完成阅读本文,请点击在看并感谢您的点赞鼓励

AI实战:搭建信息情报官Agent

最近[wiseflow](https://github.com/TeamWiseFlow/wiseflow)首席情报官很火,到处在转发其Demo视频,但仔细搜了一下,几乎没有教程和有人搭建成功的案例。代码更新也是停留在2周前了。查看了下代码(https://github.com/TeamWiseFlow/wiseflow/blob/master/dashboard/get_search.py),发现其实就是用了爬虫通过搜狗搜索公众号内容来实现,殊不知几年前我就用这个(爬Sogou的方式)发现其实是会触发Sogou和微信公众号反爬robots.txt的。所以这个方案不可行,而且wiseflow还是得依赖收费的OpenAI API的。有没有可行的Free方案?这里我详细介绍一种通过文章链接订阅公众号,定时推送情报消息,并实现情报CoT问答的一种方式。先上效果图:再上架构:搭建情报官Agent全过程

AI实战:搭建信息情报官Agent

我们可以通过读这个SQLiteDB或者获取RSS XML页面http://127.0.0.1:4000/feeds/all.atom,获取到更新的公众号,个人选择在公众号订阅不太多时,建议使用分析XML页面比较简单,其实都不难。这样我们就可以写个程序获得公众号的更新文章,因为本地部署,无法直接将文章同步到Coze,所以我选择使用多维表格(当在线数据库,事实飞书多维表格后台也是使用类似redis或TiDB这样的数据库实现的)及飞书机器人API的方式来实现中间数据的传递。我们只要在多维表格中设置一个状态转换,就可以知道文章是否已经被解读和推送,后面我还想将文章解读得到关键词来作为词云和键值搜索,实现文章的RAG,这是后话,这里先不这么复杂。然后我们就可以在Coze上拱建工作流。

Others are asking
新手小白,如何从0开始搭建AI Agent
对于新手小白从 0 开始搭建 AI Agent,以下是一些建议: 1. 规划阶段: 制定任务的关键方法,总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施阶段: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善阶段: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 此外,还需要了解一些关于 AI Agent 的基本概念: AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括 Chain(通常一个 AI Agent 可能由多个 Chain 组成,一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量,大部分的 Chain 是大语言模型完成的 LLM Chain)、Router(可以使用一些判定,甚至可以用 LLM 来判定,然后让 Agent 走向不同的 Chain)、Tool(Agent 上可以进行的一次工具调用,例如对互联网的一次搜索,对数据库的一次检索)。 常见的 AI Agent 有 Responser Agent(主 agent,用于回复用户)、Background Agent(背景 agent,用于推进角色当前状态)、Daily Agent(每日 agent,用于生成剧本,配套的图片,以及每日朋友圈)。这些 Agent 每隔一段时间运行一次(默认 3 分钟),会分析期间的历史对话,变更人物关系、反感度等,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。
2025-01-23
如何解决agent幻觉问题
在大型语言模型(LLM)中,幻觉通常指模型生成不忠实、捏造、不一致或无意义的内容。幻觉主要分为两种类型: 1. 上下文内幻觉:模型输出应与上下文中的源内容一致。 2. 外部幻觉:模型输出应基于预训练数据集,与预训练数据中的知识相符。由于预训练数据集规模庞大,每次生成都去检索和识别冲突成本太高。若将预训练数据语料库视为世界知识的代表,应努力确保模型输出是事实的,且在不知答案时明确表示。 为避免幻觉,LLM 需做到: 1. 输出符合事实的内容。 2. 适用时承认不知道答案。 在 LLM 驱动的自主 Agents 中,启发式函数可决定轨迹是否低效或包含幻觉。低效规划指花费过长时间未成功的轨迹,幻觉指遇到一系列连续相同动作导致环境中出现相同观察。自我反思可通过向 LLM 展示示例创建,并添加到 Agents 的工作记忆中。在 AlfWorld 中,幻觉比低效规划更常见。 对于处理 ChatGPT 的“幻觉”,有以下经验: 1. 明确告诉它想要准确答案,无幻觉。 2. 改变 temperature 参数(如改到 0)或控制创造力水平。 3. 得到答案后,要求它为每个引用产生精确的引用和页面,以便交叉检查。
2025-01-22
AI agent
以下是关于 AI Agent 的相关信息: AI Agent 是当您经常使用各种 AI 聊天工具但觉得不太够用,希望大模型搭配更多工具和能力以提供更稳定服务和输出时可以关注的板块。AI Agent 相关的平台和产品众多,百宝箱是其中一款来自阿里系的产品,登录链接为:https://tbox.alipay.com/proabout 。如果您是不会写代码、对 AI Agent 毫无使用经验的小白,或者看到宣传想尝试百宝箱的使用方法和能力,这篇分享可能对您有帮助。 最近测试百宝箱的原因是作者的小队伍“来都来了”参加比赛时发现其在大力搞比赛。百宝箱具有当前大模型随便用的特点,如通义千问·Max、月之暗面、智谱、百灵等统统免费。在文旅和传媒方面,支付宝为其提供了天然渠道,作者刚好在考虑相关探索,试用时看到首页相关标签栏露出,期待能带来渠道和流量,而且刚推广力度大。 此外,为您提供一些生成式人工智能的相关链接: Ask a Techspert:What is generative AI? https://blog.google/insidegoogle/googlers/askatechspert/whatisgenerativeai/ Build new generative AI powered search&conversational experiences with Gen App Builder: https://cloud.google.com/blog/products/aimachinelearning/creategenerativeappsinminuteswithgenappbuilder What is generative AI? https://www.mckinsey.com/featuredinsights/mckinseyexplainers/whatisgenerativeai Google Research,2022&beyond:Generative models: https://ai.googleblog.com/2023/01/googleresearch2022beyondlanguage.htmlGenerativeModels Building the most open and innovative AI ecosystem: https://cloud.google.com/blog/products/aimachinelearning/buildinganopengenerativeaipartnerecosystem Generative AI is here.Who Should Control It? https://www.nytimes.com/2022/10/21/podcasts/hardforkgenerativeartificialintelligence.html Stanford U&Google’s Generative Agents Produce Believable Proxies of Human Behaviors: https://syncedreview.com/2023/04/12/stanfordugooglesgenerativeagentsproducebelievableproxiesofhumanbehaviours/ Generative AI:Perspectives from Stanford HAI: https://hai.stanford.edu/sites/default/files/202303/Generative_AI_HAI_Perspectives.pdf Generative AI at Work: https://www.nber.org/system/files/working_papers/w31161/w31161.pdf
2025-01-22
我想系统了解有关agent的应用及发展情况
智能体(Agent)在现代计算机科学和人工智能领域是一个基础且重要的概念,具有广泛的应用和不断发展的技术。 应用领域: 1. 自动驾驶:汽车中的智能体感知周围环境,做出驾驶决策。 2. 家居自动化:智能家居设备根据环境和用户行为自动调节。 3. 游戏 AI:游戏中的对手角色和智能行为系统。 4. 金融交易:金融市场中的智能交易算法根据市场数据做出交易决策。 5. 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 6. 机器人:各类机器人中集成的智能控制系统。 设计与实现: 通常涉及以下几个步骤: 1. 定义目标:明确智能体需要实现的目标或任务。 2. 感知系统:设计传感器系统,采集环境数据。 3. 决策机制:定义智能体的决策算法,根据感知数据和目标做出决策。 4. 行动系统:设计执行器或输出设备,执行智能体的决策。 5. 学习与优化:如果是学习型智能体,设计学习算法,使智能体能够从经验中改进。 发展情况: Agent 算是从年前到现在比较火的一个概念,也被很多人认为是大模型的未来的一个主要发展方向。目前行业里主要用到的是一个叫 langchain 的框架,它把大模型(LLM)和 LLM 之间,以及 LLM 和工具之间,通过代码或 prompt 的形式进行了串接。为 LLM 增加了工具、记忆、行动、规划等能力。 随着 AI 的发展,大家对 AI 的诉求变得越来越具体,简单的 ChatBot 的弊端日渐凸显,基于 LLM 对于 Agent 的结构设计,Coze、Dify 等平台在应用探索上有了很大的进展。但这些平台都有着固有局限,对于专业 IT 人士不够自由,对于普通用户完成复杂业务场景又有限制。
2025-01-19
国内优秀Agent应用案例
以下是一些国内优秀的 Agent 应用案例: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 3. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 4. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色,提供更深入的环境感知和记忆功能。
2025-01-19
怎么做 agent,有什么 coze做 agent 的视频教程
以下是一些关于如何做 Agent 以及相关的 Coze 视频教程: 基础教程: 大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库 (https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb) 大聪明:保姆级教程:Coze 打工你躺平 (https://waytoagi.feishu.cn/wiki/PQoUwXwpvi2ex7kJOrIcnQTCnYb) 安仔:Coze 全方位入门剖析 免费打造自己的 AI Agent (https://waytoagi.feishu.cn/wiki/SaCFwcw9xi2qcrkmSxscxTxLnxb) 基础教程:Coze“图像流”抢先体验 (https://waytoagi.feishu.cn/wiki/AHs2whOS2izNJakGA1NcD5BEnuf) YoYo:Coze 图像流小技巧:探索视觉艺术的隐藏宝藏 (https://waytoagi.feishu.cn/wiki/CTajwJnyZizxlJk8a4AcJYywnfe) 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档 (https://waytoagi.feishu.cn/wiki/ExHMwCDZ7i6NA7knCWucFvFvnvJ) 历史活动教程: 5 月 7 号():大聪明分享|主题:Agent 的前世今生,每个分享人分享最初是怎么接触 Coze 的,以及现在用 Coze 做什么 5 月 8 号():大圣分享|主题:我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze 5 月 9 号():艾木分享|主题:Agent 系统的核心构成:Workflow 和 Multiagent Flow(以“Dr.Know”和“卧底”为例,线上答疑 5 月 10 号():罗文分享|主题:一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书 5 月 11 号():Itao 分享|主题:和 AI 成为搭子,线上答疑
2025-01-18
如何构建企业AI知识库
构建企业 AI 知识库可以参考以下步骤: 1. 结合企业私有数据与 RAG 模型的私有化部署。如有特殊需求,还可以进行模型的 Finetuning(微调),以优化性能。基础模型负责提供推理提示,RAG 用于整合新知识,实现快速迭代和定制化信息检索。 2. 确定功能范围,包括编写【prompt】提示词,设定 Bot 的身份和目标。 3. 创建【知识库】: 整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。 选择创建知识库路径,如个人空间知识库创建知识库。 支持的知识库文档类型包括本地文档、在线数据、飞书文档、Notion 等,可根据需求选择,如本次使用【本地文档】。 按照操作指引上传文档、分段设置、确认数据处理。 小技巧:知识库的好用程度与内容切分粒度有关,可以在内容中加上特殊分割符,如“”,便于自动切分数据。分段标识符号选择“自定义”,内容填“”。如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮进行相应操作。 在构建过程中,KnowHow 很重要,同时工作流不必复杂,能实现目的即可,所以在设计 Bot 前“确定目的”和“确定功能范围”很关键。
2025-01-23
本地怎么构建知识库
以下是关于本地构建知识库的详细步骤和相关知识: 一、硬件配置要求 运行大模型需要较高的机器配置,个人玩家可能负担不起。 生成文字大模型: 最低配置:8G RAM + 4G VRAM 建议配置:16G RAM + 8G VRAM 理想配置:32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型) 生成图片大模型(比如跑 SD): 最低配置:16G RAM + 4G VRAM 建议配置:32G RAM + 12G VRAM 生成音频大模型: 最低配置:8G VRAM 建议配置:24G VRAM 二、RAG 技术 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在进行本地知识库的搭建实操之前,需要先对 RAG 有大概的了解。 RAG 是指检索增强生成(Retrieval Augmented Generation),当需要依靠不包含在大模型训练集中的数据时,通过以下 5 个过程实现: 1. 文档加载(Document Loading):从多种不同来源加载文档。LangChain 提供了 100 多种不同的文档加载器,包括 PDF 在内的非结构化的数据、SQL 在内的结构化的数据,以及 Python、Java 之类的代码等。 2. 文本分割(Splitting):文本分割器把 Documents 切分为指定大小的块。 3. 存储:涉及将切分好的文档块进行嵌入(Embedding)转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. Output(输出):把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 三、本地知识库搭建步骤 如果想要对知识库进行更加灵活的掌控,需要一个额外的软件:AnythingLLM。 1. 安装 AnythingLLM 安装地址:https://useanything.com/download 安装完成后,会进入到其配置页面,主要分为三步: 第一步:选择大模型 第二步:选择文本嵌入模型 第三步:选择向量数据库 2. 构建本地知识库 AnythingLLM 中有一个 Workspace 的概念,可以创建自己独有的 Workspace 跟其他的项目数据进行隔离。 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式。AnythingLLM 提供了两种对话模式: Chat 模式:大模型会根据自己的训练数据和上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 测试对话:当上述配置完成之后,就可以跟大模型进行对话了。 四、写在最后 “看十遍不如实操一遍,实操十遍不如分享一遍”。如果对 AI Agent 技术感兴趣,可以联系作者或者加作者的免费知识星球(备注 AGI 知识库)。
2025-01-22
我能否借助开源社区力量构建高质量的 AI 数字人
您可以借助开源社区力量构建高质量的 AI 数字人。 构建数字人的躯壳有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表是 UE、Unity、虚幻引擎 MetaHuman 等,但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:省去建模流程直接生成数字人的展示图片,但存在算法生成的数字人很难保持 ID 一致性、帧与帧连贯性差等弊端。如果对人物模型真实度要求不高,可以使用,典型项目有 wav2lip、videoretalking 等。AIGC 还有直接生成 2D/3D 引擎模型的方向,但仍在探索中。 构建数字人的灵魂需要注意以下几个工程关键点: 1. AI Agent:要让数字人像人一样思考就需要写一个像人一样的 Agent,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建都是挑战。 2. 驱动躯壳的实现:灵魂部分通过定义接口由躯壳部分通过 API 调用,调用方式可以是 HTTP、webSocket 等。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对成熟但闭源。 3. 实时性:由于算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的 API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。 4. 多元跨模态:不仅仅是语音交互,还可以通过添加摄像头数据获取数据,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常和人交流时不是线性对话,会有插话、转移话题等情况,这些情景需要通过工程丝滑处理。 如果都要自建代码实现各模块,开发工作量巨大,迭代难度也很高,对于个人开发者来讲不现实。因此推荐借助开源社区的力量,现在开源社区已经有了像 dify、fastgpt 等等成熟的高质量 AI 编排框架,它们有大量的开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等等。我们可以通过这些框架快速编排出自己的 AI Agent,赋予数字人灵魂。在笔者的开源项目中,使用了 dify 的框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。同时 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于这个两个接口就可以将数字人的语音识别和语音生成都交由 Dify 控制,从而低门槛做出来自己高度定制化的数字人。具体的部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。如果有更加高度定制的模型,也可以在 Dify 中接入 XInference 等模型管理平台,然后部署自己的模型。此外,数字人 GUI 工程中仍然保留了 LLM、ASR、TTS、Agent 等多个模块,能够保持更好的扩展,比如实现更加真实性感的语音转换、或者如果有更加 Geek 的 Agent 实现也可以选择直接后端编码扩展实现。 使用 Dify 接口需要注意: 1. 必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。 2. 只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商,才会在功能板块中展示出来,Dify 的模型供应商图标下标签有展示该供应商支持哪些功能,这里可以自行选择自己方便使用的。对于 TTS,不同的模型供应商支持的语音人物不同,可以根据个人喜好添加。
2025-01-21
如何构建自己的AI职业
以下是关于构建自己的 AI 职业的一些建议: 1. 掌握 Prompt 工程:了解 Claude 的 5 层 Prompt 体系,将其应用到日常工作中,如市场研究、写作、数据分析等项目,以提升驾驭 AI 的能力。 2. 借助元学习:鉴于人工智能依赖的神经网络基础,通过元学习让 AI 更快地获得知识,与人类共同进步。 3. 实践打造微信 AI 机器人: 确定功能范围,如支持用户发送“关键字”获取“AI 相关资料链接”,回答 AI 相关知识,作为微信客服助手发布在微信公众号上。 准备实现所需的内容,包括编写 prompt 提示词,整理“关键字”与“AI 相关资料链接”的对应关系,创建知识库、工作流,准备微信公众号。
2025-01-12
人工智能构建第二大脑
以下是关于人工智能构建第二大脑的相关内容: 信息到智慧的进化是一个动态、渐进的过程,不仅需要外部信息输入,还需内部认知加工。随着人工智能技术发展,这一进程极大加速和优化。AI 能帮助更快收集处理信息、构建知识体系,甚至模拟人类决策过程。 信息、知识、智慧是人类认知和决策的三个层次,相互联系作用。在 AI 时代,有更多工具和方法加速从信息到智慧的进化,构建高效知识管理体系。 从信息到知识:Forte 强调“外部大脑”概念,利用数字工具和系统存储思考、想法和信息,释放认知负担,专注创意和高阶思考。可使用数字笔记工具记录,通过分类、标签或链接关联零散信息形成知识网络,对信息深加工提炼知识。 从知识到智慧:智慧形成不仅需知识积累,更要深刻理解和应用。Forte 提倡复盘和整合,复盘指定期回顾笔记和想法加深理解发现新联系,整合指将新理解和旧知识融合形成更全面深入见解。通过不断复盘和整合,将知识内化为理解和智慧,可能涉及跨领域知识融合、问题解决策略创新或对复杂系统深刻洞察。 AI 时代的信息到智慧进化:这一进化过程加速,AI 和机器学习技术可处理分析大量信息,识别模式联系,通过智能推荐等功能提高从信息到知识转化效率,辅助决策分析等应用模拟扩展人类智慧。结合《打造第二大脑》理论和 AI 技术发展,人类知识管理和智慧发展处于全新充满可能的时代,个人和组织通过高效信息管理可提升生产力创造力,形成独到智慧见解。在信息泛滥时代,引入 DIKW 模型和 CODE 信息管理法则可提供更深刻理解和实践指导。 此外,构建外脑的核心是思维方式与执行方法,虽核心不是工具,但好工具能提升效率。在智能时代,处理语言与数据效率指数级提升,影响软件工具使用、设计及对知识管理与传播的认知方式。
2025-01-11
如何构建一个AI数字人分身
构建一个 AI 数字人分身主要包括以下两个方面: 一、构建数字人躯壳 数字人的躯壳建模有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢。能将喜欢的动漫人物变成数字人的躯壳。代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体。如 NextHuman、Unity,虚幻引擎 MetaHuman 等。但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:虽然省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2d/3d 引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。 二、构建数字人灵魂 有了数字人躯壳,还需要构建数字人的灵魂,让数字人具备各种智能,比如记得个人信息,充当个人助手;在某个领域具备更专业的知识;能处理复杂的任务等等。实现这些能力有以下几个工程关键点: 1. AI Agent:要想数字人像人一样思考就需要写一个像人一样的 Agent,工程实现所需的记忆模块,工作流模块、各种工具调用模块的构建都是挑战。 2. 驱动躯壳的实现:灵魂部分通过接口定义,躯壳部分通过 API 调用,调用方式可以是 HTTP、webSocket 等,视躯壳部分的实现而定。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对来说成熟一些,但都是闭源的,效果可以参考 Nvidia 的 Audio2Face。 3. 实时性:由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的 API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。 4. 多元跨模态:仅仅是语音交互的数字人是远远不够的,人有五感(听觉、视觉、嗅觉、触觉、味觉),听觉只是其中一种,其他的感官可以根据实际需求来做,比如视觉可以通过添加摄像头数据来获取数据,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常和人交流的时候不是线性对话,会有插话、转移话题等情况,这些情景需要通过工程丝滑处理。
2025-01-03
收集资料,整合网站链接
以下是关于利用 AI 收集资料和整合网站链接的相关内容: 利用 AI 收集资料: 明确文章主题后,可借助 AI 高效收集相关资讯。例如使用 Perplexity.AI,访问其网站并使用搜索功能,为获取更专业深入的结果,可启用 Pro 功能(每天有一定次数免费使用,常使用可考虑开通会员)。在搜索框输入具体 Prompt 如“查找关于 OpenAI 对马斯克言论回应的博客文章”,快速定位相关资讯。获取搜索结果后,点击回答内容下方的拷贝按钮获取引用网站链接。同理,微软的 Bing 搜索引擎等具备联网搜索功能的工具也能实现类似功能,帮助快速搜集大量资料,提升文章专业度和说服力。 整合网站链接: 1. 整理资料时,可使用月之暗面开发的 Kimi 这个 AI 会话助手。它具备读取网页内容并生成一定内容的能力,读取完毕会显示绿色标点提示。但它阅读能力有限,可能无法一次性处理大量资讯或读取某些网站内容,可分批次提供资料确保有效读取和理解。 2. 以下是一些收录 GPTs 的网站: Hallidai:,特点是索引了周日为止 𝕏 上公开提及的全部 GPTs 数据,后面会每天持续更新,用提及每个 GPTs 的点赞数最高的 tweet 作为初始的 upvotes 来展示热度,也提供了大家 upvote 自己喜欢的 GPTs 的功能,支持搜索,用 Semantic Search 的方式方便大家快速找到想要的 GPTs。 GPTStore:,特点是内容全,有搜索,有热度。 Aigenthub:,特点是有搜索,可讨论,内容全。 GPTs Hunt:,特点是 9557 GPTs。 GPTsPartner:,特点是每日更新,有搜索。 GPTseek:,特点是用户可投票筛选高质量 GPTs,有分类筛选和提交自己的 GPTs 功能,有热度,内容全。
2025-01-14
是否有针对访谈收集的数据做分析的智能体或应用?
目前存在针对访谈收集的数据做分析的智能体或应用。例如,在个人实操案例中,有人为了做 AI 访谈,搭建了一个 AI 访谈 bot,希望借此了解朋友们做访谈的意愿和产出内容的质量水平,同时还希望这个 bot 具备内容推荐的能力。 智能体在各种应用中扮演重要角色,如自动驾驶中感知周围环境并做出驾驶决策,家居自动化中根据环境和用户行为自动调节智能设备,游戏 AI 中的对手角色和智能行为系统,金融交易中的智能交易算法,客服聊天机器人通过自然语言处理提供自动化客户支持,以及机器人中集成的智能控制系统等。 设计和实现一个智能体通常涉及定义目标、感知系统、决策机制、行动系统、学习与优化等步骤。首先要明确智能体需要实现的目标或任务,设计传感器系统采集环境数据,定义决策算法,设计执行器或输出设备,对于学习型智能体还需设计学习算法以从经验中改进。
2024-12-15
我想收集一些AIGC行业应用的案例
以下是一些 AIGC 行业应用的案例: 在内容创作方面: 文字生成:使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容。 图像生成:使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等。 视频生成:使用 Runway、KLING 等模型生成动画、短视频等。 在制造业领域: 产品设计和开发:利用 AI 生成工具如 Adobe Firefly、Midjourney 等,可以根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素,大幅提高产品设计效率。 工艺规划和优化:结合大语言模型的自然语言处理能力,可以自动生成制造工艺流程、设备选型、质量控制等方案,优化生产过程。 设备维护和故障诊断:利用 AI 模型分析设备运行数据,可以预测设备故障,并自动生成维修建议,提高设备可靠性。 供应链管理:AI 可以根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容,提高供应链管理效率。 客户服务:基于对话模型的 AI 客服机器人,可以自动生成个性化的客户回复,提升客户体验。 在医疗行业: 疾病的诊断与预测、药物研发以及个性化医疗。例如,麻省理工学院利用 AI 发现了一种名为 Halicin 的新型广谱抗生素。 在广告营销行业: 从初期的市场分析、中期的客户转化以及后期的客户复购均可参与,为消费者提供更个性化、智能化和互动性强的营销体验,还能降低内容制作成本并加速创意实现。
2024-11-20
撰写内容概要:以ai换脸诈骗和声音合成诈骗为蓝本查阅网站、文献期刊等专家在相关方面的研究进展及其成果,并进行汇总评述。(1)表述收集资料的来源情况、收集资料的数量情况;(2)将所收集的资料进行分类,按照几个分类方面逐一进行表述,表述涵盖专家的观点、结论、思路、方案等;(3)小组综合性的对所收集到的资料进行评述,描述当前的进展情况、优劣点、未来发展等。)
以下是根据您提供的资料进行的汇总评述: 一、收集资料的情况 1. 来源情况:资料来源于陶力文律师的相关论述、关于 AI 音乐的论文、质朴发言的研究报告等。 2. 数量情况:共收集到 3 份相关资料。 二、资料分类及专家观点 1. 关于律师如何写好提示词用好 AI 观点:强调结构化内容组织、规定概述内容解读结语结构、案例和挑战结合、结合法规和实际操作、使用商业术语等。 结论:通过多种方式提升文章的专业性和针对性。 思路:从标题、文章结构等方面进行规划。 方案:按照特定的结构和要求进行写作。 2. 基于频谱图的音乐录音中自动调谐人声检测 观点:聚焦音乐中人声音高的自动调音检测,提出数据驱动的检测方法。 结论:所提方法在检测上表现出较高的精确度和准确率。 思路:包括音频预处理、特征提取和分类等步骤。 方案:创建新数据集,进行全面评估。 3. 文生图/文生视频技术发展路径与应用场景 观点:从横向和纵向梳理文生图技术发展脉络,分析主流路径和模型核心原理。 结论:揭示技术的优势、局限性和未来发展方向。 思路:探讨技术在实际应用中的潜力和挑战。 方案:预测未来发展趋势,提供全面深入的视角。 三、综合性评述 当前在这些领域的研究取得了一定的进展,如在音乐自动调音检测方面提出了新的方法和数据集,在文生图/文生视频技术方面梳理了发展路径和应用场景。 优点在于研究具有创新性和实用性,为相关领域的发展提供了有价值的参考。但也存在一些不足,如音乐检测研究中缺乏专业自动调音样本,部分技术在实际应用中可能面临一些挑战。 未来发展方面,有望在数据样本的丰富性、技术的优化和多模态整合等方面取得进一步突破,拓展更多的应用场景。
2024-11-15
AI 辅助信息收集与分析
以下是关于 AI 辅助信息收集与分析的相关内容: 利用 AI 辅助写作课题的步骤和建议: 1. 确定课题主题:明确研究兴趣和目标,选择有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:借助 AI 工具确保内容准确完整。 6. 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若课题涉及,使用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具撰写各部分,并检查语法和风格。 9. 生成参考文献:使用 AI 文献管理工具生成正确格式。 10. 审阅和修改:利用 AI 审阅工具检查逻辑性和一致性,并根据反馈修改。 11. 提交前的检查:使用 AI 抄袭检测工具确保原创性,进行最后的格式调整。需记住,AI 是辅助,不能替代研究者的专业判断和创造性思维,要保持批判性思维,确保研究质量和学术诚信。 在制定和优化 SOP 方面,AI 助手能发挥重要作用: 1. 数据收集与分析:帮助收集和分析工作数据,找出瓶颈和问题,提出改进建议以优化流程。 2. 自动化流程:通过 RPA 技术自动化重复性高、标准化强的工作流程,提高效率。 3. 实时监控与反馈:实时监控工作流程,及时发现问题并反馈,以便及时调整。 人工智能在汽车行业的应用案例: 1. 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,实现自主导航和驾驶,如特斯拉、Waymo 和 Cruise 等公司在开发和测试。 2. 车辆安全系统:用于增强自动紧急制动、车道保持辅助和盲点检测等系统的性能,预防事故。 3. 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置,如座椅位置、音乐选择和导航系统。 4. 预测性维护:分析车辆实时数据预测潜在故障和维护需求,减少停机和维修成本。 5. 生产自动化:在汽车制造中用于自动化生产线,提高生产效率和质量控制。 6. 销售和市场分析:分析市场趋势、消费者行为和销售数据,制定营销策略和优化产品定价。 7. 电动化和能源管理:在电动汽车的电池管理和充电策略中发挥作用,提高能源效率和延长电池寿命。 8. 共享出行服务:优化路线规划、调度车辆和定价策略,提高服务效率和用户满意度。 9. 语音助手和车载娱乐:如 Amazon Alexa Auto 和 Google Assistant 等,允许语音控制车辆功能、获取信息和娱乐内容。 10. 车辆远程监控和诊断:远程监控车辆状态,提供实时诊断和支持。
2024-10-29
资讯收集机器人
以下是关于资讯收集机器人的相关信息: 上周使用 GPT4 创建了一个信息收集机器人,用于监控指定推特账户,将信息交给 ChatGPT 翻译并总结,然后发送到 Discord 指定频道。具体步骤包括:简单说明需求让 GPT4 给出建议,获取更具体可执行方法,用 zapier 创建机器人,触发器选择推特 APP 并绑定账号,将信息发送给 ChatGPT 并设置处理方式和输出格式,最后链接 Discord 创建机器人并选择发送频道和信息。详细内容和 zapier 机器人模板可参考:https://op7418.zhubai.love/posts/2251721691841511424 。 本地部署资讯问答机器人可通过 Langchain + Ollama + RSSHub 实现 RAG,包括加载所需库和模块,如 feedparse 用于解析 RSS 订阅源,ollama 用于在 python 程序中跑大模型(使用前需确保 ollama 服务已开启并下载好模型);从订阅源获取内容,通过函数从指定 RSS 订阅 url 提取内容并处理;为文档内容生成向量,使用文本向量模型 bgem3(https://huggingface.co/BAAI/bgem3),从 hf 下载好模型后通过函数利用 FAISS 创建高效向量存储。 介绍了一些大模型,如 Google 推出的 Gemma(下载的是 7B 模型)、欧洲法国 Mistral AI 团队推出的 Mistral(7B 模型)和 Mixtral(87B 的 MoE 模型)、阿里巴巴推出的 Qwen(通义千问,7B 模型)。 强调了 RSS 作为数据源的作用,虽然在日常获取资讯时手机 APP 基本够用,但对于特定需求从某些网站获取最新通知或相关信息,如获取 https://openai.com/blog 的最新更新、https://www.producthunt.com 每天的热门产品、https://github.com/trending 每天的热门开源项目等,RSS 仍有其优势。
2024-10-09
你有哪些AI工具
以下是一些常见的 AI 工具: 对于建筑设计师审核规划平面图,有以下工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 Maket.ai:面向住宅行业,可根据输入自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,能引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,实现建筑全寿命周期内信息的集成与管理。 绘制逻辑视图、功能视图、部署视图的工具包括: Lucidchart:流行的在线绘图工具,支持多种图表创建。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合使用可创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 draw.io(diagrams.net):免费的在线图表软件。 PlantUML:文本到 UML 转换工具,可通过描述文本生成相关视图。 Gliffy:基于云的绘图工具,支持创建多种架构图。 Archi:免费开源工具,支持逻辑视图创建。 Rational Rose:IBM 的 UML 工具,支持多种视图创建。 与 Excel 相关的 AI 工具和插件有: Excel Labs:Excel 插件,新增生成式 AI 功能,基于 OpenAI 技术。 Microsoft 365 Copilot:整合办公软件,通过聊天形式完成任务。 Formula Bot:提供数据分析聊天机器人和公式生成器功能。 Numerous AI:支持 Excel 和 Google Sheets,可生成文本、执行情感分析等任务。
2025-01-23
coze插件工具使用
使用 Coze IDE 创建插件的操作步骤如下: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入插件页面,或者在某一 Bot 的编排页面,找到插件区域并单击“+”图标。 4. 单击“创建插件”。 5. 在新建插件对话框,根据以下信息完成配置并单击“确认”: 插件图标:(可选)单击默认图标后,您可以上传本地图片文件作为新的图标。 插件名称:自定义插件名称,用于标识当前插件。建议输入清晰易理解的名称,便于大语言模型搜索与使用插件。 插件描述:插件的描述信息,一般用于记录当前插件的用途。 插件工具创建方式:选择在 Coze IDE 中创建。 IDE 运行时:选择 Node.js 或者 Python3。 6. 在插件详情页,单击“在 IDE 中创建工具”。 7. 在弹出的创建工具对话框,设置工具名称和介绍,以明确工具的用途,并单击“确定”。工具名称和介绍越清晰,大语言模型就越能理解并使用它。创建后,您将跳转到 Coze IDE 页面进行编码。 8. (可选)在 IDE 左上角工具列表区域,单击“+”图标,向插件添加更多工具。您还可以通过单击列表内某一工具的设置图标,来编辑、删除或重置代码。 9. (可选)在 IDE 左下角依赖包区域,管理依赖包,所有工具共用该依赖列表。 以下是一个网页搜索工具的元数据配置说明: |配置项|描述| ||| |名称|工具名称。建议输入清晰易理解的名称,便于后续大语言模型搜索与使用工具。| |描述|工具的描述信息,一般用于记录当前工具的用途。| |启用|是否启用当前工具。使用说明:<br>如果工具未开发测试完成,建议先禁用该工具,只启用并发布已通过测试的工具。<br>如果需要下线某一工具,可将该工具设置为禁用,并再次发布插件。<br>如果插件中只有一个工具,则不支持禁用该工具。如需下线该工具,您可以选择直接删除该插件,或者创建另一个工具并完成开发测试后,再禁用该工具,最后发布插件。| |输入参数|当前工具对应接口的输入参数信息。准确、清晰易理解的参数名称、描述等信息,可以让大语言模型更准确的使用工具。| |输出参数|当前工具对应接口的输出参数信息。准确、清晰易理解的参数名称、描述等信息,可以让大语言模型更准确的使用工具。| 在页面右侧单击测试代码图标并输入所需的参数,然后单击“Run”测试工具。如果您在元数据设置了输入参数,可单击自动生成图标,由 IDE 生成模拟数据,您只需要调整参数值即可进行测试。您可以在控制台区域查看运行日志、在输出区域查看运行结果,单击更新输出参数,IDE 会自动把输出结果中的参数,更新到元数据的输出参数中。 Coze 提供了丰富的插件,涵盖了从搜索引擎、文本分析以及图像识别等各种领域。这些插件的能力如果我们个人接入都是要收费的,但是在 Coze 平台则是免费使用的,例如: Coze 国内版本:https://www.coze.cn/store/plugin 必应搜索 LinkReader:读取文档 知乎热榜 而且国内版本还提供了很多便民的服务,例如: 新闻资讯 头条新闻:持续更新,了解最新的头条新闻和新闻文章。 天气预报 墨迹天气:提供省、市、区县的未来 40 天的天气情况,包括温度、湿度、日夜风向等。 出行必备 飞常准:通过 VariFlight 覆盖的全球商业客运航班,您的终端用户可以轻松获得他们的航班状态、办理登机手续柜台、预计出发时间、登机口、登机状态、行李转盘等信息,并能在整个航程中随时掌握。 猫途鹰:查询实时酒店搜索,航班价格,餐厅,吸引人的旅游地点等信息以创建一个旅行网站。 生活便利 快递查询助手、国内快递查询:查询快递单号,快递公司,快递进度等信息。 食物大师:Food Master 提供食物搜索功能。 懂车帝:如果你想要查询汽车信息,包括二手车、新车、某些车型的信息时可以使用此插件进行查询。 幸福里:提供二手房、新房、租房信息的插件,想要查询某个城市、区域、户型的房产信息时,可以使用此插件。 猎聘:帮助用户根据工作经验、教育经历、地理位置、薪水、职位名称、工作性质等条件搜索猎聘上提供的招聘信息。
2025-01-23
目前最强大的AI工具
目前较为强大的 AI 工具包括以下几类: 绘制逻辑视图、功能视图、部署视图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种视图创建,操作便捷。 2. Visual Paradigm:全面的 UML 工具,功能丰富。 3. ArchiMate:开源建模语言,与 Archi 工具配合使用。 4. Enterprise Architect:强大的建模、设计和代码生成工具。 5. Microsoft Visio:广泛使用,提供丰富模板。 6. draw.io(diagrams.net):免费在线图表软件。 7. PlantUML:文本到 UML 转换工具。 8. Gliffy:基于云的绘图工具。 9. Archi:免费开源,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具。 辅助编程的工具: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE。 2. 通义灵码:阿里巴巴团队推出,提供多种编程辅助能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,提供实时代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费工具,可快速生成代码。 5. Cody:Sourcegraph 推出,借助强大的代码分析能力。 6. CodeFuse:蚂蚁集团支付宝团队推出的免费 AI 代码助手。 7. Codeium:提供代码建议等帮助,提高编程效率和准确性。 辅助写邮件的工具: 1. Grammarly:提供语法检查、拼写纠正等功能,多平台适用。 2. Hemingway Editor:简化句子结构,提高可读性。 3. ProWritingAid:全面的语法和风格检查,提供详细报告。 4. Writesonic:基于 AI 生成多种文本,速度快。 5. Lavender:专注邮件写作优化,提供个性化建议和模板。
2025-01-23
知识库中已有的ai工具按能力分类列举
以下是知识库中已有的 AI 工具按能力分类列举: 工具入门篇 数据工具: 多维表格小白之旅 适用人群:Excel 重度使用者、手动数据处理使用者、文件工作者 简要说明:用表格+AI 进行信息整理、提效、打标签,满足 80%数据处理需求 编程工具: Cursor 的小白试用反馈 适用人群:0 编程经验、觉得编程离我们很遥远的小白 简要说明:通过 AI 工具对编程祛魅,降低技术壁垒 音乐工具: Suno 的小白探索笔记 适用人群:0 乐理知识、觉得作词作曲和我们毫不相关成本巨大的小白 简要说明:AI 赋能音乐创作,无需乐理知识即可参与音乐制作 100 个 AI 应用 81 100: AI 菜谱口味调整工具 已有产品:下厨房口味调整功能 一句话介绍:根据用户反馈调整菜谱口味。 AI 语言学习纠错平台 已有产品:英语流利说纠错功能 一句话介绍:帮助语言学习者纠正错误。 AI 电影剧情分析系统 已有产品:豆瓣电影剧情分析工具 一句话介绍:分析电影剧情,提供深度解读。 AI 办公文件分类系统 已有产品:腾讯文档分类功能 一句话介绍:自动分类办公文件,方便管理。 AI 美容护肤方案定制平台 已有产品:美丽修行定制方案功能 一句话介绍:根据用户肤质定制护肤方案。 21 40: AI 菜谱生成平台 已有产品:豆果美食 APP 一句话介绍:根据用户口味和现有食材生成个性化菜谱。 AI 语言学习助手 已有产品:沪江开心词场 一句话介绍:辅助用户学习语言,提供个性化学习方案。 AI 电影推荐系统 已有产品:爱奇艺智能推荐 一句话介绍:根据用户喜好推荐电影,发现优质影片。 AI 办公自动化工具 已有产品:WPS Office 一句话介绍:提高办公效率,实现自动化办公流程。
2025-01-23
PDF总结的AI工具
以下是一些与 PDF 总结相关的 AI 工具: 1. DeepL(网站):点击页面“翻译文件”按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部“更多”按钮,选择“制作双语 BPUB 电子书”、“翻译本地 PDF 文件”、“翻译 THML/TXT 文件”、“翻译本地字幕文件”。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件“Ebook Translator”。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译“Document”按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏“文件翻译”,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击“文档翻译”,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方“切换成电子书”,轻触屏幕唤出翻译按钮。 以下是一些在论文写作方面的 AI 产品: 1. 文献管理和搜索: Zotero:结合 AI 技术,可以自动提取文献信息,帮助研究人员管理和整理参考文献。 Semantic Scholar:一个由 AI 驱动的学术搜索引擎,能够提供相关的文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,帮助提高论文的语言质量。 Quillbot:一个基于 AI 的重写和摘要工具,可以帮助研究人员精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:一个用于数学建模和优化的软件,可以帮助研究人员进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:虽然不是纯粹的 AI 工具,但结合了自动化和模板,可以高效地处理论文格式和数学公式。 Overleaf:一个在线 LaTeX 编辑器,提供丰富的模板库和协作功能,简化论文编写过程。 5. 研究伦理和抄袭检测: Turnitin:一个广泛使用的抄袭检测工具,帮助确保论文的原创性。 Crossref Similarity Check:通过与已发表作品的比较,检测潜在的抄袭问题。 使用这些工具时,重要的是要结合自己的写作风格和需求,选择最合适的辅助工具。
2025-01-23
生成原型的AI工具
以下是一些用于生成原型的 AI 工具: 1. 即时设计(https://js.design/):可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 2. V0.dev(https://v0.dev/):Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 3. Wix(https://wix.com/):用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 4. Dora(https://www.dora.run/):使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 目前用于产品原型设计的 AIGC 工具包括: 1. UIzard:利用 AI 技术生成用户界面的工具,可根据设计师提供的信息快速生成 UI 设计。 2. Figma:基于云的设计工具,提供自动布局和组件库,其社区开发的一些 AI 插件可用于增强设计流程。 3. Sketch:流行的矢量图形设计工具,其插件系统中的一些插件利用 AI 技术来辅助设计工作,例如自动生成设计元素等。 从 Artifacts 到 Cursor 的连续爆火,唤起了大模型的又一春。AI Native 的口号从未停止,虽然难以定义真正的 AI Native,但借助这些 AI 工具,任何人都能在短时间内将创意变为可交互的原型。当然,这些工具还不够完美,生成的代码可能需要调整,设计可能需要优化。但随着技术的不断进步,未来可能会有更多专门针对产品原型设计的 AIGC 工具出现,也许有一天,我们可以直接用自然语言描述一个完整的应用,AI 就能为我们构建出全功能的产品。
2025-01-22