Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

比较分析目前市面上的所有 AI软件

Answer

以下是对目前市面上部分 AI 软件的比较分析:

摄影相关

  • AI 摄影参数调整助手:使用图像识别和数据分析技术,常见于摄影 APP 中,能根据场景自动调整摄影参数,市场规模达数亿美元。
  • 500px 摄影社区:拥有 AI 摄影比赛平台,运用图像识别和数据分析技术,举办各种主题的摄影比赛,市场规模达数亿美元。

音乐相关

  • AI 音乐情感分析平台:采用机器学习和音频处理技术,有音乐情感分析软件,市场规模达数亿美元,可分析音乐的情感表达。
  • Logic Pro X 教学软件:借助机器学习和音频处理技术,是 AI 音乐制作教学平台,市场规模达数亿美元,能为用户提供个性化教学服务。

家居相关

  • AI 家居智能照明系统:结合物联网技术和机器学习,如小米智能照明系统,市场规模达数十亿美元,可实现家居照明的智能化控制。
  • 鲁班到家 APP:运用数据分析和自然语言处理技术,是 AI 家居维修服务平台,市场规模达数亿美元,能为用户推荐附近的专业维修人员。

金融相关

  • AI 金融风险预警平台:使用数据分析和机器学习技术,有金融风险预警软件,市场规模达数十亿美元,可提前预警金融风险。
  • 雪球财经 APP:利用数据分析和自然语言处理技术,是 AI 金融投资教育平台,市场规模达数亿美元,能为用户提供个性化的金融投资教育服务。

其他领域

  • AI 菜谱口味调整工具:运用自然语言处理和数据分析技术,如下厨房口味调整功能,市场规模达数亿美元,能根据用户反馈调整菜谱口味。
  • AI 语言学习纠错平台:采用自然语言处理和机器学习技术,如英语流利说纠错功能,市场规模达数十亿美元,可帮助语言学习者纠正错误。
  • AI 电影剧情分析系统:借助数据分析和自然语言处理技术,如豆瓣电影剧情分析工具,市场规模达数亿美元,能分析电影剧情并提供深度解读。
  • AI 办公文件分类系统:结合数据分析和机器学习技术,如腾讯文档分类功能,市场规模达数亿美元,可自动分类办公文件。
  • AI 美容护肤方案定制平台:使用图像识别和数据分析技术,如美丽修行定制方案功能,市场规模达数亿美元,能根据用户肤质定制护肤方案。
Content generated by AI large model, please carefully verify (powered by aily)

References

100个AI应用

|序号|主题|使用技术|已有产品|市场规模|一句话介绍|项目功能||-|-|-|-|-|-|-||96|AI摄影参数调整助手|图像识别、数据分析|摄影APP参数调整功能|数亿美元|根据场景自动调整摄影参数。|一些摄影APP利用AI分析拍摄场景,自动调整相机参数,如曝光、对焦、感光度等。||97|AI音乐情感分析平台|机器学习、音频处理|音乐情感分析软件|数亿美元|分析音乐的情感表达。|音乐情感分析软件利用AI分析音乐的旋律、节奏、歌词等,判断音乐的情感倾向,如快乐、悲伤、愤怒等。||98|AI家居智能照明系统|物联网技术、机器学习|小米智能照明系统|数十亿美元|实现家居照明的智能化控制。|小米智能照明系统利用AI和物联网技术,根据用户的习惯和环境变化自动调整灯光亮度和颜色。||99|AI金融风险预警平台|数据分析、机器学习|金融风险预警软件|数十亿美元|提前预警金融风险。|金融风险预警软件利用AI分析金融市场数据,提前预警可能出现的风险,如股市下跌、汇率波动等。||100|AI旅游路线优化平台|数据分析、自然语言处理|马蜂窝路线优化功能|数亿美元|根据用户需求优化旅游路线。|马蜂窝根据用户的时间、预算、兴趣等因素,利用AI优化旅游路线,提高旅行体验。|

100个AI应用

|序号|已有产品|主题|使用技术|市场规模|一句话介绍|项目功能||-|-|-|-|-|-|-||76|500px摄影社区|AI摄影比赛平台|图像识别、数据分析|数亿美元|举办摄影比赛,展示优秀摄影作品。|500px摄影社区利用AI技术对参赛作品进行评选和分类,举办各种主题的摄影比赛,为摄影爱好者提供展示作品的平台。例如用户可以在平台上参加自然风光、人像等主题的摄影比赛,与其他摄影师交流和竞争。||77|Logic Pro X教学软件|AI音乐制作教学平台|机器学习、音频处理|数亿美元|教授音乐制作技巧,培养音乐人才。|Logic Pro X教学软件利用AI技术为用户提供个性化的音乐制作教学服务,帮助用户掌握音乐制作技巧。例如根据用户的音乐基础和学习进度,推荐合适的课程和练习项目。||78|鲁班到家APP|AI家居维修服务平台|数据分析、自然语言处理|数亿美元|为用户提供家居维修服务,解决生活难题。|鲁班到家APP利用AI分析用户的维修需求和地理位置,为用户推荐附近的专业维修人员。例如用户家里的水龙头坏了,APP会根据用户的需求安排维修人员上门服务。||79|雪球财经APP|AI金融投资教育平台|数据分析、自然语言处理|数亿美元|提供金融投资知识教育,提高投资者素质。|雪球财经APP利用AI技术为用户提供个性化的金融投资教育服务,包括投资课程、市场分析和投资策略等。例如根据用户的投资经验和风险偏好,推荐合适的学习内容和投资组合。|

100个AI应用

|序号|主题|使用技术|已有产品|市场规模|一句话介绍|项目功能||-|-|-|-|-|-|-||81|AI菜谱口味调整工具|自然语言处理、数据分析|下厨房口味调整功能|数亿美元|根据用户反馈调整菜谱口味。|下厨房的口味调整功能可根据用户对菜谱的评价,利用AI分析后给出口味调整建议,如增加甜度、减少辣味等。||82|AI语言学习纠错平台|自然语言处理、机器学习|英语流利说纠错功能|数十亿美元|帮助语言学习者纠正错误。|英语流利说通过AI技术识别用户在语言学习中的发音、语法等错误,并提供纠正建议和练习。||83|AI电影剧情分析系统|数据分析、自然语言处理|豆瓣电影剧情分析工具|数亿美元|分析电影剧情,提供深度解读。|豆瓣电影的剧情分析工具利用AI对电影剧情进行分析,为用户提供剧情解析、主题探讨等内容。||84|AI办公文件分类系统|数据分析、机器学习|腾讯文档分类功能|数亿美元|自动分类办公文件,方便管理。|腾讯文档利用AI对用户上传的文件进行分类,如合同、报告、方案等,提高文件管理效率。||85|AI美容护肤方案定制平台|图像识别、数据分析|美丽修行定制方案功能|数亿美元|根据用户肤质定制护肤方案。|美丽修行根据用户上传的照片和肤质信息,利用AI定制个性化的护肤方案,包括产品推荐和使用顺序。|

Others are asking
降重的ai指令
以下是关于降重的 AI 指令的相关内容: 与大语言模型交流时,可把其当作大学生,而非专家。“实习生”只能执行任务,需要指明方向、拆解任务,并教其一步一步操作,像导演一样编排具体流程,检查结果,修改流程,反复迭代,提示语的核心是逻辑。 对于 Prompt,它是一段用于指挥 AI 生成所需内容的指令,每个单独的提示词叫 tag(关键词)。支持英语等语言(不用担心英语不好的问题,;还可进行 tag 的步数控制。 Manus 的运作逻辑是,其主要智力担当是 Claude AI 和某个特训过的推理模型。它会对人类指令按“根据人类指令,拆分完成任务所需的子步骤”的思路生成 todolist 文档,拆解任务,降低实现难度。基于此,每完成一个子任务就打个✅,为 AI 指明多步骤任务中每一步的执行要求,并按需调用相关工具推进子步骤,多个子步骤的生成结果嵌套利用起来,以完成原始指令的产出。
2025-03-22
请你帮我找到AI编程与炼金术 build on trae的课程文档
以下是关于“AI 编程与炼金术 Build on Trae”的课程文档相关内容: 课程活动:包括制作图片字幕生成器、开发网页金句卡片生成器、制作一档专属自己的 AI 博客、制作中文名字生成器、构建一个优质文章推荐网站、制作表情包生成器、开发 Life Coach 应用、构建浏览器智能插件、开发个人网页/小程序,并进行优化部署等。 知识图谱: 章节: 三.使用 DeepSeek R1 给老外起中文名 八.做一档你自己的 AI 播客 九.柴犬表情包生成器实战(Coze bot+API) 十.做一个微信小程序 一.Trae 的介绍/安装/疑难杂症 二.图片字幕生成器 四.DeepSeek R1 驱动的 Life Coach 五.DeepSeek 驱动的网页金句卡片生成 六.做一个你专属的好文推荐网站(DeepSeek R1+飞书多维表格) 七.做一个你专属的好文推荐网站(DeepSeek R1+飞书多维表格)(下) 知识点: Node.JS 安装 Python 安装 相关链接: 其他各章节对应的具体链接 您可以根据上述内容,通过相应的链接获取更详细的课程文档信息。
2025-03-21
ai相关信息很多,如果只推荐一种信息来源,你会推荐什么
如果只推荐一种 AI 信息来源,以下是一些选择: 对于初学者,推荐看 Open AI 的官方 Cookbook,小琪姐做了中文精读翻译。 从简报方面,TLDR AI()等是不错的选择。 播客方面,No Priors podcast hosted by Sarah Guo and Elad Gil、Robot Brains Podcast hosted by Pieter Abbeel、Lex Fridman Podcast hosted by Lex Fridman、The Gradient podcast hosted by Daniel Bashir、Generally Intelligent hosted by Kanjun Qiu、Last Week in AI 等值得关注。 会议方面,工业界的 World AI Cannes Festival、Gen AI conference()等都是获取 AI 信息的重要渠道。 此外,还可以通过赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等订阅获取最新信息,也可以参考通往 AGI 之路知识库中的相关内容,如 AI 相关名词解释、经典必读文章、历史脉络类资料等。
2025-03-21
可以帮我写小说的AI
以下是关于使用 AI 写小说的相关内容: 南瓜博士在人机协作小说创作中尝试了多种方法。曾写 agent flow 框架让 AI 自动写作和评判,但因无法认同 AI 审美而放弃。 选择在 GPT 页面上对话,先让 AI 生成大量创意,自己进行判断挑选。写作时,AI 像水手勤恳工作,自己负责掌舵,最后给出改进意见让 AI 遵循修改。 丰富细化时,先让 AI 写故事概要和角色背景介绍并修改,然后让 AI 以表格形式输出细节描述,这样做有打破叙事习惯、便于局部调整、确保内容具体等好处。 串联成文时,把生成的表格依次复制粘贴让 AI 写文章,偶尔需要自己帮忙给建议。 局部修改有成功和失败的经历。失败时,GPT4 记性不好,Claude 改丢关键情节。成功时,使用 code interpreter 把原文喂给 AI 并让其反馈,反复修改,最终得到作品。 未来南瓜博士有两个探索方向:一是琢磨 Arthur 等伙伴们的 prompts,二是继续设计能配置 prompts 和人工干预的 agent 框架。
2025-03-21
可以帮我写网文的AI工具有哪些
以下是一些可以帮助写网文的 AI 工具: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 以下是一些在论文写作中常用的 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术,可以自动提取文献信息,帮助研究人员管理和整理参考文献。 Semantic Scholar:一个由 AI 驱动的学术搜索引擎,能够提供相关的文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,帮助提高论文的语言质量。 Quillbot:一个基于 AI 的重写和摘要工具,可以帮助研究人员精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:一个用于数学建模和优化的软件,可以帮助研究人员进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:虽然不是纯粹的 AI 工具,但结合了自动化和模板,可以高效地处理论文格式和数学公式。 Overleaf:一个在线 LaTeX 编辑器,提供丰富的模板库和协作功能,简化论文编写过程。 5. 研究伦理和抄袭检测: Turnitin:一个广泛使用的抄袭检测工具,帮助确保论文的原创性。 Crossref Similarity Check:通过与已发表作品的比较,检测潜在的抄袭问题。 以下是一些好用的 AI 新闻写作工具: 1. Copy.ai:是一款功能强大的 AI 写作助手,提供了丰富的新闻写作模板和功能。用户可以使用 Copy.ai 快速生成新闻标题、摘要、正文等内容,节省写作时间并提高效率。 2. Writesonic:是一款专注于写作的 AI 工具,提供了新闻稿件生成、标题生成、摘要提取等功能。它的智能算法可以根据用户提供的信息快速生成高质量的新闻内容,适合新闻写作和编辑人员使用。 3. Jasper AI:是一款人工智能写作助手,虽然主打博客和营销文案,但也可用于生成新闻类内容。写作质量较高,支持多种语言。
2025-03-21
你有最新的AI消息吗
以下是为您汇总的最新 AI 消息: 3 月 17 日: 【AI 3D】UE5MCP 提出旨在将 AI 驱动的自动化集成到虚幻引擎中,可用于游戏关卡设计、游戏编程等。 【AI 动作】Motion Anything:AI 生成动作技术,根据音乐生成舞蹈动作。 【AI 游戏】米哈游创始人蔡浩宇:AI 游戏预告发布,科幻冒险游戏《Whispers from the Star》,以 AI 智能体语音交互为核心推进剧情。 【AI 建模】字节团队:预告即将开源 AI 3D 建模技术 Hi3DGen。 【AI 绘图】Thera:新 sota 超分辨率模型,允许任意尺寸图像进行高清化。 【AI 语音】赤兔 Chitu:清华团队模型推理引擎,可以实现 DeepSeek 推理成本降低一半,性能翻番。Anthropic:预推出 Harmony 新功能,可将本地目录集成 Claude 中。百度:文心大模型 4.5 和文心大模型 X1 正式发布,免费向用户开放。 3 月 14 日: 【AI 模型及其他】谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0、Flash Thinking Experimental 等多个功能提升。OpenAI:4 项更新。Bolt:一键将 Figma 设计转换为可运行的 Web 应用。阿里:推出 AI 旗舰应用“新夸克”。360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】Pika:更新 Pikaffects,新增多款变身特效。Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 3 月 4 日: 【AI 3D】Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。3DMem:新型 3D 场景记忆框架。 【AI 绘图】智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。海螺:推出 Image01 多功能文本转图像模型。 【AI 视频】Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。Vidu:API 开放平台全面开放。 【AI 模型】Google Colab:推出 Data Science Agent。微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。Opera:宣布推出网页浏览器的 AI 代理。 您还可以通过以下渠道获取更多详细信息: AI 资讯公众号:超时空视角 猫叔个人公众号:AI 替代人类 小红书/抖音:EverAI B 站:Ever AI 酱(这里会有教程及 AI 工具界面操作)
2025-03-21
市面上对aigc设计岗位的需求度
目前,AIGC 相关岗位的需求呈现增长趋势。例如,网易内部要求所有设计师掌握 AIGC,腾讯 ISUX 已将 AI 应用于实战。在招聘方面,某数字银行招聘 AIGC 产品经理(深圳),其任职要求包括相信 AIGC、喜欢使用各种 AIGC 应用、能够上手相关操作等,岗位职责包括构建大模型工程化产品、探索和设计工程化产品、在重点业务场景中推动大模型的应用落地等。此外,小红书上也有众多 AIGC 相关的博主,如万能妍仔的 AIGC 等。总体而言,AIGC 领域的岗位需求在不断扩大,且对从业者的要求也在逐渐明确和提高。
2025-03-21
AI数字人是什么,市面上目前有哪些生成数字人的AI工具,介绍一下这些工具的网址以及优缺点
AI 数字人是通过人工智能技术创建的虚拟人物形象。 目前市面上常见的生成数字人的 AI 工具及相关信息如下: 1. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 网址: 使用方法: 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 上传后效果如图所示,My Avatar 处显示上传的照片。 点开大图后,点击 Create with AI Studio,进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频。 最后点击 Submit,就可以得到一段数字人视频。 2. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 网址: 使用方法: 点击上面的网址,点击右上角的 Create vedio。 选择人物形象,可以点击 ADD 添加自己的照片,或者使用 DID 给出的人物形象。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 最后,点击 Generate vedio 就可以生成一段视频。 打开自己生成的视频,可以下载或者直接分享给朋友。 3. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 网址: 使用方法: 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。 此外,还有开源且适合小白用户的数字人工具,如: 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 网址: GitHub: 官网: 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2025-03-14
市面上主流的大模型有什么区别
市面上主流的大模型主要有以下区别: 1. 架构类型: Encoderonly:适用于自然语言理解任务,如分类和情感分析,代表模型是 BERT。 Encoderdecoder:同时结合 Transformer 架构的 encoder 和 decoder 来理解和生成内容,用例包括翻译和摘要,代表是 Google 的 T5。 Decoderonly:更擅长自然语言生成任务,众多 AI 助手采用此结构,如 ChatGPT。 2. 处理信息类型: 大型语言模型:专注于处理和生成文本信息。 大型多模态模型:能够处理包括文本、图片、音频等多种类型的信息。 3. 应用场景: 大型语言模型:主要用于自然语言处理任务,如文本翻译、文本生成、情感分析等。 大型多模态模型:可应用于图像识别与描述、视频分析、语音识别与生成等更广泛的领域。 4. 数据需求: 大型语言模型:主要依赖大量的文本数据进行训练。 大型多模态模型:需要多种类型的数据进行训练,包括文本、图片、音频等。 5. 规模: 大模型的预训练数据非常大,往往来自互联网,包括论文、代码、公开网页等,一般用 TB 级别的数据进行预训练,参数也非常多,如 OpenAI 在 2020 年发布的 GPT3 就已达到 170B 的参数。 6. 优秀模型: GPT4(网页版)、GPT4(API)、智谱清言、通义千问 2.0、AndesGPT(OPPO)、文心一言 4.0(API)、MoonShot(KimiChat)、Claude2、360 智脑、Qwen72BChat、文心一言 4.0(网页版)等。 7. 性能表现:国内外大模型存在差距,如 GPT4 Turbo 总分 90.63 分遥遥领先,国内最好模型文心一言 4.0(API)总分 79.02 分,与 GPT4 Turbo 有一定差距。
2025-03-13
市面上有哪些ai硬件
以下是市面上一些常见的 AI 硬件: 1. RayBan Meta 智能眼镜:由 meta 与雷朋合作推出,Tiktok 作品数约 180000 个,价格为 299 美元。 2. Vision Pro 眼镜:来自苹果公司,Tiktok 作品数约 38600 个,价格为 3999 美元。 3. cozmo 玩具机器人:由 Digital Dream Labs 制造,Tiktok 作品数约 10500 个,价格为 399 美元。 4. Lovot 玩具机器人:由 GROOVE X 生产,Tiktok 作品数约 5931 个,价格为 9000 美元。 5. Optimus 等身机器人:由特斯拉推出。 6. AI pin 挂件:由 Humane 制造,Tiktok 作品数约 1200 个,价格为 699 美元。 7. PLAUD 录音机:由机智连接生产,Tiktok 作品数约 1072 个,价格为 159 美元。 8. RabbitR1 挂件:由 Rabbit Inc 推出,Tiktok 作品数约 1048 个,价格为 199 美元。 9. Loona 玩具机器人:由可以科技制造,Tiktok 作品数约 753 个,价格为 449 美元。 10. Timekettle WT2 耳机:由 Timekettle 生产,Tiktok 作品数约 751 个,价格为 299 美元。 11. OrCam MYEYE 眼镜:由 OrCam 推出,Tiktok 作品数约 532 个,价格为 4250 美元。 这些数据来源于 google、tiktok、twitter、亚马逊等。更多榜单信息您可以访问:https://zw73xyquvv.feishu.cn/wiki/IqcqwTDiYiKttNktBg3cg8HgnLh 。对于榜单内容有疑问想交流的 GenAI 硬件创始人,或者想合作转载内容的公众号博主,请加微信,或者在本文末留言。
2025-03-12
介绍目前市面上的ai工具
目前市面上的 AI 工具主要有以下几类: 1. 聊天工具:方便人们进行交流和获取信息。 2. 绘画工具:能够创作出各种风格的绘画作品。 3. 视频工具:用于视频的制作和处理。 4. 音乐工具:辅助音乐的创作和编辑。 此外,AI 工具还分为线上和线下本地部署两种: 线上 AI 工具的优势在于出图速度快,不依赖本地显卡配置,无需下载大型模型,还能查看其他创作者的作品,但出图分辨率通常有限,制作高清横板图片可能受限。 线下部署的 AI 工具可以添加插件,出图质量较高,但使用时可能导致电脑宕机,配置不高时可能出现显存不足导致出图失败的情况。 线上平台适合找参考、测试模型,线下平台则是主要的出图工具。例如,可以在在线上绘图网站的绘图广场上发现想要的画风,点击创作会自动匹配模型和标签,截取游戏人物底图将算力集中在人物身上,多批次尝试不同画风以找到最符合需求的模型和组合,最后在相关网站下载对应模型到本地加载部署后正式生图。
2025-03-07
小公司, 想部署一个本地ai系统,希望它能够, 对运维, 运营, 客服, 美术, 策划, 程序都能够有很大的帮助, 目前市面上那款 ai 模型比较合适
对于小公司想要部署一个能对运维、运营、客服、美术、策划、程序都有帮助的本地 AI 系统,以下是一些相关信息: 线上和线下本地部署的 AI 特点: 线上部署的优势在于出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图尺寸受限。线下部署的优势是可添加插件,出图质量高,但使用时电脑可能宕机,配置不高可能爆显存导致出图失败。建议线上用于找参考、测试模型,线下作为主要出图工具。 Ollama: 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同场景。 易于使用,适用于 macOS、Windows 和 Linux 系统,支持 CPU 和 GPU。 提供模型库,用户可从中下载不同模型,满足不同需求和硬件条件。 支持自定义模型,可调整参数。 提供 REST API 用于运行和管理模型,以及与其他应用集成。 社区贡献丰富,有多种集成插件和界面。 Google Gemma: 是 Google 发布的家用版小模型,有 2b(20 亿参数)和 7b(70 亿参数)版本。小模型可能不适合复杂任务,但适合提升基础操作效率。部署环境友好,可通过 ollama 方便部署,支持热加载模型文件。2b 反应速度快但互动话题有限,7b 输出质量高但可能卡顿,对非英文语种反馈不稳定。 综合考虑,如果您的公司对出图质量要求较高,且有较好的硬件配置,可以选择线下部署结合线上测试的方式。在语言模型方面,Ollama 具有较多优势,可根据具体需求选择合适的模型进行部署。
2025-03-04
什么AI软件可以做游戏
以下是一些可以用于制作游戏的 AI 软件和工具: 1. Scenario 和 Iliad:可以创建游戏资源。 2. Promethean:能够构建整个虚拟世界的平台。 3. Inworld、Charisma 和 Convai:可用于生成非玩家角色(NPC)。 4. AI Dungeon 和 Hidden Door:基于文本的游戏。 5. 用于抠图的 remove,可以直接抠图或在 PS 里安装操作,用于制作素材。 6. Aive 可尝试制作背景音乐,但可能难以满足要求,可利用分离人声的 AI 软件处理音乐。 7. 微软 AI 语音:可制作旁白,语音库支持 147 种语言,还有定制声音。 8. Cursor:通过对话获得代码,使用的语言模型包括 Claude3.5sonnet、GPT4o 等,指令详细效果更好。 9. Deepseek(新手推荐):方便获取游戏代码,国内能访问,网页登录方便,目前完全免费。 10. 通义灵码:在 Pytharm 中安装插件使用。 11. JetBrains 自身的助手插件:在 Pytharm 中安装,收费,有 7 天免费试用。 12. Marscode 及 Tencent cloud AI code Assistant 等。 13. 无影的晓颖 AI 助手:内置在云电脑里,使用流畅,但需要在无影的云电脑中。 需要注意的是,AI 不太可能完全取代人类艺术家在高质量 AAA 游戏中的工作和愿景,但会为其注入动力,提高效率和降低成本。同时,不同的 AI 工具在生成游戏的不同方面各有优势,具体使用效果可能因个人需求和实践而有所不同。
2025-03-21
声音克隆软件推荐!
以下是为您推荐的声音克隆软件: Fish Audio: 操作步骤: 1. 准备一段需要克隆的音频(可以是类似屈原的古风声音,或自行录制一段)。 2. 打开网站:https://fish.audio/zhCN/train/newmodel/ 。 3. 上传准备好的音频,按照指引完成声音克隆。 4. 进入声音库选择需要使用的声音,将第一步生成的文案输入,使用克隆好的声音生成对应的音频文件。 5. 下载生成的音频文件备用。 开源软件: 1. GPTSoVITS:https://github.com/RVCBoss/GPTSoVITS ,对中、英、日语言支持良好,需要 10 分钟左右干素材,瞬时 clone 功能未开放。 2. OpenVoice:https://github.com/myshellai/OpenVoice ,对中文支持较好,主打瞬时 clone,发展势头良好,一个月前测试时中文声音 clone 有英语味道。 商业产品: 1. ElevenLab:https://elevenlabs.io ,支持最多语言种类,支持瞬时 clone,综合效果最好。 2. Reecho:https://reecho.ai ,中国团队,支持长音频和瞬时声音 clone,据说与火山引擎的声音 clone 技术同源。 3. 自得语音:https://zideai.com ,中国团队,支持瞬时声音 clone 和声音定制。
2025-03-21
图片转3D建模的软件有哪些
以下是一些图片转 3D 建模的软件: 1. Tripo AI:VAST 发布的在线 3D 建模平台,基于数十亿参数级别的 3D 大模型,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,实现快速的 2D 到 3D 转换,并提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,不仅支持文本生成 3D,还支持图片生成 3D 以及 AI 材质生成。用户可通过上传图片并描述材质和风格生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,其 Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成。用户可上传图片或输入文本提示词来生成 3D 模型。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能够将图像或文本快速转换成 3D 模型,并提供了图像到 3D、文本到 3D 和文本到纹理等多种功能。 6. Polycam:只需上传至少 20 张图片或至少 20 秒的视频,自动处理并构建一个 3D 模型。生成后还可以编辑模型,支持 12 种以上的格式导出到流行的 3D 软件中,如 Blender、SketchUp、Unreal、Unity 等。100 张图像的云处理建模时间只需要大约 1 2 分钟。 这些工具通常具有用户友好的界面,允许用户通过简单的操作来生成 3D 模型,无需专业的 3D 建模技能。它们可以广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2025-03-21
AI克隆人声软件
以下为一些常见的 AI 克隆人声软件及相关操作步骤: Fish Audio: 1. 准备一段需要克隆的音频(可以是类似屈原的古风声音,或自行录制一段)。 2. 打开网站:https://fish.audio/zhCN/train/newmodel/ 。 3. 上传准备好的音频,按照指引完成声音克隆。 4. 进入声音库选择需要使用的声音,将第一步生成的文案输入,使用克隆好的声音生成对应的音频文件。 5. 下载生成的音频文件备用。 此外,还有以下相关信息: Elevenlabs.io 、speechify.com 等也可用于声音克隆。 可以在 Heygen 等网站自助购买服务,低成本制作自己的数字人分身。 在视频合成方面,可使用 Viggle.ai 网站,操作如下: 1. 在网上下载“回答我”的原视频。 2. 打开 Viggle.ai 网站,登录后进入视频合成功能(https://viggle.ai/createmix )。 3. 上传“回答我”原视频和第二步生成的人物形象图,生成新版本的“回答我”视频。 4. 预览效果,满意后下载合成好的新视频。 视频剪辑可使用剪映软件,步骤为: 1. 打开剪映软件(手机或电脑版均可)。 2. 导入合成好的新视频和生成的音频文件。 3. 将音频与视频时间轴对齐,确保声音和画面同步,添加字幕等。 4. 如需叠加特殊背景,可以导入自己的背景图(如楚国风景)。 5. 预览整个视频,检查效果,微调后导出最终视频(建议 MP4 格式)。
2025-03-20
我想学AI编程,用的电脑系统是WIN7,好多编程软件装不了吧,给我个建议
如果您使用的是 WIN7 系统且想学习 AI 编程,由于很多编程软件可能不支持该系统,以下是一些建议: 1. 考虑升级您的操作系统至 Windows7 以上版本,如 Windows10 或 Windows11,以获得更好的兼容性和支持。 2. 对于电脑硬件,系统要求 Windows7 以上,显卡要求为 NVDIA 独立显卡且显存至少 4G 起步,硬盘需留有足够的空间,最低 100G 起步(包括模型)。 3. 下载并更新 Nvidia 显卡驱动,下载地址:https://www.nvidia.cn/ geforce/drivers/ 4. 下载并安装所需环境,包括 Python、Git、VSCode: 安装 Python:https://www.python.org/downloads/release/python3119/ ,安装时选中“将 Python 添加到系统变量”。 安装 VSCode:https://code.visualstudio.com/Download 安装 Git:https://gitscm.com/download/win 安装 CUDA:https://developer.nvidia.com/cuda1220downloadarchive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_network 请注意,Mac 系统、AMD 显卡、低显卡的情况也可以安装使用,但可能功能不全,出错率偏高,严重影响使用体验,个人建议升级设备或者采用云服务器玩耍。
2025-03-20
AI软件
以下是关于 AI 软件的相关内容: 全国首例 AI 生成图片著作权案例解读: 随着人工智能技术的发展,未来将有更多 AI 软件辅助艺术创作,相应的知识产权保护问题也会增多。在这种背景下,软件工程师应不断更新技术,突出设计的便捷性和高效性,同时注重知识产权保护,包括确保 AI 软件生成内容的合法性和合规性,检查原创性输出,防止侵权;注重用户的知识产权保护,如告知用户协议、监督操作流程、生成水印署名标识、自动保存创作历史记录、完善保护措施等。 对于使用人工智能软件的创作者,为适应市场需求,利用 AI 软件是必要的。为保护个人知识产权,应明确智能工具的角色,了解自己拥有的具体权利。 适合软件项目经理的 AI 工具: 存在一些适合软件项目经理使用的 AI 工具,包括项目管理和任务跟踪工具(如 Jira、Trello 等)、文档和协作工具(如微软的 Copilot 等)、风险管理和决策支持工具、沟通和协作工具、创意生成工具(如文心一格、Vega AI 等)。这些工具涵盖项目管理的各个环节,有助于提高工作效率和决策能力。 其他相关 AI 软件: 1. Claude Code 是 Anthropic 推出的终端级编程助手,无需 RAG,能自己思考解决复杂任务,有望引领下一代代码助手范式。 2. 美国国防部启动“雷霆熔炉”项目,AI 正式进入军事行动规划核心,联合 Scale AI、微软、Anduril 三方合作,标志着“AI 军事化”迈入关键阶段。 3. MCP 能让 Chatbot 变得像 USB 一样易扩展。
2025-03-20
关于分析财务报告的提示词
以下是关于分析财务报告的提示词相关内容: 1. 对于东方集团的财务分析测评,提示词统一设定为:“仅通过东方集团的历年公开财务数据,分析这家公司的潜在投资机会和风险”,开启深度搜索(如有),关闭联网搜索(如有)。 2. 在 Prompt Chain(提示词链)中,例如: Prompt1:「考虑所选知识点的概念、计算与应用,并基于个人实际生活、工作、见闻,从这三大类知识点中各选择一个最简单、最容易完成、最快完成的知识点。只选择出知识点即可」 Prompt2.1:「我选的第一个知识点是“名义利率vs实际利率”。在深入理解该知识点的概念、计算与应用的基础上,基于个人实际生活、工作、见闻,编写该知识点的应用题目,并针对题目做出详细解答」 Prompt2.2:「第二类:经济评价指标我选择“静态投资回收期计算”。这个指标是最基本的,不需要考虑资金的时间价值,只需简单的加减法即可计算出。在深入理解该知识点的概念、计算与应用的基础上,基于个人实际生活、工作、见闻,编写该知识点的应用题目,并针对题目做出详细解答。完成之后,将题目和解答过程添加到 word 中」 Prompt2.3:「下一个:第三类:工程经济评价——财务分析和经济分析 14。财务分析辅助报表(1)营业收入、税金及附加表编制:」 Prompt3:「下一个:请提供 word 文档的下载链接」 3. 对于东方集团的财务分析,在测试多个模型后发现,大模型在不开联网模式的情况下难以在自身语料中找到公开的财务数据。可以给大模型投喂数据,如用 choice 数据导出东方集团近十年的资产负债表、利润表、现金流量表、营运能力数据以及主要客户和供应商这 5 个主要数据,给出统一提示词:“请根据材料分析这家上市公司的投资机会和风险”
2025-03-21
剧本分析(NLP):AI 读取剧本,分析情节、角色发展,甚至预测观众反应。
以下是关于剧本分析(NLP)中 AI 读取剧本并进行相关处理的一些信息: 人物剧本与角色状态: 对人物如李洛云进行“剧本推演”,每天生成 20 40 个时间段剧本,依据人物背景和增长记忆体生成。 可使用 LLM 生成英文提示词用于 Stable Diffusion 出图,图存于“手机相册”用于对话多模态中的图片回复。 选择剧本和图片生成朋友圈文案。 拟人行为: 反感度系统:通过 LLM 分析对话判断角色是否产生反感度。 延迟回复:根据状态忙闲或是否睡觉决定回复时间。 接受多轮输入,一并回复:避免每一条输入回复一句,不像真人。 响应拆分与响应延迟:将一大段响应文本拆分成多段,模拟人类打字速度(3 5 字/秒),回复时概率性使用表情包,有概率主动聊天(与亲密度正相关)。 微信朋友圈:根据每天人物剧本挑选 1 2 个发布朋友圈并配图,目前内容由 AI 生成但手工发布。 将小说做成视频的制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)提取关键场景、角色和情节。 2. 生成角色与场景描述:用工具(如 Stable Diffusion 或 Midjourney)生成视觉描述。 3. 图像生成:用 AI 图像生成工具创建图像。 4. 视频脚本制作:将关键点和图像组合成脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)转换语音,添加背景音乐和音效。 6. 视频编辑与合成:用视频编辑软件(如 Clipfly 或 VEED.IO)合成。 7. 后期处理:剪辑、添加特效和转场提高质量。 8. 审阅与调整:观看视频并根据需要调整。 9. 输出与分享:完成编辑后输出并分享。 Inworld AI: Inworld AI 是一家专注于游戏和人工智能的初创公司,开发了 Inworld 的 AI 角色引擎,可将游戏 NPC 进行 AI 化并集成到游戏中。该引擎超越大语言模型,增加可配置的安全性、知识、记忆、叙事控制、多模态等功能,使 NPC 能够自我学习和适应,具有情绪智能。其角色引擎可创建具有独特个性和上下文意识的角色,无缝集成到实时应用中,内置优化规模和性能的功能。Character Brain(性格大脑)引擎使 AI NPC 能够学习和适应,具有情绪智能的关系导航能力、记忆和回忆能力,并能自主发起目标、执行动作并遵循动机。功能包括目标和行动、长期记忆、个性、情绪等。
2025-03-20
使用模型 对页面性能分析,内存泄露分析的 提示词
以下是为您整理的相关内容: 1. 对于模型回答 9.9<9.11 的原因分析,涉及到模型的操作方式。如选择自定义提示词或预定义话题,输入对话内容等待生成,根据情况切换按钮等。归因聚类使用大模型,有反应时间,结果可能因模型使用的温度不同而不同。LLM 采用多头注意力机制预测下一个 token,训练数据中相关语句越多,相关性概率越高。 2. 关于 ollama 提示词优化模型副本: 新建环境变量,C 盘储存小的需先操作,ollama 默认的模型保存路径为 Windows:C:\\Users\\%username%\\.ollama\\models,需添加 OLLAMA_MODELS 环境变量。 进入 ollama 官网下载,地址:https://ollama.com/ ,可下载语言模型和图像模型,选择相应模型下载至本地,选择本地文件夹 CMD 后粘贴命令开始下载。 在 Comfy 中使用,包括下载并安装 ollama 节点,在 Comfy 中调用。 效果方面,llama 模型进行提示词生成,llava 模型进行图像反推较为准确。 工作流相关的节点和工作流下载地址:https://www.123pan.com/s/fOu4Tdnrjdd.html 提取码:kaka 。 3. Midjourney 提示词生成器:仿照 GPTs 里的 MJ prompt 改了一版提示词,可用于 coze 或其他国内的 agent 里。不挑模型,方便补全润色。并给出了一些测试画面的示例,如巨大鲸鱼头部特写、乌克兰女孩黑白写真照、大型交响乐团演奏等的提示词。推理模型可能提升提示词的精准性,准备测试。
2025-03-19
如何利用ai进项数据分析并制图
利用 AI 进行数据分析并制图可以参考以下步骤: 1. 明确数据需求和目标:确定您想要分析的数据内容和期望得到的图表类型,例如柱状图、饼图等。 2. 数据准备:确保数据的准确性和完整性,查看数据列名是否与预期一致。 3. 选择合适的 AI 工具:如一些具备数据分析和绘图功能的软件或平台。 4. 分析数据:对数据进行深入研究,例如将多选答案进行合理拆分和统计。 5. 生成图表:根据分析结果,使用 AI 工具生成相应的图表,并注意图表的标题、标签和字体等显示效果。 6. 调整和优化:如果生成的图表不符合要求,需要进一步调整和优化,如重新分析数据、选择不同的图表类型等。 在实际操作中,例如在“教师的 AI 减负指南生成式人工智能在教学中的应用”中,对于“此前您是否使用过生成式 AI 大语言模型?”这样的问题,可以统计不同选择的次数并绘制柱状图或饼图。对于“AI 助教在以下哪些方面对您的学习有帮助?”这样的多选问题,需要将答案合理拆分后进行统计和制图。 在 AI 绘图方面,如参加相关比赛,需要明确创作主题,确定主体,增加叙事感,注意图片的构图、色彩和光影等构成因素,合理运用构图方式,如点中心构图、九宫格构图等。推荐在 AI 绘图中使用中景及以上景别。
2025-03-18
如何利用ai进项数据分析
利用 AI 进行数据分析可以参考以下实际案例与技巧: 1. 流程: SQL 分析:用户描述想分析的内容,后台连接数据库,附带表结构信息让 AI 输出 SQL 语句,校验为 SELECT 类型的 SQL 后执行,将结果数据传给 GPT(附带上下文),让其学习并分析数据,最后输出分析结论和建议,与结果数据一起返回给前端页面渲染图表、展示分析结论。目前已实现两张表关联查询。 个性化分析:用户上传文件,如有需要可简单描述数据、字段意义或作用辅助分析。前端解析用户上传的文件,传给 GPT 分析数据,后续步骤与 SQL 分析一致。 2. 问题与技巧: SQL 分析: 反复校验是否为 SELECT SQL 语句,不仅因为 AI 不完全可控,还因不能相信用户输入,防止恶意操作。 到 AI 分析步骤拼接上下文,包含表结构信息和 SQL 语句,助 GPT 更好理解数据和字段意义,使分析更准确。 针对表结构长类型字段,不允许直接查询,最好告知 GPT 只允许查询的字段或使用的 SQL 函数,控制生成内容。 个性化分析: 用户上传的数据解析后判断数据格式是否符合要求,超长可限制截取前面若干项,防止 token 消耗过多。 在前端解析用户上传的数据,分析完直接用于渲染数据图表,无需后端返回。 支持用户补充输入,简单描述数据、字段意义或作用,辅助 AI 分析。对于易理解语义化的字段名,可不描述,GPT 也能识别。遇到多维度数据,可输入特定指令帮助 AI 准确分析。 原文地址:https://mp.weixin.qq.com/s/Fld25MxyoFEnUbnDmGJNXg 本文作者:krryguo,腾讯 IEG 前端开发工程师。声明:本文涉及与 ChatGPT 交互的数据已严格脱敏。
2025-03-18
文本分析工具
以下是关于文本分析工具的相关内容: Claude2 中文精读: 基本文本分析:可以处理多种类型的文本,因其具有 10 万标记上下文窗口,能分析大量单词。基本应用包括评估文本相似度和回答有关文本的问题。 评估文本相似度:通过特定提示,让 Claude 判断两段文本含义是否大致相同,回答以“”开头。 回答有关文本的问题:提供会议记录给 Claude,并提出问题,让其回答。 推理类应用: 文本主题推断:给定长文本,推断其中的主题,可将主题格式化为一两个单词的列表。 文本信息分析:对于给定的主题列表和新闻文章,确定每个主题是否在文章中出现,答案以 0 或 1 的列表形式呈现。 GPT + SBERT 做用研统计: 模型边界:GPT 擅长上下文预测,不擅长文本归纳与推理;BERT 擅长文本横向统计,如句子相似性分析等。若要进行文本挖掘并输出统计数据,需同时调用 GPT 和 BERT。
2025-03-18