Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有没有语音翻译工具

Answer

以下为您介绍一些语音翻译工具:

  • Eleven Labs 推出的 Dubbing:可以将视频/音频翻译成不同的语言,同时保持原始的声音。支持十一种语言的 AI 配音功能,v2 模型目前支持包括印地语、葡萄牙语、西班牙语、日语、乌克兰语、波兰语、阿拉伯语等 20 多种语言的语音翻译。还可以检测多个说话人的声音,支持背景音分离和环境音降噪。
  • ZipZapAI:提供沉浸式阅读和写作体验,支持多种语言的高质量翻译。能够智能识别网页上的内容,如 Twitter、Discord 等,提供鼠标悬停翻译。支持 Chrome、Edge 等主流浏览器,下载插件即可使用。具有简单易用的用户界面,操作方便,内置了 GPT 的聊天功能,可以随时提问。

此外,ChatGPT 的语音功能已向所有免费用户开放,更新下载客户端即可使用。

Content generated by AI large model, please carefully verify (powered by aily)

References

AIGC Weekly #42

ElevenLabs推出Dubbing,一种语音翻译工具,可以将视频/音频翻译成不同的语言,同时保持原始的声音。AI配音功能支持十一种语言,v2模型目前支持的20多种语言的语音翻译,包括印地语、葡萄牙语、西班牙语、日语、乌克兰语、波兰语或阿拉伯语。还可以检测多个说话人的声音,支持背景音分离和环境音降噪。国内优秀视频创作者的受众可以极大的拓展了。[heading2][谷歌在图片搜索中加入图片生成功能](https://blog.google/products/se[content]谷歌上周在搜索实验室中增加了一个功能,有两个触发方式首先是你可以直接在搜索框输入“画一张戴着厨师帽和烹饪早餐的水豚的图片”之类的内容生成图像。另一种方式可以直接在Google图片中创建AI生成的图像,作为此实验的一部分。此功能旨在当你寻找灵感时出现,例如“极简万圣节餐桌设置”或“幽灵狗屋创意”。除此之外还有一个即将推出的工具,名为“关于此图像”,它将帮助人们轻松评估图像的背景和可信度。例如,它可能会向你显示Google首次看到此图像的类似版本的时间;或向你显示网络上使用类似图像的其他页面,包括新闻或事实核查网站。图像生成和图像搜索这个场景结合还是挺好的,从图像质量来看也还行,在及格线以上。

XiaoHu.AI日报

🔗https://x.com/xiaohuggg/status/1727119128581100001?s=20🔟🗣️ChatGPT:语音功能向所有免费用户开放更新下载客户端即可使用语音功能。🔗https://x.com/xiaohuggg/status/1727112003372892187?s=201⃣1⃣️一个沉浸式的翻译工具:ZipZapAI🌐高质量多语言翻译:提供沉浸式阅读和写作体验,支持多种语言的高质量翻译。🔍智能内容识别:能够智能识别网页上的内容,如Twitter、Discord等,提供鼠标悬停翻译。🌍支持主流浏览器:支持Chrome、Edge等主流浏览器,下载插件即可使用。👍用户友好:简单易用的用户界面,操作很方便。💬随时询问AI:内置了GPT的聊天功能,可以随时提问。🔗https://twitter.com/xiaohuggg/status/1727267679663477212

TTS 数据整理

|类别|名称|描述|链接|详情||-|-|-|-|-||歌声|MUSDB18|corpus for music separation|[https://sigsep.github.io/datasets/musdb.html#musdb18-compressed-stems](https://sigsep.github.io/datasets/musdb.html#musdb18-compressed-stems)|||歌声|DSD100|100 full lengths music tracks of different styles along with their isolated drums,bass,vocals and others stems.|[https://sigsep.github.io/datasets/dsd100.html](https://sigsep.github.io/datasets/dsd100.html)|||歌声|Korean Songs||[http://urisori.co.kr/urisori-en/doku.php/](http://urisori.co.kr/urisori-en/doku.php/)|||speech2speech|cvss|21种语言转英语|[https://github.com/google-research-datasets/cvss](https://github.com/google-research-datasets/cvss)|||说话人日志Speaker diarisation|AiShell-4|211场会议,120小时|[http://www.aishelltech.com/aishell_4](http://www.aishelltech.com/aishell_4)|||说话人日志Speaker diarisation|AliMeeting|118.75小时会议数据|[https://www.openslr.org/119/](https://www.openslr.org/119/)|||wake up唤醒|WakeUp-1|中英文1561小时|[http://www.aishelltech.com/wakeup_data](http://www.aishelltech.com/wakeup_data)|||wake up唤醒|HI-MIA|340说话人,智能家居|[http://www.openslr.org/85/](http://www.openslr.org/85/)|||wake up唤醒|MobvoiHotwords|每词36k句|[https://www.openslr.org/87/](https://www.openslr.org/87/)|||wake up唤醒|hey snips||[https://github.com/sonos/keyword-spotting-research-datasets](https://github.com/sonos/keyword-spotting-research-datasets)|||speech translation|Fisher--CALLHOME|Es→En 160hrs|[https://joshua.incubator.apache.org/data/fisher-callhome-corpus/](https://joshua.incubator.apache.org/data/fisher-callhome-corpus/)|||speech translation|STC|En↔Jp 22hrs|[https://ahcweb01.naist.jp/resource/stc/](https://ahcweb01.naist.jp/resource/stc/)|||speech translation|How2|En→Pt 300hrs|[https://github.com/srvk/how2-dataset](https://github.com/srvk/how2-dataset)||

Others are asking
语音转文字有哪些办法
以下是一些语音转文字的办法: 1. 利用 GVoice 提供的语音录制和识别能力,其中文识别率优秀。但需注意语音识别可能存在少量错误,不过 ChatGPT 通常能正常理解和纠错,衔接较为流畅。 2. 使用 Whisper API 时,默认仅支持小于 25MB 的文件。若音频文件更长,需将其分成小于 25MB 的块或使用压缩后格式,可使用 PyDub 开源 Python 软件包来拆分声频文件。 3. 对于 Whisper API,可以使用提示来提高生成的转录质量。例如,改善特定单词或缩略语的识别、保留分段文件的上下文、避免标点符号的省略、保留填充词汇、处理不同书写风格等。 希望这些信息能满足您的需求。
2025-01-04
有哪些 文本转语音的免费AI软件
以下是一些文本转语音的免费 AI 软件及相关的人工智能音频初创公司: 免费的文本转语音 AI 软件: 1. Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,能高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 2. Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,可作为多种平台的应用使用,用于收听网页、文档、PDF 和有声读物等。 3. Azure AI Speech Studio:https://speech.microsoft.com/portal ,提供支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供了自定义的语音模型。 4. Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型。 人工智能音频初创公司: 1. ,能将书面内容转化为引人入胜的音频,并实现无缝分发。 2. ,提供专业音频、语音、声音和音乐的扩展服务。 3. (被 Spotify 收购),提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 4. ,利用合成媒体生成和检测,带来无限可能。 5. ,一键使您的内容多语言化,触及更多人群。 6. ,生成听起来真实的 AI 声音。 7. ,为游戏、电影和元宇宙提供 AI 语音演员。 8. ,为内容创作者提供语音克隆服务。 9. ,超逼真的文本转语音引擎。 10. ,使用单一 AI 驱动的 API 进行音频转录和理解。 11. ,听起来像真人的新声音。 12. ,从真实人的声音创建逼真的合成语音的文本转语音技术。 13. ,生成听起来完全像你的音频内容。 14. ,为所有人提供开放的语音技术。 15. ,基于 AI 的语音引擎能够模仿人类语音的情感和韵律。 16. ,基于 NLP 的最先进文本和音频编辑平台,内置数百种 AI 声音。 17. ,使用突触技术和脑机接口将想象的声音转化为合成 MIDI 乐器的脑控仪器。 18. ,为出版商和创作者开发最具吸引力的 AI 语音软件。 19. ,Wondercraft 使用户能够使用文本转语音技术生成播客。 20. ,基于生成机器学习模型构建内容创作的未来。 21. ,从网页仪表板或 VST 插件生成录音室质量的 AI 声音并训练 AI 语音模型。 22. ,演员优先、数字双重声音由最新的 AI 技术驱动,确保高效、真实和符合伦理。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-04
端到端语音技术现在进展到什么程度了
端到端语音技术目前取得了显著进展。 在语音合成方面: 语音合成将文本转换为可听的声音信息,是人机交互的重要接口,一般包括 TTS、歌唱合成等领域。 当代工业界主流语音合成系统包括文本前端和声学后端两个部分。文本前端将输入文本转换为层次化的语音学表征,声学后端基于此生成语音,主要技术路线包括单元挑选波形拼接、统计参数和端到端语音合成方法,当代主要采用端到端声学后端。 端到端声学后端一般包括声学模型和声码器两部分,也出现了直接从音素映射为波形的完全端到端语音合成系统。 在全模态智能体方面: OpenAI 发布的 GPT4o 是新模型通过端到端的神经网络,把视觉、语音和文本数据混合训练,对音频输入的平均反应时间为 300 毫秒,与人类对话的反应时间相似。 直接拿音频数据来训练的好处是模型能从数据中感悟到人类表达的情绪、语调、风格等,能听到几乎真实的人类的声音。 OpenAI 未公开 GPT4o 的技术细节,唯一线索来自内部模型炼丹师的一篇博客,项目名是 AudioLM,目标是用端到端的方式扩大语音模型的能力。
2025-01-03
coze上的智能体发布到微信公众号后,支持语音聊天吗
Coze 上的智能体发布到微信公众号后,支持语音聊天。 chatgptonwechat(简称 CoW)项目是基于大模型的智能对话机器人,支持微信公众号、企业微信应用、飞书、钉钉接入,可选择多种模型,能处理文本、语音和图片,通过插件访问操作系统和互联网等外部资源,支持基于自有知识库定制企业 AI 应用。 登录宝塔面板后,在宝塔面板当中可视化控制云服务器,部署 docker 容器,启动 CoW 项目与微信取得关联。具体操作包括点击“Docker”中的“编排模板”或“项目模板”中的“添加”按钮,复制编译好的内容,在“容器编排”中“添加容器编排”等步骤。成功将 Bot 接入微信中后,点击容器可以看到运行的服务,需要手动刷新查看相关日志。 需要注意的是,之前 Coze AI 平台不支持直接与个人微信和微信群进行功能对接,但国内版正式发布 API 接口功能后,直接对接个人微信甚至微信群已成为可能。
2025-01-03
有没有语音对话的AI
目前有多种具备语音对话功能的 AI 技术和应用。 OpenAI 在语音对话方面,通过更换 prompt 让 GPT 尽量生成短内容,不轻易生成列表和代码,语音合成用 TTS API,识别用 whisper API。其方法论追求大的通用模型,避免定制和特化,将精力集中在模型研发上。 在游戏领域,生成式 AI 带来了语音方面的变革。借助生成性 AI 对话,游戏角色可以说任何话,完全响应玩家正在做的事情。结合更智能的 NPC AI 模型,完全对玩家作出反应的游戏将很快成为现实。此外,还能使用与玩家虚拟形象匹配的生成声音维持角色扮演的幻觉,控制声音的细微差别,实现对话的本地化翻译和发音。 在音频方面,有众多公司致力于为游戏角色创造逼真的语音,如 Sonantic、Coqui、Replica Studios、Resemble.ai、Readspeaker.ai 等。同时,也有很多公司试图创建由 AI 生成的音乐,例如 Soundful、Musico、Harmonai、Infinite Album 和 Aiva 等。
2024-12-31
有什么好的ai可以做到把视频中的人物或物体,背景等换掉,而且把其中的语音改成自己想要的说话声
以下是一些可以实现您需求的 AI 工具和方法: 1. 剪映 App: 生成数字人:在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到视频中,左下角会提示渲染完成,可点击预览查看效果。 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并点击“导入”按钮选择本地图片上传,将图片添加到视频轨道上,通过拖动轨道右侧竖线使其与视频对齐,选中轨道后可调整图片大小和数字人位置。 2. TecCreative 工具: 数字人口播配音:输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。 图片换脸:上传原始图片和换脸图片,一键实现素材换脸。 视频换脸:上传原始视频和换脸图片,自动识别并替换人脸。 音频合成数字人:上传音频文件,选择数字人角色和输出类型,生成数字人视频。 AI 配音:输入需配音文案,选择音色,立即生成。 AI 字幕:点击上传视频,开始生成,字幕解析完成后可下载 SRT 字幕。 在使用这些工具时,请注意相关的格式和文件大小限制,如图片大小上限 5M,支持 JPG、PNG 格式;音频文件支持 MP3 和 WAV 格式,文件大小上限 5M;视频支持 MP4 文件类型,大小上限为 50M。
2024-12-30
我想要做一个ai工具,针对电子元器件行业,我来提供专业术语翻译的知识库和固定描述语句翻译方法,希望上传中文PDF后,可以下载一个翻译好的PDF,0编程基础应该怎么做呢
对于您这种没有编程基础但想要制作针对电子元器件行业的 AI 工具来实现中文 PDF 上传并下载翻译好的 PDF 的需求,以下是一些建议: 首先,您需要学习一些基本的 AI 概念和技术知识,了解自然语言处理(NLP)的基本原理。 其次,可以考虑使用现有的无代码或低代码 AI 开发平台。这些平台通常具有可视化的界面和易于操作的工具,能够帮助您在不编写代码的情况下构建简单的 AI 应用。 然后,针对您的专业术语翻译需求,需要对电子元器件行业的术语进行系统整理和分类,建立一个清晰的术语库。 同时,确定固定描述语句的翻译规则和方法,并将其转化为可在 AI 工具中应用的逻辑。 在实施过程中,要不断测试和优化您的工具,以确保翻译的准确性和质量。 总之,虽然没有编程基础会增加一定的难度,但通过合理利用现有资源和持续学习,您是有可能实现这个目标的。
2025-01-04
我想要做一个ai工具,针对电子元器件行业,我来提供专业术语翻译的知识库和固定描述语句翻译方法,希望上传中文PDF后,可以下载一个翻译好的PDF
目前针对您想要针对电子元器件行业制作一个能上传中文 PDF 并下载翻译好的 PDF 的 AI 工具的需求,暂时没有相关的现成内容和方法。但您可以考虑以下步骤来实现这一目标: 1. 数据准备:收集和整理电子元器件行业的专业术语、固定描述语句以及对应的翻译,构建一个丰富准确的知识库。 2. 选择合适的技术:例如自然语言处理技术和机器翻译算法,以实现对中文 PDF 的翻译。 3. 开发工具界面:设计一个用户友好的界面,方便用户上传中文 PDF 和下载翻译后的 PDF。 4. 测试和优化:对工具进行充分的测试,根据测试结果不断优化翻译的准确性和工具的性能。 这是一个较为复杂的项目,需要一定的技术和资源投入,但如果成功实现,将为电子元器件行业带来很大的便利。
2025-01-04
DeepL翻译插件
以下是关于 DeepL 翻译插件以及 PDF 翻译的相关信息: DeepL 翻译插件: 网站: 点击页面「翻译文件」按钮,可上传 PDF、Word 或 PowerPoint 文件进行翻译。 在 Stable Diffusion 中,如果输入的提示词只能识别英文,对于英文不好的情况,常用的翻译软件如 DeepL 翻译,网址是,可以下载客户端使用。还有“网易有道翻译”,因其可以 ctrl+alt+d 快速截图翻译,使用方便。但复制、粘贴来回切换麻烦,此时可使用自动翻译插件 promptallinone,安装方式是在扩展面板中搜索 promptallinone 直接安装,或者将下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下,安装完成后重启 webUI 进行设置。 PDF 翻译的方法和产品: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式,但进阶功能基本需付费。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译,有免费次数限制且进阶功能需付费。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 浏览器自带的翻译功能:如果 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。
2025-01-02
有没有可以帮我翻译万字中文文档为英文的工具
以下是一些可以帮助您翻译万字中文文档为英文的工具和方法: 1. 利用 ChatGPT:先将中文内容以流水账式记叙文写出来,然后把中文丢进 ChatGPT,并给出指令让其翻译成英文。 2. DeepL(网站): 点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 3. 沉浸式翻译(浏览器插件): 安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 4. calibre(电子书管理应用): 下载并安装 calibre,并安装翻译插件「Ebook Translator」。 5. 谷歌翻译(网页): 使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 6. 百度翻译(网页): 点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 7. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、PDF、Word、Excel、PPT、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 8. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 9. 浏览器自带的翻译功能:如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。
2024-12-31
有什么可以把pdf直接翻译成中文的
以下是一些可以将 PDF 直接翻译成中文的方法和工具: 1. DeepL(网站): ,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件): ,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. calibre(电子书管理应用): ,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页): ,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页): ,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 8. 浏览器自带的翻译功能:如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。
2024-12-25
有没有什么好用的手机翻译ai
以下为您推荐一些好用的手机翻译 AI 应用: 1. Hand Talk:能自动将文本或语音转换成美国手语。被联合国评为“世界上最佳的社交应用”,已翻译近 20 亿个单词,既是翻译工具,也是学习平台。相关链接:https://xiaohu.ai/p/5688 、https://x.com/imxiaohu/status/1777201503142601143
2024-12-24
我想问 有没有可以帮忙写 flux 或者其他图像模型 prompt 的 system prompt 模板
以下是为您整理的相关内容: 关于 FLUX 模型的安装部署: 模型选择:FLUX.1 有 dev、dev fp8、schnell 等版本,建议选择 dev 版本,显卡较好可用 fp16,显卡不够选 fp8。模型下载后放入 ComfyUI/models/unet/文件夹中。若爆显存,可在“UNET 加载器”节点中将 weight_dtype 设置为 fp8,降低显存使用量,但可能稍降质量。 clip:t5xxl_fp16.safetensors 和 clip_l.safetensors 放在 ComfyUI/models/clip/文件夹里,也可用 t5xxl_fp8_e4m3fn.safetensors 降低内存使用率,超过 32GB 内存建议用 fp16。 Vae:下载后放入 ComfyUI/models/vae 文件夹。 关于训练 Midjourney 的 prompt: 训练问题:强大的 DMs 通常消耗数百个 GPU 天,推理由于顺序评估而成本高昂。在有限的计算资源上应用 DMs 于强大的预训练自动编码器的潜在空间中训练,可在不影响质量和灵活性的情况下实现复杂度降低和细节保留的最佳点,显著提高视觉保真度。引入交叉注意力层到模型架构使扩散模型成为强大灵活的生成器,支持文本和边界框等一般条件输入,实现高分辨率卷积合成。 版本:Midjourney 定期发布新模型版本以提高效率、连贯性和质量。最新模型为默认,也可通过version 或v 参数或/settings 命令选择其他版本。V5 模型于 2023 年 3 月 15 日发布,具有更广泛的风格范围、更高的图像质量、更详细的图像等优点。 关于 ComfyUI 图片提示词反推提示词生成: 在 ComfyUI 里使用 MiniCPM 做图片提示词反推与文本提示词生成,可和 flux 模型配合生成图片,建议使用量化版本的模型(int4 结尾)节省显存。 安装方法:进入 ComfyUI 自定义节点目录,克隆相关仓库,重启 ComfyUI。 模型下载:网盘 https://pan.quark.cn/s/00b3b6fcd6ca ,下载后放入 ComfyUI 的 models 文件夹下 MiniCPM 文件夹中,没有就新建一个。
2025-01-02
有哪些作文批改类的ai工具。以及有没有ai作文批改的共学分享
以下是一些常见的作文批改类 AI 工具: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 关于 AI 作文批改的共学分享,目前在飞书群进行问题接龙及答疑,例如: 1. 上课用什么工具,大模型工具需自行准备,推荐顺序为 chatGPT 4.0、kimichat、智谱清言 4。 2. 文本纠错方面的方法案例,如果是问工具,飞书文档带有纠错功能;如果用 prompt 纠错,文本量不能太大,直接告诉大模型:检查下列文本中的错别字、语法错误和格式错误,指出并改正,重新生成新的文本。 3. 用文心一言 APP 可以。 4. 关于国内是否有类似国外提示词支持调用其他 AI 工具的情况,如国产大模型能否文生图,一些模型可以,比如智谱和文心。 5. 把文章给大模型容易,关键是自己给自己写什么样的 prompt。 6. 如果只是用来自己学,长期学习,不一定必须需要 iPhone 手机或者对显卡有一定要求,ChatGPT 交费存在问题且没有途径。
2024-12-31
我想用cursor做一个微信小游戏,有没有什么好的提示词
以下是使用 Cursor 做微信小游戏的一些提示词和相关经验: 1. 前期描述好需求:在设置里面,Rules for AI 的提示词。 2. 按照功能模块单独建立实现文档,包括深入理解需求、技术实现、测试等。 3. 学会看代码,了解每一步文件的作用,以提升对技术的理解。 4. 注意 Cursor 相关报错原因,如重复安装依赖项、重新创建文件、导入的路径不对、错误导入已经废弃的文件、突破 AI 记忆的东西、Cursor 缓存未更新等。 此外,还有一些教训和好用的软件: 1. 教训:页面样式保存和海报样式保存等问题需要注意。 2. 好用的软件: GitHub:大名鼎鼎,有宝藏开源项目库。 Apifox:检验端口以及 API 是否有效回应。 DBeaver:用于数据库。 Docker Desktop:某些项目安装下载可用。 微信开发者工具:开发微信小程序必需。 另外: 1. 学会向 AI 提供线索非常重要,比如使用纠错公式,在【xxxx】位置,做了【xxxx】动作,出现了【xxxx】错误,预期是【xxxx】。 2. 了解切换目录命名的命令,如 CD 命令。 3. 可以参考 Python 教程,掌握 Python 编程语言,过去在微信机器人教程中有相关介绍。 4. 分享个 Cursor 提示词网站:https://cursor.directory/,里面有大量网友实践后上传的提示词可供学习和参考。
2024-12-31
有没有比较好用且便宜的AI招聘工具?
以下是一些比较好用且便宜的 AI 招聘工具: 1. 智联招聘 APP:这是一款 AI 招聘筛选工具,利用自然语言处理和机器学习技术,帮助企业快速筛选简历,提高招聘效率。 2. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度等特点,能帮助企业完成面试、初筛和发送面试邀约。 3. 海纳 AI 面试:通过在线方式自动面试和评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上,还能改善候选人体验。 此外,还有以下与招聘相关的 AI 工具: 1. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历。 2. Rezi:利用先进的 AI 技术自动化创建可雇佣简历的每个方面。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 需要注意的是,在使用这些工具时,要考虑数据安全性和隐私保护的问题。
2024-12-30
生成3D模型的工具
以下是一些生成 3D 模型的工具: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速的 2D 到 3D 转换,并提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成。用户可通过上传图片并描述材质和风格来生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型,特别适用于游戏领域的模型生成。 4. Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 此外,还有以下工具: 1. xiaohu.ai 相关的: CSM_ai:文本、图像或草图可转换为 3D 素材,直接应用于游戏中,无需后期处理。体验地址:https://cube.csm.ai Move AI 推出的 Move API:从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。https://move.ai/api ComfyUI 3D Pack:快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。https://github.com/MrForExample/ComfyUI3DPack/tree/main Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。https://t.co/3tUvxB0L4I Media2Face:3D 面部动画创造工具,根据声音生成同步的 3D 面部动画,允许个性化调整情感表达,应用于多种场合。https://sites.google.com/view/media2face SIGNeRF:在 3D 场景中快速生成和编辑对象,新增或替换场景中的物体,新生成场景与原场景无缝融合。https://signerf.jdihlmann.com Luma AI 发布的 Genie 1.0 版本:文本到 3D 模型转换工具,生成详细逼真的 3D 模型,支持多种 3D 文件格式,获得 4300 万美元 B 轮融资。https://lumalabs.ai/genie?view=create BakedAvatar 动态 3D 头像:从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,交互性编辑。https://buaavrcg.github.io/BakedAvatar/ 这些工具通常具有用户友好的界面,允许用户通过简单操作生成 3D 模型,无需专业 3D 建模技能,可广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2025-01-04
介绍一个文稿转换成视频的ai工具
以下为您介绍一些文稿转换成视频的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果您熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 若您想用 AI 把小说做成视频,可参考以下制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可利用的工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-01-04
使用AI制作PPT最好用的工具
以下是一些使用 AI 制作 PPT 较好用的工具: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素,适用于多种场合,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成等功能,网址:https://zhiwen.xfyun.cn/ 5. 爱设计 6. 闪击 7. Process ON 8. WPS AI 此外,Claude 结合 Gamma.app 可帮助快速寻找符合条件的论文、提取精炼论文信息、找到适合的 PPT 制作工具并教会使用。
2025-01-04
财务 ai 的工具或产品
以下是一些财务 AI 的工具或产品: 1. 论文写作相关: 文献管理和搜索:Zotero 结合 AI 技术可自动提取文献信息,Semantic Scholar 是 AI 驱动的学术搜索引擎。 内容生成和辅助写作:Grammarly 提供文本校对等,Quillbot 可重写和摘要。 研究和数据分析:Google Colab 支持 AI 和机器学习研究,Knitro 用于数学建模和优化。 论文结构和格式:LaTeX 结合自动化和模板处理格式,Overleaf 是在线 LaTeX 编辑器。 研究伦理和抄袭检测:Turnitin 和 Crossref Similarity Check 检测抄袭。 2. 特定财务相关: Parthean AI:是一款财务教练,将 AI 工具与个人财务信息集成,提供定制答案,帮助制定预算和规划财务目标。 3. 其他相关: Clay:AI 驱动的联系人应用软件,自动整理联系人信息,助力管理人脉。 Promptden:提示词交流和交易社区,可探索、发现和分享多种 AI 生成内容。 TinyStudio:免费的 Mac 应用程序,利用 M1/M2 芯片为视频和音频文件生成字幕。 Pagegpt:提供个性化网页设计,生成文案和图片,帮助吸引和转化顾客。 此外,生成式 AI 在金融服务业也有应用,可帮助回答财务问题、改进内部流程,如在预测方面编写公式和查询、发现模式并建议输入,在报告方面自动创建内容并调整,在会计和税务方面综合总结并提出可能答案,在采购和应付账款方面自动生成和调整相关文件及提醒。
2025-01-04
罗列一下中国国内能用的,好用的AI网站和工具
以下是中国国内一些好用的 AI 网站和工具: 1. 墨刀 AI:设计工具。 2. 无限画:图像生成。 3. autoDL 云服务租用:Agent。 4. 百度 Chat:AI ChatBots。 5. 360AI 搜索。 6. AIbot ai 工具集:导航网站。 7. 创客贴 AI:设计工具。 8. MasterGo:设计工具。 9. 美图设计室:图像编辑。 10. 魔搭社区 阿里达摩院:AI 训练模型。 11. 即时 AI 设计:设计工具。 12. Boardmix 博思 AI 白板:PPT。 13. 百度飞桨 AI Studio:AI 学习。 14. 字节扣子。 15. 提示工程指南:Prompts。 16. toolsdar:导航网站。 17. 同花顺问财:金融。 18. 即梦 AI(剪映):其他视频生成。 19. 可灵 AI:其他视频生成。 20. 360 快剪辑:视频编辑。 21. Dify.ai:Agent。 22. Vast(算力)。 23. 图虫网:AI 摄影作品销售平台。 24. 网易云音乐音乐人平台:AI 音乐作品发布平台。 25. 好好住 APP:AI 家居用品推荐平台。 26. 东方财富网投资分析工具:AI 金融投资分析平台。
2025-01-04
常用AI工具有什么
以下是一些常用的 AI 工具: 1. 绘图工具: Lucidchart:流行的在线绘图工具,支持多种视图创建,有拖放界面。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板。 draw.io(diagrams.net):免费在线图表软件,支持多种类型图表创建。 PlantUML:文本到 UML 转换工具,可自动生成相关视图。 Gliffy:基于云的绘图工具,支持创建架构图。 Archi:免费开源工具,用于创建相关模型和视图。 Rational Rose:IBM 的 UML 工具,支持创建多种视图。 2. 文章润色工具: Wordvice AI:集校对、改写转述和翻译等功能于一体,提供全面英文论文润色服务。 ChatGPT:由 OpenAI 开发,可用于多方面写作辅助。 Quillbot:人工智能文本摘要和改写工具。 HyperWrite:基于 AI 的写作助手和大纲生成器。 Wordtune:AI 驱动的文本改写和润色工具。 Smodin:提供 AI 驱动的论文撰写功能。 3. 建筑设计审核工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载建筑大模型。 Maket.ai:面向住宅行业,在户型和室内软装设计方面有探索。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,提供全新设计模式。 Fast AI 人工智能审图平台:形成全自动智能审图流程,实现数据汇总与管理。 需要注意的是,每个工具都有其特定的应用场景和功能,建议根据具体需求选择合适的工具。同时,部分内容由 AI 大模型生成,请仔细甄别。
2025-01-04