Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有什么可以在手机端使用ai工具api的聚合聊天aiapp吗

Answer

以下是一些在手机端可以使用 AI 工具 API 的聚合聊天 App 相关信息:

  • OpenAI 与 Apple 合作在 iPhone 端实现了 ChatGPT 功能集成,包括 Siri 智能化升级、写作助手、相机 AI 视觉和跨应用使用等功能。例如,Siri 面对复杂或创意性请求会交由 ChatGPT 处理,iPhone 的文本编辑功能提供文本润色、语法检查、内容生成等,长按相机控制键可启动视觉智能功能,所有功能界面都内置了快捷入口直达 ChatGPT 应用。

此外,移动应用榜单中有一些相关应用,如在移动领域月活跃用户数排名榜首的 ChatGPT,还有微软基于 AI 技术全新打造的搜索引擎 Bing、照片美化和虚拟形象制作工具 Remini 等。有五家 AI 公司实现了“双线作战”,它们的网页端、移动端应用双双跻身前 50 强榜单,如 ChatGPT、Character.AI、chatbot 平台 Poe,以及图片编辑应用 Photoroom、Pixelcut。

Content generated by AI large model, please carefully verify (powered by aily)

References

OpenAI12场发布会每日记录完整版包含视频翻译-Day1-12

OpenAI马拉松发布会Day5:与Apple合作!今天的发布会由Sam Altman、Miqdad Jaffer和Dave Cummings带来,宣布了ChatGPT与Apple的深度合作🤷翻译视频by宝玉https://x.com/dotey/status/1866974269051113543[[twi]@宝玉(@_twi(2).mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/LuddblXncofkWtxbWzBc2egUncb?allow_redirect=1)[heading3]📱iPhone端的ChatGPT功能集成[content]1.Siri智能化升级Siri现在变得更“聪明”了!面对复杂或创意性请求,Siri会智能判断并交由ChatGPT处理。用户在操作前需确认,充分保障数据隐私。支持通过Siri指令直接调用ChatGPT,简洁高效。2.写作助手📝iPhone的文本编辑功能全面升级:提供文本润色、语法检查、内容生成(包括段落/全文)。可进行长文/邮件概要提取,大大提高效率。3.相机AI视觉📷长按相机控制键,启动视觉智能功能。用户可向ChatGPT提问,分析和理解图像内容。在演示中,Sam用此功能评选了“圣诞毛衣比赛”,结果GPT很懂人情世故,给Sam评了第一名🤣4.跨应用使用🔄所有功能界面都内置了快捷入口,直达ChatGPT应用。对话记录同步,方便在不同应用间无缝切换,深度交互。

GPT、DALL·E、Sora,为什么 OpenAI 可以跑通所有 AGI 技术栈?

对于OpenAI,目前的目标很明确:就是all in AGI,一切研究围绕着探索通往AGI的路径。而商业模式上也很简单:SaaS,直接给API,接口设计内部自己决定,付多少钱用多少,不想用就不用,这样省去了很多产品设计,marketing,BD的时间,伺候甲方的时间(有比较可靠的消息称即使Microsoft的Copilot等产品也是直接用的API,没有花功夫做太多的定制),整个公司可以集中精力开发AGI。有人可能说:不是啊,OpenAI不是还有ChatGPT的用户界面,手机端语音聊天,以及GPTs吗?但是仔细想想,这几个部分OpenAI可以说是「非常不用心」了。比如ChatGPT Plus是怎么自动融合搜索,图片生成,代码调用等工具的?单独做了一套深度优化?不,答案是OpenAI给了一个巨大的prompt,让模型自己去选。OpenAI是怎么和各种第三方插件结合的,是单独做了匹配和接口?不,答案是直接让这些plugins描述自己是什么,然后模型自己调用,至于调用得对不对那就是另外一件事情了。这里最典的是最近OpenAI怎么实现「记忆」的,给大家看看OpenAI的完整prompt(李博杰提供的,每个人可以诱导ChatGPT说出这些,OpenAI也不在乎):OpenAI直接用prompt让GPT-4调用bio这个工具记录需要记忆的内容(「to=xxx」是调用内部工具的语法,比如"to=python"是GPT调用code interpreter的方式)。然后每次新的对话开始时,在prompt的最后直接加上所有之前的记录的内容(##Model Set Context)。就是这么简单粗暴。

翻译:A16Z-TOP 100生成式AI应用

我们的移动应用榜单是全新的阵容。在移动领域,ChatGPT同样占据榜首位置——但领先幅度明显缩小。以月活跃用户数为标准,ChatGPT的规模大约是排名紧随其后第二名微软Edge和第三名Photomath的2.5倍。在移动应用的前五强中,还包括了微软基于AI技术全新打造的搜索引擎[Bing](https://apps.apple.com/us/app/bing-chat-with-ai-gpt-4/id345323231),以及照片美化和虚拟形象制作工具[Remini](https://apps.apple.com/us/app/remini-ai-photo-enhancer/id1470373330)。值得注意的是,有五家AI公司实现了“双线作战”,它们的网页端、移动端应用双双跻身前50强榜单:[ChatGPT](https://chat.openai.com/)、[Character.AI](http://character.ai/)、chatbot平台[Poe](http://poe.com/),以及图片编辑应用[Photoroom](http://photoroom.com/),[Pixelcut](https://www.pixelcut.ai/)。

Others are asking
ai本地部署对比网页版区别在哪
AI 本地部署和网页版主要有以下区别: 1. 出图速度:网页版出图速度快,本地部署可能相对较慢。 2. 硬件配置要求:网页版不吃本地显卡配置,本地部署对电脑配置要求较高,配置不高可能出现生成半天后爆显存导致出图失败的情况。 3. 出图质量:本地部署出图质量通常高于网页版。 4. 功能扩展性:本地部署可以自己添加插件,网页版功能相对固定。 5. 算力限制:网页版为节约算力成本,通常只支持出最高 1024×1024 左右的图,制作横板、高清等图片受限;本地部署算力限制较小。 6. 电脑使用状态:本地部署使用期间电脑基本处于宕机状态,网页版则无此问题。 例如,在图像生成方面,线上的优势在于找参考、测试模型,线下则是主要的出图工具。一些在线体验平台如哩布哩布 AI 每天有一百次生成次数,集成了最新模型;Clipdrop 每天免费 400 张图片,需排队,出图约需二三十秒。
2025-02-05
AI应用的类别
以下是一些 AI 应用的类别: 1. AI 摄影参数调整助手:使用图像识别、数据分析技术,在摄影 APP 中实现根据场景自动调整摄影参数,市场规模达数亿美元。 2. AI 音乐情感分析平台:运用机器学习、音频处理技术,通过音乐情感分析软件分析音乐的情感表达,市场规模达数亿美元。 3. AI 家居智能照明系统:借助物联网技术、机器学习,如小米智能照明系统实现家居照明的智能化控制,市场规模达数十亿美元。 4. AI 金融风险预警平台:利用数据分析、机器学习,通过金融风险预警软件提前预警金融风险,市场规模达数十亿美元。 5. AI 旅游路线优化平台:采用数据分析、自然语言处理,如马蜂窝路线优化功能根据用户需求优化旅游路线,市场规模达数亿美元。 6. AI 游戏道具推荐系统:使用数据分析、机器学习,在游戏内商城推荐功能中根据玩家需求推荐游戏道具,市场规模达数亿美元。 7. AI 天气预报分时服务:运用数据分析、机器学习,如彩云天气分时预报提供精准的分时天气预报,市场规模达数亿美元。 8. AI 医疗病历分析平台:借助数据分析、自然语言处理,通过医渡云病历分析系统分析医疗病历,辅助诊断,市场规模达数十亿美元。 9. AI 会议发言总结工具:利用自然语言处理、机器学习,如讯飞听见会议总结功能自动总结会议发言内容,市场规模达数亿美元。 10. AI 书法作品临摹辅助工具:采用图像识别、数据分析,在书法临摹软件中帮助书法爱好者进行临摹,市场规模达数亿美元。 11. AI 菜谱口味调整工具:运用自然语言处理、数据分析,如下厨房口味调整功能根据用户反馈调整菜谱口味,市场规模达数亿美元。 12. AI 语言学习纠错平台:借助自然语言处理、机器学习,如英语流利说纠错功能帮助语言学习者纠正错误,市场规模达数十亿美元。 13. AI 电影剧情分析系统:利用数据分析、自然语言处理,如豆瓣电影剧情分析工具分析电影剧情,提供深度解读,市场规模达数亿美元。 14. AI 办公文件分类系统:采用数据分析、机器学习,如腾讯文档分类功能自动分类办公文件,方便管理,市场规模达数亿美元。 15. AI 美容护肤方案定制平台:借助图像识别、数据分析,如美丽修行定制方案功能根据用户肤质定制护肤方案,市场规模达数亿美元。
2025-02-05
可以生成五分钟以上视频的AI
以下是一些可以生成五分钟以上视频的 AI 工具: 1. GoogleAI 视频 Veo2: 功能点: 能够生成具有高度真实感和物理规律的视频。 对拍摄风格、角度、运动等的语义理解极佳。 能够对运动物体进行超级稳定的多轮材质变化。 能够直接输出 4K 视频。 优势: 高真实质感,让人难以区分真实拍摄和 AI 生成。 遵循视频中的物理规律和现实世界一致。 在特效变换中表现出极高的稳定性。 在 Google 的评测中,多数情况下取得了最优结果。 体验无需长时间排队等待。 2. Sora(由 OpenAI 开发):能够生成长达 1 分钟以上的视频,能根据文字指令创造出逼真且充满想象力的场景,视频中的人物和背景具有较高的一致性和稳定性。 3. 其他工具: Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-05
可以生成五分钟以上视频的AI
以下是一些可以生成五分钟以上视频的 AI 工具: 1. GoogleAI 视频 Veo2: 能够生成具有高度真实感和物理规律的视频,对拍摄风格、角度、运动等的语义理解极佳。 可以对运动物体进行超级稳定的多轮材质变化,能够直接输出 4K 视频。 具有高真实质感,遵循物理规律,稳定性强,在评测中多数情况下取得最优结果,且体验无需长时间排队等待。 2. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 3. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,由 Stability AI 开源。 4. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 5. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 6. Sora(OpenAI):能够根据文字指令创造出逼真且充满想象力的场景,生成长达 1 分钟的超长视频,一镜到底,视频中的人物和场景具有较高的一致性和稳定性。 更多的文生视频的网站可以查看: 需注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-05
免费的视频生成AI
以下为一些免费的视频生成 AI 工具: 1. Runway: 网页:https://runwayml.com/ 注册零门槛:在右上角 Sign Up 注册,输入邮箱与基础信息,完成邮箱验证即可。 选择 Try For Free 模式,新注册用户有 125 个积分进行免费创作(约为 100s 的基础 AI)。 生成第一个视频步骤: 选择左侧工具栏“生成视频”。 选择“文字/图片生成视频”。 将图片拖入框内。 选择一个动画系数。 点击生成 4 秒视频。 下载视频。 2. Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo ,支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 3. ETNA(国内):https://etna.7volcanoes.com/ ,是一款由七火山科技开发的文生视频 AI 模型,可根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。支持中文,时空理解。 4. Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate ,支持文生视频、图生视频,视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持 16:9、9:16、1:1、3:4、4:3 尺寸,图生视频、视频生视频除尺寸不可选外,其他跟文生视频基本相同,默认生成 3s 的视频。 5. 可灵(免费):https://klingai.kuaishou.com/ ,支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文,文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸,图生视频除不可运镜控制外,其他跟文生视频基本相同,默认生成 5s 的视频。
2025-02-05
最好的视频生成AI是哪个
目前没有绝对意义上“最好”的视频生成 AI,以下为您推荐一些出色的视频生成 AI 工具,它们适用于不同的使用场景和需求,您可以根据自身情况选择: 1. Pika:被网友评价为目前全球最好用的文本生成视频 AI,擅长动画制作,并支持视频编辑。功能包括直接发送指令或上传图片生成 3 秒动态视频,目前内测免费。生成服务托管在 discord 中,加入 Pika Labs 的 Discord 频道,在“generate”子区输入指令或上传图片即可生成视频。 2. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。 内容由 AI 大模型生成,请仔细甄别。
2025-02-05
推荐几个办公好用的AIAPP
以下为您推荐几款办公好用的 AI APP: 1. Butterflies AI:这是一款具有社交主题的软件,不仅能进行聊天,还能使用图像生成功能,创建角色轻松便捷,AI 辅助创作出色。但部分角色外观不够一致,搜索页面有待优化。 2. 目前没有更多明确针对办公场景好用的 AI APP 相关信息。
2024-12-23
你能调用deepseekR1的API吗?
DeepSeekR1 的 API 调用步骤如下: 1. 首先到 DeepSeek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。 2. 早期 DeepSeek 有赠送额度,如果没有赠送的余额,可以选择去充值。支持美元和人民币两种结算方式,以及各种个性化的充值方式。 3. 创建一个 API key,注意,API key 只会出现一次,请及时保存下来。 4. 接下来,下载 Cursor(https://www.cursor.com/),或者 VSCode(https://code.visualstudio.com/),只要代码编辑器可以下载插件即可。 5. 以 Cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline。 6. 安装完后,打开三角箭头,就可以看到 RooCline,选中并点击齿轮,进入设置,依次设置: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 语言偏好设置。 小贴士:记得把 HighRisk 选项都打开,这样 AI 才能帮您自动生成文件。 7. 最后做完所有不要忘记点击 Done 保存修改。 8. 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-05
api是什么东西?能实现什么?
API 就像是一个信差,它接受一端的请求,告诉那边的系统您想要做的事情,然后把返回的信息发回给您。 以“奥本海默”的搜索为例,比如像 themoviedb.org 这样的网站,其网址包含域名(www.themoviedb.org)用于定位网站,路径(/search)指定特定页面位置,查询参数(如 query=奥本海默)则明确具体的搜索内容。 对于 GPT 来说,使用 API 时首先要明确想要做什么样的 GPT 以及是否需要外部数据,然后去寻找所需的外部数据的 API 文档,或者自己开发 API 以及寻找市面上可用的 Action。对于一些不熟悉的 API,需要在 Prompt 里告知如何使用。 如果您对 Action 很感兴趣,可以从系统学习 API 相关知识、在网上寻找可用的 API 练习、发掘 GPT Action 更多潜力等方向继续前进。
2025-02-02
API服务是什么意思?
API 服务是指一种接口服务,它就像是一个信差。其作用是接受一端的请求,将请求传达给对应的系统,然后把系统返回的信息再发回给请求方。 例如在 Docker Compose 多容器管理的示例中,提到了包括数据库、AI 模型服务、MySQL 数据库以及一个 API 服务(oneapi)。在网络应用中,通过 API 服务可以实现不同系统或组件之间的通信和数据交互。 在网页访问的例子中,如搜索“奥本海默”的页面,网址中的一些参数和路径的设置就是通过 API 服务来实现的。用户发起请求,API 服务获取相关数据并返回给用户。要了解如何进行请求以及查询参数的编写,需要寻找 API 文档。
2025-01-28
Roo Code 的API Provider 参数哪里设置
要设置 Roo Code 的 API Provider 参数,您可以按照以下步骤进行操作: 1. 首先,进入 deepseek 的官网(https://www.deepseek.com/)。 2. 进入右上角的 API 开放平台。早期 deepseek 是有赠送额度,如果没有赠送的余额,可以选择去充值,支持美元和人民币两种结算方式,以及各种个性化的充值方式,并创建一个 API key。注意,API key 只会出现一次,请及时保存下来。 3. 接下来,以 cursor 作为代码编辑器为例,下载安装 cursor(https://www.cursor.com/),在插件页面搜索并安装 Roocline。安装完后,打开三角箭头,就可以看到 RooCline,选中 RooCline,并点击齿轮,进入设置。 4. 依次设置配置基本参数: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 5. 进行语言偏好设置。 6. 小贴士:记得把 HighRisk 选项都打开,这样 AI 才能帮您自动生成文件。最后做完所有不要忘记点击 Done 保存修改。在聊天框输入产品需求,输入需求后点击这个 blingbling 的星星,优化提示词。最终,在 deepseekr1 的加持下基本上是一遍过,各种特效效果交互逻辑也都正确。画面也算优雅,交互效果也不错,是您想要的。
2025-01-26
以豆包为例,如何通过API调用豆包大模型?
要通过 API 调用豆包大模型,以下是一些相关步骤和信息: 1. 直接调用大模型(之前完成过 coze 对接的同学,直接去二、百炼应用的调用): 百炼首页:https://bailian.console.aliyun.com/ 以调用“qwenmax”模型为例,在/root/chatgptonwechat/文件夹下,打开 config.json 文件,需要更改"model",和添加"dashscope_api_key"。 获取 key 的视频教程: 获取 key 的图文教程:以下是参考配置。 注意:需要“实名认证”后,这些 key 才可以正常使用,如果对话出现“Access to mode denied.Please make sure you are eligible for using the model.”的报错,那说明您没有实名认证,点击去,或查看自己是否已认证。 2. 创建大模型问答应用: 首先可以通过创建一个百炼应用,来获取大模型的推理 API 服务,用于实现 AI 助手。 创建应用: 进入百炼控制台的,在页面右侧点击新增应用。在对话框,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认。您也可以选择输入一些 Prompt,比如设置一些人设以引导大模型更好的应对客户咨询。 在页面右侧可以提问验证模型效果。不过您会发现,目前它还无法准确回答你们公司的商品信息。点击右上角的发布,我们将在后面的步骤中去解决这一问题。 获取调用 API 所需的凭证: 在我的应用>应用列表中可以查看所有百炼应用 ID。保存应用 ID 到本地用于后续配置。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面。在页面右侧,点击创建我的 APIKEY,在弹出窗口中创建一个新 APIKEY。保存 APIKEY 到本地用于后续配置。 3. 配置 FastGpt、OneAPI: 首先配置 OneAPI,还记得刚刚让您白嫖的大模型 API 吗?阿里的接口,这时要派上用场了,去阿里模型的链接里创建 ApiKey,并复制下来。然后在 OneAPI 的页面,点击【渠道】添加新渠道。添加时,类型选择阿里通义千问,名称自己取个,类型选择好后模型是会默认加进去,您不用删减,还有就把刚刚阿里那复制的 ApiKey 粘贴到秘钥里去。这样就 OK 了。后续有其他的大模型也是一样的添加方式。
2025-01-23
哪些应用或者是web服务可以使用api
以下是一些可以使用 API 的应用和 Web 服务: 1. TMDB 提供了搜索电影的 API,其文档网址为 https://developer.themoviedb.org/reference/searchmovie 。在该网站的开发者相关页面或 API 文档中,可获取 API 规则。通过在右上角的认证里能看到 API 读访问令牌,配置文件中包含了如 url、请求方法 get、查询参数 query 和 language 等。输入关键词和相关语言设置,如“奥本海默”和“zhCN”,点击 Try it 即可获取数据,返回的数据格式为 JSON。 2. RAG 加速器的数据抽取服务,基于 FastAPI 和 Postgresql 搭建,并提供了标准的 REST API 接口,附带有 dockercompose 文件方便搭建服务环境。该服务支持定义并持久化“抽取器”,包含抽取结构的图式(Schema)、抽取上下文的指令(Prompt)和抽取样例(Reference examples)。此外,提供了提交文件进行抽取的端点和通过 RemoteRunnable 使抽取服务在 LangChain Expression Language链中更易用的端点。预设了基于 MIME 类型的解析器,支持 PDF 和 HTML 文档的解析,还可扩展支持其他文件类型。使用时可通过 JSON 模式定义提取信息、指定样例提升提取结果质量,传入原始文本或二进制文件。 如果您对 Action 很感兴趣,可以从以下方向继续学习: 1. 系统学习 API 相关知识。 2. 在网上寻找可用的 API 进行练习。 3. 发掘 GPT Action 的更多潜力。
2025-01-23