Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

国产AI大模型的应用

Answer

国产 AI 大模型的应用主要体现在以下几个方面:

  1. 百度文心大模型:在 2024 年大模型中标项目数量和金额大幅增长,凭借 40 个中标项目和 2.74 亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业应用广泛。其落地需要全栈技术能力支持,百度智能云通过完善的 AI 基础设施整合全栈技术,获得广泛行业认可。
  2. Qwen 系列:是国内唯一出现在 OpenAI 视野里、可以参与国际竞争的国产大模型。在 OpenAI 认可的榜单中表现出色,多次冲进榜单,得分不断提高。其开源模型累计下载量突破 1600 万,国内外有海量开发者基于其开发模型和应用。
  3. 免费的大模型 APP:包括 Kimi 智能助手、文心一言、通义千问。
    • Kimi 智能助手:由 Moonshot AI 出品,具有超大“内存”,能读长篇小说和上网冲浪。
    • 文心一言:百度出品的 AI 对话产品,定位为智能伙伴,能写文案、想点子、聊天和答疑解惑。
    • 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。

此外,还有如“非遗贺春”魔多蛇年春节 AI 模型创作大赛等相关活动。

Content generated by AI large model, please carefully verify (powered by aily)

References

WaytoAGI近期活动备份

[国内大模型落地“狂飙”一年,各家厂商成绩如何?](https://waytoagi.feishu.cn/wiki/OYkswbydxixdCKkJLSbc1teknwc)丨百度领跑市场,AI基础设施加速产业化2024年是国内大模型技术加速落地的关键年份,各大厂商如百度、阿里、字节等在AI大模型领域展开激烈竞争。根据数据,2024年大模型中标项目数量和金额大幅增长,百度凭借40个中标项目和2.74亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业,百度文心大模型的应用广泛,表现亮眼。大模型的落地不仅要求技术过硬,还需要全栈技术能力支持,包括算力、数据治理和应用开发等。百度智能云通过其完善的AI基础设施,整合全栈技术,获得了广泛的行业认可,成为大模型落地的领军者。🏮「非遗贺春」魔多蛇年春节AI模型创作大赛|大赛时间2024年12月24日-2025年1月15日🏆大赛奖池【¥12000】现金奖励+官方高含金量荣誉证书+会员与算力激励+流量激励🎈双赛道同时开启,赛道一【春节】+赛道二【爱非遗AI传承】💡期待你以AI助力非遗传承,参赛👉https://club.huixingyun.com/activity/7493989779944805834/?from=aicc-fy-waytoagi📝活动说明:[魔多蛇年春节AI模型创作大赛](https://waytoagi.feishu.cn/wiki/I960wZW1MiuOuEkBw7ncUxmknlg)本次活动由浙江省非遗保护中心(浙江省非遗馆)指导×浙江省非遗保护基金会主办×魔多AI联合承办,由[WaytoAGI](https://www.waytoagi.com/)提供社区传播支持

Qwen 2开源了 模型性能超越目前所有开源模型和国内闭源模型

可以说,Qwen是国内唯一出现在OpenAI视野里,可以参与国际竞争的国产大模型。不久前,OpenAI创始人奥特曼在X上转发了一条OpenAI研究员公布的消息,GPT-4o在测试阶段登上了Chatbot Arena(LMSys Arena)榜首位置,这个榜单是OpenAI唯一认可证明其地位的榜单,而Qwen是其中唯一上榜的国内模型。早些时候,有人做了个LMSys榜单一年动态变化视频。过去一年内,国产大模型只有Qwen多次冲进这份榜单,最早出现的是通义千问14B开源视频Qwen-14B,后来是Qwen系列的72B、110B以及通义千问闭源模型Qwen-Max,得分一个比一次高,LMSys也曾官方发推认证通义千问开源模型的实力。在顶尖模型公司的竞争中,目前为止中国模型只有通义千问真正入局,能与头部厂商一较高下。开发者用脚投票的结果,显示了Qwen系列的受欢迎程度。目前为止,Qwen系列开源模型的累计下载量突破了1600万,国内外有海量开发者都基于Qwen开发了自己的模型和应用,尤其是企业级的模型和应用。Qwen的很多忠实拥趸是海外开发者,他们时常在社交平台发表“我们为什么没有这种模型”的溢美之词(配图详见附件)。可以说,通义大模型用行动证明了开源开放的力量。七、为什么大模型的生态建设如此重要?AI大模型是全球数字技术体系的竞争,这个体系包括芯片、云计算、闭源模型、开源模型、开源生态等等。中国信息化百人会执委、阿里云副总裁安筱鹏指出,全球AI大模型竞争的制高点是AI基础大模型,因为基础大模型决定了产业智能化的天花板,商业闭环的可能性,应用生态的繁荣以及产业竞争的格局。与此同时,开源生态在整个技术体系的竞争中也有着至关重要的作用。

问:国内免费的大模型app有哪些?

Kimi智能助手、文心一言、通义千问这几个都是国内免费的APP。Kimi智能助手:Kimi是一个有着超大“内存”的智能助手,可以一口气读完二十万字的小说,还会上网冲浪,Moonshot AI出品的智能助手。文心一言:百度出品的AI对话产品,它的定位是智能伙伴,能写文案、想点子,又能陪你聊天、答疑解惑。通义千问:通义千问是由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。还有更多大模型产品,可以访问网站查看:内容由AI大模型生成,请仔细甄别。

Others are asking
有没有可以观看英文视频直接即时翻译的AI
以下是一些与观看英文视频直接即时翻译相关的 AI 应用和解决方案: 1. GPT 在官方发布的视频中,能够为英语用户和西班牙语用户进行实时翻译,具有近乎惊人的反应速度。 2. 开发的 AI 双语字幕方案: 用 whisper 生成原视频的英文字幕。 让 GPT 结合字幕全文翻译,并根据原英文字幕的拆分,将译文进行同样行数的拆分。 将 GPT 译文拆分的结果插入到原英文字幕文件中形成新的双语字幕文件。 3. 100 个 AI 应用中的相关例子,如科大讯飞翻译耳机,能够实现实时语言翻译,方便交流。 希望这些信息对您有所帮助。
2025-01-10
有没有可以观看英文视频直接翻译的AI
以下是一些可以观看英文视频直接翻译的 AI 相关信息: 一种解决方案是:先用 whisper 生成原视频的英文字幕,预设 whisper 生成的字幕没问题(whisper 的问题不探讨);然后让 GPT 结合字幕全文翻译,并让其根据原英文字幕的拆分,将译文进行同样行数的拆分;最后将 GPT 译文拆分的结果插入到原英文字幕文件中形成一个新的双语字幕文件。这个过程中所有的执行脚本都是让 GPT 写的。 以下是几个视频 AIGC 工具: Opusclip:利用长视频剪成短视频。 Raskai:短视频素材直接翻译至多语种。 invideoAI:输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:屏幕/播客录制>PPT 方式做视频。 veed.io:自动翻译自动字幕。 clipchamp:微软的 AI 版剪映。 typeframes:类似 invideoAI,内容呈现文本主体比重更多。 google vids:一口大饼。
2025-01-10
总结一下24年国产AI大模型的主要进展
2024 年国产 AI 大模型的主要进展包括: 9 月: 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 21 日:大模型测试基准研究组正式成立。 23 日:钉钉 365 会员上线。 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 国内大模型落地情况: 2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。大模型的竞争,正在加速成为体系化之战。
2025-01-09
国产AI大模型的最新进展
以下是国产 AI 大模型的最新进展: 通义千问的 Qwen 系列表现出色:Qwen 是国内唯一出现在 OpenAI 视野里、能参与国际竞争的国产大模型。Qwen 多次冲进相关榜单,得分不断提高,其开源模型累计下载量突破 1600 万,国内外有大量开发者基于 Qwen 开发模型和应用,尤其在企业级领域。通义大模型证明了开源开放的力量。 国内大模型落地情况:2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 其他进展:智谱一年间推出了 4 代 GLM,一直是国内能力较好的模型之一。MiniMax 推出了 MoE 架构的新模型和“星野”这个目前国内较成功的 AI 陪聊 APP。月之暗面专注长 Token 能力,在记忆力和长 Token 能力上有一定优势。但硬件层上的卡脖子问题仍未缓解,国内目前仍无胜任大模型训练的芯片,在推理上虽有 Nvidia 的替代产品逐渐出现,但华为昇腾在单卡指标上距离不远,因稳定性不足和缺乏 Cuda 生态,仍需时间打磨。
2025-01-09
中国使用最多的视频生成的AI免费工具
以下是中国使用较多的免费视频生成 AI 工具: 1. Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内):https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。 3. Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频,视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持多种尺寸,默认生成 3s 的视频。 4. 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文。文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持多种尺寸,默认生成 5s 的视频。
2025-01-09
AI 领导力
以下是关于“AI 领导力”的相关内容: 1. 2023 年 10 月 30 日,拜登签署了一项具有里程碑意义的行政命令,旨在确保美国在抓住人工智能(AI)的机遇和管理其风险方面发挥引领作用。该行政命令确立了新的 AI 安全和保障标准,保护美国人的隐私,推进公平和公民权利,维护消费者和工人的权益,促进创新和竞争,提升美国在全球的领导地位等。同时,该命令还指示了一系列行动,以应对 AI 系统对美国人安全和保障的潜在风险。 2. 英国国防部于 2022 年 6 月发布了自身的 AI 伦理原则和政策,确定了英国政府在 AI 赋能军事能力方面的方法。将通过特定情境的方法确保该政策应用的适当一致性和协调性,从而促进英国在国防领域使用 AI 的领导地位。 3. 在 AI 迅速发展的当下,懂得有效利用 AI 的人将在职场占据绝对优势。掌握 Claude 的 5 层 Prompt 体系能为自己打造强大竞争壁垒,Prompt 工程已成为热门新兴职业。将该体系应用到日常工作中,如市场研究、写作、数据分析项目等,能创造出令人惊叹的内容。在这个 AI 驱动的世界,真正的魔法在于懂得使用 AI 的人。引用凯文·凯利的话,懂得使用机器人的人将取代不懂得使用的人,掌握 Claude 的 5 层 Prompt 体系是通往未来的金钥匙。
2025-01-09
你是国产的大模型还是国外的
目前国内外大模型的发展情况如下: 国内外差距依然明显,GPT 4 Turbo 总分 90.63 分遥遥领先,国内最好模型文心一言 4.0(API)总分 79.02 分,与 GPT 4Turbo 有 11.61 分差距,与 GPT 4(网页)有 4.9 分差距。但过去 1 年国内大模型有长足进步,综合能力超过 GPT 3.5 和 GeminiPro 的模型有 11 个,如百度的文心一言 4.0、阿里云的通义千问 2.0 等。 在 SuperCLUE 测评中,国外模型平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右,不过平均水平差距在缩小,11 月差距在 10 分左右。 国内开源模型在中文上表现好于国外开源模型,如百川智能的 Baichuan213BChat 等。 在语言与知识的测评中,GPT4 Turbo 依然领先,是唯一超过 90 分的大模型。国内大模型也表现相对较好,OPPO 的 AndesGPT、阿里云的通义千问 2.0 等较为接近 GPT4。 国内大模型在中文语言与知识能力上已基本追赶上国外头部大模型。 此外,新用户可在阿里、腾讯官网获取免费试用服务器,如腾讯云的轻量应用服务器、阿里云的服务器 ECS,服务器系统配置选择宝塔系统。免费大模型接口方面,国内有阿里的通义千问大模型、智谱 AI(ChatGLM)、科大讯飞(SparkDesk)等,均有限制一定免费额度的 Token。国外有谷歌的 Gemini 大模型、海外版 Coze 的 GPT4 模型,免费且能图片识别,但需要给服务器挂梯子,具体操作可参考相关教程。
2025-01-04
中国的国产ai排行榜
以下是关于中国国产 AI 排行榜的相关信息: 根据《2024 年度 AI 十大趋势报告》,在 APP 端,截至 2024 年 10 月,共 56 款产品的历史下载量超百万,8 款产品历史下载量超千万,夸克和豆包的历史总下载量已过亿。从单月新增来看,夸克、豆包和 Kimi 智能助手月增长可达到千万级,10 款产品可达百万级;DAU 方面,夸克 DAU 超过 2600 万,豆包、Kimi、天天跳绳和文小言 DAU 超百万;用户粘性方面,夸克和叨叨三日留存率超过 30%。 在 Web 端,AI 智能助手赛道外的所有赛道都基本处于停滞状态,用户规模方面,月总访问量超千万的共 7 款产品,包括夸克、腾讯文档、百度文库、Kimi 智能助手、文心一言、豆包和通义。在用户活跃度上,共 3 款产品——夸克、Notion 和百度文库的 MAU 超过千万,19 款产品 MAU 超过百万。仅有 14 款产品人均每月访问超过 5 次,13 款产品平均访问时长超过 10 分钟。 9 月的 AI 智库月度榜单中,部分产品如美趣 AI、说得相机提词器、AI 智能写作、创客贴 AI、360AI 搜索、图趣 AI、Molica AI、文案宝等在列,同时还有开拍、妙笔工坊、TalkAI 练口语、美图设计室、秘塔 AI 搜索、X Eva、快问 AI、我在 AI 等产品。
2024-12-29
text to speech国产工具
以下是为您推荐的一些国产 Text to Speech(TTS)工具: 1. Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,能高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 2. Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,可作为多种平台的应用使用,用于收听网页、文档、PDF 和有声读物。 3. Azure AI Speech Studio:https://speech.microsoft.com/portal ,提供了支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供了自定义的语音模型。 4. Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型,易于使用,适合为视频制作画外音或帮助视障人士。 此外,还有开源的 StyleTTS 2:一个开源的媲美 Elevenlabs 的文本转语音工具,结合文本角色内容+场景音可快速生成有声小说。其特点包括多样化的语音风格、更自然的语音、高效生成、精确的语音控制、接近真人的语音合成以及适应不同说话者。工作原理是利用风格扩散和与大型语音语言模型(SLM)的对抗性训练来实现接近人类水平的 TTS 合成。 如果您是新手入门学习和体验 AI,还可以使用 Kimi 智能助手,它是 Chatgpt 的国产平替,不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做的最好的 Ai 产品,能一次搜索几十个数据来源,无广告,能定向指定搜索源。PC 端:https://kimi.moonshot.cn/?utm_campaign=TR_LgLmkEor&utm_content=&utm_medium=%E7%BD%91%E7%AB%99&utm_source=CH_tpOYmtV1&utm_term= ;移动端 Android/ios:https://kimi.volctrack.com/a/E3w3Q1xa 。 另外,飞书也是一款不错的工具,它汇集了各类 AI 优质知识库、AI 工具使用实践,助力人人成为效率高手。您可以通过获取。 内容由 AI 大模型生成,请仔细甄别。
2024-12-18
免费国产 思维导图ai
以下是一些免费的国产思维导图 AI 工具: 1. GitMind:免费的跨平台思维导图软件,支持多种模式,可通过 AI 自动生成思维导图。 2. ProcessOn:国内思维导图+AIGC 的工具,能利用 AI 生成思维导图。 3. AmyMind:轻量级在线工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的助手,可一键拓展思路、生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求即可由 AI 自动生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能。 以下是国内免费的大模型 APP: 1. Kimi 智能助手:由 Moonshot AI 出品,具有超大“内存”,能读小说、上网等。 2. 文心一言:百度出品的 AI 对话产品,定位为智能伙伴。 3. 通义千问:由阿里云开发,能交互、回答问题及协作创作。 以下是 10 月国内流量榜中的相关产品: |排名|产品|特性|分类|网址|访问量(万)|环比变化|所属公司| ||||||||| |A31+1|扣子|原生|智能体|coze.cn|155|0.0028|字节跳动| |A33+1|幕布|原生|思维导图|mubu.com|126|0.1975|字节跳动|
2024-11-30
你是啥模型
我调用的是抖音集团的云雀大模型。 LoRA 和 LyCORIS 属于微调模型,常用于控制画风、生成的角色、角色姿势等。它们的后缀均为.safetensors,体积较主模型小,一般在 4M 300M 之间,使用 LoRA 模型较多,LyCORIS 可调节范围更大,现在 Stable Diffusion 已内置。在 WebUI 中使用时,可在 LoRA 菜单中点击使用,也可直接使用 Prompt 调用。管理模型可进入 WebUI 目录下的 models/LoRA 目录。 ComfyUI instantID 目前只支持 sdxl。主要的模型(ip_adapter.bin)下载后放在 ComfyUI/models/instantid 文件夹(没有则新建),地址为:https://huggingface.co/InstantX/InstantID/resolve/main/ipadapter.bin?download=true 。InsightFace 模型是 antelopev2(不是经典的 buffalo_l),下载解压后放在 ComfyUI/models/insightface/models/antelopev2 目录中,地址为:https://huggingface.co/MonsterMMORPG/tools/tree/main 。还需要一个 ControlNet 模型,放在 ComfyUI/models/controlnet 目录下,地址为:https://huggingface.co/InstantX/InstantID/resolve/main/ControlNetModel/diffusion_pytorch_model.safetensors?download=true 。网络环境不好的,可在网盘 https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy 下载。
2025-01-09
给我提供一下国内AI大模型链接
以下是为您提供的国内AI大模型链接: 阿里: 智谱AI: 科大讯飞: 百度: 抖音: 中科院: 百川智能: 商汤: MiniMax: 上海人工智能实验室:
2025-01-09
大模型有哪些
大模型主要分为以下几类: 1. 大型语言模型:专注于处理和生成文本信息,例如通过分析大量的文本数据来理解和生成自然语言。常见的有 GPT3 等。 2. 大型多模态模型:能够处理包括文本、图片、音频等多种类型的信息,可应用于图像识别与描述、视频分析、语音识别与生成等更广泛的领域。 大模型的“大”通常指用于表达 token 之间关系的参数多,主要是指模型中的权重(weight)与偏置(bias)。 以 Transform 为代表的大模型采用自注意力(Selfattention)机制来学习不同 token 之间的依赖关系,生成高质量 embedding。常见的 embedding 算法有基于统计的 Word2Vec、GloVe,基于深度网络的 CNN、RNN/LSTM,基于神经网络的 BERT、Doc2Vec 等。 8 月正式上线的国内大模型有: 北京:百度(文心一言)https://wenxin.baidu.com 、抖音(云雀大模型)https://www.doubao.com 、智谱 AI(GLM 大模型)https://chatglm.cn 、中科院(紫东太初大模型)https://xihe.mindspore.cn 、百川智能(百川大模型)https://www.baichuanai.com/ 上海:商汤(日日新大模型)https://www.sensetime.com/ 、MiniMax(ABAB 大模型)https://api.minimax.chat 、上海人工智能实验室(书生通用大模型)https://internai.org.cn 这些大模型在功能上各有特点,例如在聊天状态下,能生成 Markdown 格式的有智谱清言、商量 Sensechat、MiniMax;目前不能进行自然语言交流的有昇思、书生;受使用限制的有 MiniMax;具有特色功能的如昇思能生图,MiniMax 能语音合成。阿里通义千问、360 智脑、讯飞星火等不在首批获批名单中,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品也将陆续开放。
2025-01-09
数据解读类的AI大模型
以下是关于数据解读类的 AI 大模型的相关知识: 大模型的整体架构可以分为以下几层: 1. 基础层:为大模型提供硬件支撑和数据支持,例如 A100、数据服务器等。 2. 数据层:这里的数据层不是用于基层模型训练的数据基集,而是企业根据自身特性维护的垂域数据,分为静态的知识库和动态的三方数据集。 3. 模型层:包括 LLm(大语言模型,例如 GPT,一般使用 transformer 算法来实现)或多模态模型(如市面上的文生图、图生图等的模型,训练所用的数据与 llm 不同,用的是图文或声音等多模态的数据集)。 4. 平台层:模型与应用间的平台部分,比如大模型的评测体系,或者 langchain 平台等,提供模型与应用间的组成部分。 5. 表现层:也就是应用层,是用户实际看到的地方。 相关技术名词及概念: 1. 生成式 AI 生成的内容叫做 AIGC。 2. AI 即人工智能。 3. 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习:有标签的训练数据,算法的目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务包括聚类。 强化学习:从反馈里学习,最大化奖励或最小化损失,类似训小狗。 4. 深度学习是一种参照人脑有神经网络和神经元(因有很多层所以叫深度)的方法,神经网络可以用于监督学习、无监督学习、强化学习。 5. 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 6. LLM 是大语言模型,对于生成式 AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN),Transformer 比 RNN 更适合处理文本的长距离依赖性。
2025-01-09
知识库中有关于Agent的金融应用
智能体(Agent)在各种应用中扮演重要角色,以下是一些典型的应用领域: 1. 自动驾驶:自动驾驶汽车中的智能体感知周围环境,做出驾驶决策。 2. 家居自动化:智能家居设备(如智能恒温器、智能照明)根据环境和用户行为自动调节。 3. 游戏 AI:游戏中的对手角色(NPC)和智能行为系统。 4. 金融交易:金融市场中的智能交易算法,根据市场数据做出交易决策。 5. 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 6. 机器人:各类机器人(如工业机器人、服务机器人)中集成的智能控制系统。 智能体可以根据其复杂性和功能分为几种类型: 1. 简单反应型智能体(Reactive Agents):根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。示例:温控器,它根据温度传感器的输入直接打开或关闭加热器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。示例:自动驾驶汽车,它不仅感知当前环境,还维护和更新周围环境的模型。 3. 目标导向型智能体(Goalbased Agents):除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。示例:机器人导航系统,它有明确的目的地,并计划路线以避免障碍。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。示例:金融交易智能体,根据不同市场条件选择最优的交易策略。 5. 学习型智能体(Learning Agents):能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。示例:强化学习智能体,通过与环境互动不断学习最优策略。 从历史角度来看,随着大航海时代及全球贸易的兴起,“Agent”的角色在商业领域变得日益重要。16 至 17 世纪间,贸易代理和公司代理商开始在全球范围内进行商品交易,如荷兰东印度公司的代理人。18 至 19 世纪工业革命期间,“Agent”的职能进一步拓展到保险、房地产等新兴行业。此外,在 19 世纪,政府及情报领域也开始广泛使用“Agent”,比如情报特工和便衣警察,在维护国家安全与社会秩序方面发挥了不可或缺的作用。 在 20 世纪至 21 世纪的现代社会中,“Agent”一词涵盖了多种职业角色,尤其在娱乐和体育行业中,它指的是艺人经纪人和运动员经理等职位。这些专业经理人负责安排试镜、进行合同谈判以及规划职业生涯,确保客户能在竞争激烈的行业中获得成功。此外,“Agent”还包括劳务代理和招聘代理(猎头)。劳务代理提供劳动力匹配服务,帮助求职者找到合适的工作,并为雇主提供所需的人才,如劳务派遣公司将临时员工派遣到需要额外支持的企业单位。而猎头则专门为公司招募高技能或高级管理职位的专业人士,通过筛选简历、安排面试并评估候选人来帮助企业找到最合适的员工。凭借深厚的行业知识与广泛的联系网络,这些猎头为企业与顶尖人才之间搭建了重要桥梁。 从词源和词的历史变迁中,大家就能看到,“Agent”这个词本身就具有行动的含义,到了后期又附加了“替身”的意思。且无论哪个领域,“Agent”都多数情况下都在指:“拥有行动的替身,都是替代他人做某事“。 设计和实现一个智能体通常涉及以下几个步骤: 1. 定义目标:明确智能体需要实现的目标或任务。 2. 感知系统:设计传感器系统,采集环境数据。 3. 决策机制:定义智能体的决策算法,根据感知数据和目标做出决策。 4. 行动系统:设计执行器或输出设备,执行智能体的决策。 5. 学习与优化:如果是学习型智能体,设计学习算法,使智能体能够从经验中改进。 智能体在现代计算机科学和人工智能领域是一个基础且重要的概念。它们通过自主感知和行动,在广泛的应用领域中发挥重要作用。从简单的反应型系统到复杂的学习型系统,智能体技术的不断发展和应用正在改变我们的生活方式和工作模式。
2025-01-09
有图片文字翻译输出图片的应用吗?
目前市面上有一些能够实现图片文字翻译并输出图片的应用。例如,百度翻译、腾讯翻译君等,它们在一定程度上具备这样的功能。但具体的效果可能会因图片的清晰度、文字的复杂程度等因素而有所不同。
2025-01-09
coze工作流中数据库如何应用?主要是返回数据
在 Coze 工作流中,数据库的应用如下: 工作流由多个节点构成,节点是基本单元。Coze 平台支持的节点类型包括数据库节点。 数据库节点的输入:用户可以定义多个输入参数。 数据库节点的输出:如果数据库是查询作用,则输出会包含查询出来的内容。通过 SQL 语句告诉数据库要执行的动作,这里的 SQL 语句可以让 AI 自动生成并进行适当改动。 注意事项:Coze 平台的逻辑是数据库与 bot 绑定,使用数据库功能时,需要在 bot 中设置相同名称和数据结构的数据库进行绑定。 测试工作流:编辑完成的工作流无法直接提交,需要进行测试。点击右上角的“test run”,设定测试参数,查看测试结果,完成后发布。 相关参考文档和示例: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本示例: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent 在【拔刀刘】自动总结公众号内容,定时推送到微信的案例中,循环体内部的数据库节点用来在数据库中查询是否已经推送过该篇文章,输入项为上一步中的 url 和开始节点的 key(重命名为 suid)。查询数据库需要文章 url 和用户的 suid 两个值来判断这名用户的这篇文章是否推送过。记得设置输出项“combined_output”。同时,Coze 平台中使用数据库功能需要在 bot 中设置相同名称和数据结构的数据库进行绑定,具体设置方法参见“相关资源”。
2025-01-08
ai教育怎么应用
AI 在教育领域有以下应用: 1. 个性化学习平台:通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。例如 Knewton 平台,通过对数百万学生行为模式分析,精准预测学习难点并提前给出解决方案,大幅提升学习效率。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生作文和开放性答案题。如 Pearson 的 Intelligent Essay Assessor,能够分析和理解写作内容,给出准确评分和反馈,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:使课堂教学更丰富和互动。如 AI 教师能引导学生通过对话学习,解答疑问并提供即时反馈。Google 的 AI 教育工具 AutoML 用于创建定制学习内容,提高学习动机,加深知识掌握。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室,安全进行实验操作并立即得到 AI 系统反馈。例如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生尝试复杂实验流程,无需昂贵设备或专业环境。 同时,使用人工智能辅助教育也存在一些挑战,如教育体系内部的惯性、教师技能更新、课程内容调整、评估和认证机制改革等。此外,使用人工智能获取信息和学习时,要注意可能产生的幻觉,对关键数据应根据其他来源仔细检查。
2025-01-07
部署Agent专属的web端应用
以下是关于部署 Agent 专属的 web 端应用的相关内容: 在 Linux 上部署较为简单,前提是您有一张 4G 以上显存的 GPU 显卡。步骤如下: 1. 下载代码仓库。 2. 安装依赖(注意有两个依赖未放在 requirements.txt 里)。 3. 启动 webui 的 demo 程序,然后用浏览器登陆服务器的 ip:8080 就能试玩。此 demo 提供了 3 个参数: server_name:服务器的 ip 地址,默认 0.0.0.0。 servic_port:即将开启的端口号。 local_path:模型存储的本地路径。 4. 第一次启动生成语音时,需查看控制台输出,会下载一些模型文件,可能因网络问题失败,但首次加载成功后后续会顺利。 5. 基于此基础可拓展,比如集成到 agent 的工具中,结合 chatgpt 做更拟人化的实时沟通。 6. webui 上可设置的几个参数说明: text:指需要转换成语音的文字内容。 Refine text:选择是否自动对输入的文本进行优化处理。 Audio Seed:语音种子,是一个用于选择声音类型的数字参数,默认值为 2,是很知性的女孩子的声音。 Text Seed:文本种子,是一个正整数参数,用于 refine 文本的停顿,实测文本的停顿设置会影响音色、音调。 额外提示词(可写在 input Text 里):用于添加笑声、停顿等效果,例如。 以下是一些 Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体(Agent)平台,支持开发者根据需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,提供环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 以上信息仅供参考,您可根据自身需求选择适合的平台。
2025-01-07
将Agent应用钉钉平台
将 Agent 应用于钉钉平台的步骤如下: 1. 首先,您可以参考 Dify 接入微信的相关教程。在 Dify 平台创建基础编排聊天助手应用,获取 API 密钥和 API 服务器地址。 2. 下载 Dify on WeChat 项目并安装依赖。 3. 在项目根目录创建 config.json 文件,填写 API 密钥和服务器地址。 4. 把基础编排聊天助手接入微信,可选择源码部署或 Docker 部署,进行快速启动测试,扫码登录,进行对话测试。 5. 把工作流编排聊天助手接入微信,创建知识库,导入知识库文件,创建工作流编排聊天助手应用,设置知识检索节点和 LLM 节点,发布更新并访问 API。 6. 把 Agent 应用接入微信,创建 Agent 应用,设置对话模型和添加工具,生成 API 密钥,填写配置文件,启动程序并进行测试。 以下是一些 Agent 构建平台供您参考: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建各类问答 Bot,集成丰富插件工具。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景表现出色。 如果您想零基础模板化搭建 AI 微信聊天机器人,添加各种自定义 COW 插件到微信机器人,部署 COW 插件的步骤如下: 1. 直接点击 Apilot 平台以下位置来复制保存好 Apilot 的 API 令牌。 2. 在宝塔服务器创建一个 config.json 文件,将相关内容复制到文件中,注意更新 sum4all 和 Apilot 的两个 API 令牌。 3. 重新删掉之前正在跑的机器人服务,重新使用新的编排模板来跑微信机器人。 4. 运行过程中如需修改 config.json 文件里的配置,可在文件位置进行内容修改,修改保存后,在容器板块中对应在跑的机器人服务点击重启即可。 更多详细内容请访问相关原文:https://docs.dify.ai/v/zhhans/learnmore/usecases/difyonwechat
2025-01-07