「AGIへの道」飛書ナレッジベースへ直行 →

大语言模型与医疗应用

回答

大语言模型在医疗领域有以下应用和相关项目:

  • XrayGLM:首个会看胸部 X 光片的中文多模态医学大模型。
    • 地址:https://github.com/WangRongsheng/XrayGLM
    • 简介:促进中文领域医学多模态大模型的研究发展,在医学影像诊断和多轮交互对话上有潜力。
  • MeChat:中文心理健康支持对话大模型。
    • 地址:https://github.com/qiuhuachuan/smile
    • 简介:由 ChatGLM-6B LoRA 16-bit 指令微调得到,通过扩展真实的心理互助 QA 为多轮对话,提高在心理健康支持领域的表现。
  • MedicalGPT
    • 地址:https://github.com/shibing624/MedicalGPT
    • 简介:训练医疗大模型,实现包括二次预训练、有监督微调、奖励建模、强化学习训练,并发布中文医疗 LoRA 模型。

在商业化应用方面:

  • 彭博发布了金融领域的大模型 BloombergGPT,医联发布了医疗大语言模型 MedGPT,在其所在的垂直领域发挥实际诊疗价值。
  • OpenAI 对 GPT 模型进行了更新,降低了价格,且正在开发新的技术以降低训练模型的成本。
  • 商汤科技联合创始人杨帆认为大模型能加速商业化落地,缩短产业应用周期。
  • 360 公司创始人周鸿祎表示大模型是工业革命级的生产力工具,能赋能百行千业。

在基础通识方面:

  • 国内大模型有通用模型如文心一言、讯飞星火等,也有垂直模型专注特定领域如小语种交流、临床医学、AI 蛋白质结构预测等。
  • 以特定例子体验了不同大模型的回答和续写能力,大模型基于统计模型预测生成内容。
  • 大语言模型工作原理包括训练数据、算力、模型参数,在训练数据一致情况下,模型参数越大能力越强。
  • Transformer 是大语言模型训练架构,具备自我注意力机制能理解上下文和文本关联,通过单词预测生成内容。
  • 大模型可能因错误数据导致给出错误答案,优质数据集很重要。
  • Prompt 分为 system prompt、user prompt 和 assistant prompt,写好 prompt 有清晰说明等法则。
  • Fine tuning 是基于通用大模型针对特定领域任务提供数据进行学习和调整。
AIモデルによって生成されたコンテンツであり、慎重に確認してください(提供元: aily)

参照

LLM开源中文大语言模型及数据集集合

XrayGLM,首个会看胸部X光片的中文多模态医学大模型:地址:[https://github.com/WangRongsheng/XrayGLM](https://github.com/WangRongsheng/XrayGLM)简介:该项目为促进中文领域医学多模态大模型的研究发展,发布了XrayGLM数据集及模型,其在医学影像诊断和多轮交互对话上显示出了非凡的潜力。MeChat,中文心理健康支持对话大模型:地址:[https://github.com/qiuhuachuan/smile](https://github.com/qiuhuachuan/smile)简介:该项目开源的中文心理健康支持通用模型由ChatGLM-6B LoRA 16-bit指令微调得到。数据集通过调用gpt-3.5-turbo API扩展真实的心理互助QA为多轮的心理健康支持多轮对话,提高了通用语言大模型在心理健康支持领域的表现,更加符合在长程多轮对话的应用场景。MedicalGPT地址:[https://github.com/shibing624/MedicalGPT](https://github.com/shibing624/MedicalGPT)简介:训练医疗大模型,实现包括二次预训练、有监督微调、奖励建模、强化学习训练。发布中文医疗LoRA模型shibing624/ziya-llama-13b-medical-lora,基于Ziya-LLaMA-13B-v1模型,SFT微调了一版医疗模型,医疗问答效果有提升,发布微调后的LoRA权重。

七大行业的商业化应用

比如,彭博此前发布了金融领域的大模型BloombergGPT,应用于其所在的垂直领域;医联则发布发布内首款医疗大语言模型MedGPT,可在真实医疗场景中发挥实际诊疗价值。无论是医疗、金融、电商等领域,都需要垂直性大模型产品。多位AI行业人士向钛媒体App指出,从产业角度来看,通用模型就是“百科全书”,能够有问必答,能够适用不同的产业土壤,而垂直模型类似于单领域的专家,虽然专业,但受众注定是少数人。但垂直大模型的发展对各个领域的模型性能持续提升。今年6月16日,OpenAI进行了更新,GPT模型的价格降低了75%,GPT-3.5-turbo的输入token价格降低了25%最新价格,每1k token,0.0001美金。奥特曼还曾提到,OpenAI正在开发新的技术,将可以使用更少的数据、更低廉的价格来训练模型。“当模型足够大之后,它可以把问题泛化成一个通用问题自然输出,可能未来常见的99%以上的物体或事件用一个模型自己就可以去做了。带来的好处就是,很可能就会非常快的加速商业化落地,带来更好的技术能力。比起原来方式,可能会更快地缩短产业应用的周期。”商汤科技联合创始人、大装置事业群总裁杨帆对钛媒体App表示。360公司创始人、董事长周鸿祎近日表示,ChatGPT的出现,代表着超级AI时代的来临。大模型属于通用人工智能,在很多维度上已经超越了人类。同时,大模型是工业革命级的生产力工具,将会带来一场新工业革命,能赋能百行千业,就能在实体经济转型数字化、智能化过程中发挥重要作用。“我认为中国发展大模型没有不可逾越的技术障碍,要感谢OpenAI的成功给我们指明了技术方向,点明了技术路线,中国科技公司在产品化、场景化、商业化上有很大的优势,我对我们能打造这个大模型深信不疑。”周鸿祎表示,未来中国不会只有一个大模型。

02-基础通识课

[heading2]总结大语言模型的介绍与原理国内大模型的分类:国内大模型有通用模型如文心一言、讯飞星火等,处理自然语言;还有垂直模型,专注特定领域如小语种交流、临床医学、AI蛋白质结构预测等。大模型的体验:以‘为什么我爸妈结婚的时候没有邀请我参加婚礼’和‘今天我坐在凳子上’为例,体验了Kimi、通义千问、豆包等大模型的回答和续写能力,发现回复有差异,且大模型基于统计模型预测生成内容。大语言模型的工作原理:大语言模型工作原理包括训练数据、算力、模型参数,在训练数据一致情况下,模型参数越大能力越强,参数用b链形容大小。Transformer架构:Transformer是大语言模型训练架构,17年出现用于翻译,具备自我注意力机制能理解上下文和文本关联,其工作原理是单词预测,通过嵌入、位置编码、自注意力机制生成内容,模型调教中有控制输出的temperature。关于大语言模型的原理、应用及相关概念Transformer模型原理:通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率,是一个偏向概率预测的统计模型。大模型幻觉:大模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。Prompt的分类和法则:分为system prompt、user prompt和assistant prompt,写好prompt的法则包括清晰说明、指定角色、使用分隔符、提供样本等,核心是与模型好好沟通。Fine tuning微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。RAG概念:未对RAG的具体内容进行详细阐述,仅提出了这个概念。

他の質問
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
在本地环境下要搭建一个医疗数据分析的BI智能体,应该怎么做
抱歉,您提供的内容中没有关于在本地环境下搭建医疗数据分析的 BI 智能体的相关有效信息。一般来说,要在本地环境搭建这样的智能体,您可以考虑以下步骤: 1. 明确需求和目标:确定您希望通过智能体实现的具体医疗数据分析功能和目标。 2. 选择合适的技术和工具:例如,选择适合数据分析的编程语言(如 Python)、数据库管理系统(如 MySQL、SQL Server 等)、数据分析库(如 Pandas、NumPy 等)。 3. 数据收集和预处理:获取相关的医疗数据,并进行数据清洗、转换和归一化等预处理操作,以确保数据的质量和可用性。 4. 模型选择和训练:根据需求选择合适的机器学习或深度学习模型,如分类模型、回归模型等,并使用预处理后的数据进行训练。 5. 智能体的开发和集成:使用所选的技术和工具,开发智能体的逻辑和功能,并将其与数据处理和模型预测部分进行集成。 6. 测试和优化:对搭建好的智能体进行测试,根据测试结果对其进行优化和改进。 7. 部署和维护:将智能体部署到本地环境中,并定期进行维护和更新,以适应新的数据和需求变化。
2025-03-11
AI怎么应用于医疗门诊问题
AI 在医疗门诊中有以下应用: 1. 医学影像分析:用于分析 X 射线、CT 扫描和 MRI 等医学图像,辅助诊断疾病。 2. 药物研发:加速药物研发进程,比如识别潜在的药物候选物和设计新的治疗方法。 3. 个性化医疗:通过分析患者数据,为每位患者提供个性化的治疗方案。 4. 机器人辅助手术:控制手术机器人,提升手术的精度和安全性。 需要注意的是,湖南省医保局明确禁止使用人工智能生成医疗处方。
2025-03-07
AI医疗
AI 在医疗领域有广泛的应用,包括以下方面: 1. 医学影像分析:AI 可用于分析 X 射线、CT 扫描和 MRI 等医学图像,辅助诊断疾病。 2. 药物研发:加速药物研发过程,如识别潜在药物候选物和设计新治疗方法。 3. 个性化医疗:分析患者数据,为每个患者提供个性化治疗方案。 4. 机器人辅助手术:控制手术机器人,提高手术精度和安全性。 在医疗健康生物制药的研究方面,AI 也发挥着重要作用,取得了以下最新进展: 1. AI 提前三年诊断胰腺癌。 2. 两名高中生与医疗技术公司合作,发现与胶质母细胞瘤相关的新靶基因。 3. AI 帮助抗衰老,筛查出高效的药物候选物。 4. 使用 AI 寻找阿尔兹海默症的治疗方法。 5. AI 帮助早期诊断帕金森。 在蛋白质结构预测和蛋白质合成方面,过去两周有大量突破: 1. AlphaFold 是一种表现出色的 AI 系统,为科学家和药物开发提供巨大帮助。 2. Meta 的蛋白质结构预测 AI 模型 ESMFold 已进行 7 亿次预测。 3. 多伦多大学研究人员开发新的 AI 系统,创造出自然界中不存在的蛋白质。 4. 华盛顿大学的 David Baker 教授团队开发基于 DALLE 的人工智能系统 RF Diffusion,用于生成合适的蛋白质结构。 5. 洛桑联邦理工学院的科学家们开发基于神经网络的新工具 PeSTo,可预测蛋白质相互作用。 6. 萨里大学开发人工智能系统,用于识别个体细胞中的蛋白质模式。 7. 肯特大学的研究团队使用名为 talin 的蛋白质制成凝胶,目标是将其制成防弹材料。 相关文献参考: 1. https://www.sciencedaily.com/releases/2023/05/230504121014.htm 2. https://www.wevolver.com/article/pestoanewaitoolforpredictingproteininteractions 3. https://www.sciencedirect.com/science/article/pii/S0958166923000514
2025-03-05
临床医疗deepseek使用手册
以下是关于 DeepSeek 在临床医疗方面的使用手册: 使用案例: 借助 AI 分析好的文章: 找出最喜欢的文章,投喂给 deepseek R1(适合大多数有推理模型的 AI)。 第一次询问:请从写作角度分析这篇文章。 第二次询问:请再从读者角度分析这篇文章。 第三次询问:这篇文章还存在什么缺点和不足,有什么改善和提升的空间。 对作者进行侧写,分析成长背景、个人经历和知识结构对文章的影响。 让 AI 对自己写的文章点评:“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。” 根据文章内容对作者心理侧写:“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射。” 提升 DeepSeek 能力的方法: 用 Coze 做效果对比测试。 使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白之后,正式开始对话。 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不太稳定)。 特别鸣谢: 李继刚:【思考的七把武器】在前期为我提供了很多思考方向。 Thinking Claude:这个项目是我现在最喜欢使用的 Claude 提示词,也是我设计 HiDeepSeek 的灵感来源。 Claude 3.5 Sonnet:最得力的助手。
2025-02-13
目前最好的用于医疗的AI
目前在医疗领域,有以下一些出色的 AI 应用: 1. 蛋白质结构预测和合成方面: AlphaFold 是由 DeepMind 开发的 AI 系统,在蛋白质结构预测方面准确度超过其他系统,为科学家和药物开发提供巨大帮助。 Meta 的蛋白质结构预测 AI 模型 ESMFold 截至目前已经进行了 7 亿次预测。 多伦多大学研究人员开发了利用类似 Stable Diffusion、Midjourney 的生成扩散技术创造出自然界中不存在的蛋白质的新 AI 系统。 华盛顿大学的 David Baker 教授的团队开发了基于 DALLE 的人工智能系统 RF Diffusion,用于根据科学家的需求生成合适的蛋白质结构。 洛桑联邦理工学院的科学家们开发了基于神经网络的新工具 PeSTo,可以预测蛋白质如何与其他物质相互作用,速度快且通用性强。 在 Surrey 大学开发了一种人工智能系统,用于识别个体细胞中的蛋白质模式,这一进展可用于理解肿瘤的差异并开发药物。 肯特大学的研究团队使用名为 talin 的蛋白质制成凝胶,该凝胶具有吸收冲击的能力,目标是将其制成防弹材料。 2. 疾病诊断与预测、药物研发以及个性化医疗方面: 麻省理工学院利用 AI 发现了新型广谱抗生素 Halicin,它能有效杀灭对现有抗生素产生耐药性的细菌,且不会使细菌产生新的耐药性。研究者通过训练集让 AI 学习分子特点,总结规律,从大量分子中识别出符合要求的分子,之后实验证明其有效性,很快将用于临床。 为了在医疗保健中产生真正的改变,AI 应像人类一样学习,投资创建模型生态系统,例如“专家”AI,通过学校教育和经验获得有助于在复杂情况下确定最佳答案的直觉。不应仅仅依靠大量数据和生成模型解决所有问题,而应通过堆叠模型进行训练,如先训练生物学、化学模型,再添加特定于医疗保健或药物设计的数据点。
2025-02-10
在医疗场景,现在有哪些应用
在医疗场景中,AI 有以下应用: 1. 医学影像分析:可用于分析 X 射线、CT 扫描和 MRI 等医学图像,辅助诊断疾病。 2. 药物研发:能够加速药物研发过程,比如识别潜在的药物候选物和设计新的治疗方法。 3. 个性化医疗:通过分析患者数据,为每个患者提供个性化的治疗方案。 4. 机器人辅助手术:用于控制手术机器人,提高手术的精度和安全性。 5. 疾病的诊断与预测:例如利用大模型进行疾病的早期诊断和病情发展预测。 6. 新药物发现:如麻省理工学院利用 AI 发现新型广谱抗生素 Halicin。 7. 中医应用:将人工智能与中医结合,辅助看诊,提高诊疗效率,未来有望实现 24 小时独立问诊开药。 8. 医学问答:像 DoctorGPT 这样的模型,能够准确回答各种医学问题。
2025-01-20
用what,why,how,will,next,作为五个力量,用熵增熵减作为二进制,组成的底层语言用其中的next作为自主学习探索动力的自进化AI,潜力怎么样?
用 what、why、how、will、next 作为五个力量,以熵增熵减作为二进制,组成底层语言,并以其中的 next 作为自主学习探索动力的自进化 AI 具有一定的潜力,但也面临一些挑战。 从潜力方面来看,这种设计可能有助于 AI 系统更有针对性地进行自主学习和探索。例如,what 可以帮助明确要学习和理解的对象或概念;why 有助于挖掘背后的原因和逻辑,促进更深入的理解;how 能够指导实现目标的方法和步骤;will 可以对未来的发展进行预测和规划。而将 next 作为自主学习探索的动力,有可能推动 AI 不断开拓新的知识领域。 然而,也存在一些挑战。首先,熵增熵减作为二进制的基础,其在实际应用中的有效性和稳定性需要进一步验证和优化。其次,如何准确地定义和运用这五个力量,以及它们之间的协同关系,需要精细的设计和调试。再者,将这种复杂的底层语言转化为实际的算法和模型实现,具有较高的技术难度。 总之,这种自进化 AI 的概念具有创新性和潜力,但需要在理论和实践上进行深入的研究和探索,以充分发挥其优势并克服可能的问题。
2025-04-12
扣子如何改变回复的语言风格
要改变回复的语言风格,可以参考以下方法: 1. 对于风格类的 Bot,提示词中的 Fewshot 对输出风格影响较大,可先找预期相关人的风格示例并修改。 2. 在 Examples 里使用特定开头的词,如“Fword”,开头字符会显著影响输出内容。 3. 加星号的部分代表加粗,根据自注意力机制可提升提示词中的关键词效果。 4. 能力方面可使用自带的 Bing 搜索和图片识别,根据需求选择,如避免 Webpilot 以免语气变温和。 5. 可根据需求决定是否加入绘画功能。 6. 防护词可参考,但没有完美的防御提示词。 7. 回复风格可来自自己的群聊机器人的风格嫁接。 8. 最后加入一些小 Tips 进一步提升个性化效果。 在场景方面,可以问 Bot 对内容的看法,或让其帮忙分析事情以获得更接地气的表述。 另外,编写提示时: 简单任务场景: 设定人物,描述 Bot 所扮演的角色或职责、回复风格。 描述功能和工作流程,约定 Bot 在不同场景下的回答方式,强调调用工具以保证回复准确性,也可为 Bot 提供回复格式示例。 指示 Bot 在指定范围内回答。 复杂任务场景:推荐使用结构化格式编写提示,扣子支持将 Bot 的提示自动优化成结构化内容,可直接使用或修改。
2025-04-09
你都融合了哪些大语言模型?
以下是一些融合的大语言模型: 1. LuotuoChineseLLM: 地址: 简介:囊括一系列中文大语言模型开源项目,包含基于已有开源模型(ChatGLM、MOSS、LLaMA)进行二次微调的语言模型、指令微调数据集等。 2. Linly: 地址: 简介:提供中文对话模型 LinlyChatFlow、中文基础模型 LinlyChineseLLaMA 及其训练数据。中文基础模型以 LLaMA 为底座,利用中文和中英平行增量预训练。项目汇总了目前公开的多语言指令数据,对中文模型进行了大规模指令跟随训练,实现了 LinlyChatFlow 对话模型。 3. ChatYuan: 地址: 简介:元语智能发布的一系列支持中英双语的功能型对话语言大模型,在微调数据、人类反馈强化学习、思维链等方面进行了优化。 4. ChatRWKV: 地址: 简介:开源了一系列基于 RWKV 架构的 Chat 模型(包括英文和中文),发布了包括 Raven,NovelChnEng,NovelCh 与 NovelChnEngChnPro 等模型,可以直接闲聊及进行诗歌、小说等创作,包括 7B 和 14B 等规模的模型。 此外,还有以下相关信息: 1. 本地部署资讯问答机器人: Ollama 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,可用于不同应用场景。 Ollama 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 cpu 和 gpu。 Ollama 提供模型库,用户可从中下载不同模型,有不同参数和大小以满足需求和硬件条件,可通过 https://ollama.com/library 查找。 用户可通过简单步骤自定义模型,如修改温度参数调整创造性和连贯性,或设置特定系统消息。 Ollama 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 Ollama 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 2. AIGC 落地应用大全中的案例: Poe(强烈推荐): 推荐指数:????? 由 Quora 开发,有 APP 版本,支持跨端使用。 集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。 不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。 Dragonfly 擅长给出较短回答,并擅长在输入中给出示例时遵循指示。 Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用,有时能够给出超越直接使用 Chat GPT 时的体验(但和 Chat GPT 一样,Claude 也时常会给出一些错误回复,一些问题可在两个模型中都问一遍提升信息准确性)。 此外支持分享用户和模型的对话内容。但 GPT4、Claude+产品需要付费订阅使用。 访问地址: Poe 中的提问引导真的能够启发到用户。 支持 Explore Chatbot,但丰富度不如后续要介绍的 Character。 midjourney prompt 扩写 Chatbot 能力很惊人。
2025-04-08
你好,你是基于哪个大语言模型的人工智能?
我并非基于某个特定的大语言模型。AI 领域中的语言模型众多,例如 GPT3 等。大语言模型通常是使用深度学习和神经网络创建的,基于人类训练数据来理解单词、代码语法等。像生成式 AI 可以生成文本、图片、音频、视频等内容形式,其中包括大语言模型。2017 年 6 月,谷歌团队发表的论文《Attention is All You Need》首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖于循环神经网络或卷积神经网络。
2025-04-08
大语言模型能力排行榜
以下是一些大语言模型能力排行榜的相关信息: Open LLM Leaderboard: 地址: 简介:由HuggingFace组织的一个LLM评测榜单,目前已评估了较多主流的开源LLM模型。评估主要包括AI2 Reasoning Challenge、HellaSwag、MMLU、TruthfulQA四个数据集上的表现,主要以英文为主。 chinesellmbenchmark: 地址: 简介:中文大模型能力评测榜单,覆盖百度文心一言、chatgpt、阿里通义千问、讯飞星火、belle/chatglm6b等开源大模型,多维度能力评测。不仅提供能力评分排行榜,也提供所有模型的原始输出结果。 聊天机器人竞技场:由伯克利的一个团队管理,根据ELO评级对不同的语言模型进行排名,计算ELO的方式与国际象棋中的计算方式非常相似。 智源评测:豆包模型在其中表现出色,荣获大语言模型第一,视觉理解第二、文生图第二、文生视频第二,在匿名投票竞技场中排名第二,仅次于OpenAI。 地址:
2025-03-31
自然语言转换为sql
以下是关于自然语言转换为 SQL 的相关信息: DuckDBNSQL7B 模型能够将自然语言转换成 SQL 代码,使非专业用户能轻松与数据库交互,它基于大量真实和合成的 DuckDB SQL 查询训练。相关链接:https://github.com/NumbersStationAI/DuckDBNSQL 、https://x.com/xiaohuggg/status/1751081213459415164?s=20 Claude 官方提示词中有将日常语言变成 SQL 查询语句的相关内容。 以下是一些推荐的 text2sql 相关的 AI 工具及其链接: Text2SQL:将英文转换为 SQL 查询。链接:https://toolske.com/text2sql/?ref=theresanaiforthat ai2sql:高效且无错误的 SQL 构建器。链接:https://www.ai2sql.io/ EverSQL:从 SQL 查询翻译英文文本。链接:https://www.eversql.com/sqltotext/ SupaSQL:从 NLP 生成 SQL 查询。链接:https://supasql.com/ SQLgenius:使用自然语言的 SQL 查询生成器。链接:https://sqlgenius.app/ SQL Chat:与数据库进行自然语言聊天的 SQL 客户端。链接:https://www.sqlchat.ai/ SQL Ease:从自然语言输入生成 SQL 查询。链接:https://sqlease.buildnship.in/ Talktotables:翻译和查询数据库。链接:https://talktotables.com/ 此外,还有几个知名的 text2sql 项目,如 SQLNet(使用深度学习方法解决 text2sql 任务的项目)、Seq2SQL(将自然语言转换为 SQL 查询的序列到序列模型)、Spider(一个大规模的 text2sql 数据集及其相关的挑战)
2025-03-31
多模态应用
以下是一些多模态应用的案例: 1. 电商领域: 拍立淘:由淘宝推出,用户拍照即可识别商品并直接进入购物页面,简化购物搜索步骤。 探一下:支付宝推出的图像搜索引擎,拍照后 AI 能识别并搜索相关商品或信息。 2. 创意领域: 诗歌相机:拍照能生成一首诗,还能打印,将诗意与现代技术结合,并做成硬件形式。 3. 技术平台: 阿里云百炼大模型平台为企业侧提供各种原子级别能力,包括多模态能力。 4. 其他应用场景: 融图:如把图二中的机器人合成到图一的环境中,保持比例、细节、光影和氛围感统一。 小红书风格卡片:使用特定风格生成关于特定内容的卡片。 Logo 转 3D 效果:将图标改成 3D 立体、毛玻璃、毛绒等效果。 示意图转卡通漫画:把示意图转成幼儿园小朋友能看懂的漫画并配中文说明。 遥感理解(图像数据):识别图中的建筑物并用色块标注。 包装图直出效果:生成图片对应的包装侧面效果图。 参考生成海报图:参考小红书封面生成 PPT 设计相关封面图。 三维建模模拟:将图片转化为 3D max 建模渲染界面并加入 UI 界面。 手办三视图:保留人物样貌、神态,制作成特定要求的 3D 手办三视图。
2025-04-18
金融业相关AI应用场景或AI技术介绍
在金融业中,AI 有以下应用场景和技术: 1. 风控和反欺诈:用于识别和阻止欺诈行为,降低金融机构的风险。 2. 信用评估:评估借款人的信用风险,帮助金融机构做出更好的贷款决策。 3. 投资分析:分析市场数据,辅助投资者做出更明智的投资决策。 4. 客户服务:提供 24/7 的客户服务,回答客户常见问题。 例如,Hebbia 获得近 1 亿美元 B 轮融资,其 AI 技术能够一次处理多达数百万份文档,在短时间内浏览数十亿份包括 PDF、PowerPoint、电子表格和转录内容等,并返回具体答案,主要面向金融服务公司,如对冲基金和投资银行,同时也适用于律师事务所等其他专业领域。
2025-04-15
结构化思维在AI办公里的应用
结构化思维在 AI 办公中有以下应用: 在 Model Context Protocol 托管平台中: 特色功能方面,Sequential Thinking 提供动态和反思性问题解决的结构化思维过程,适用于复杂问题分析和决策。 核心功能分类包括笔记管理工具(如 Simple Notes MCP Server、Bear MCP Server、Notion 集成)、AI 对话工具(如 Autonomous Coder Agent、OpenAI 兼容 API 集成)、Google Workspace 集成(如 Gmail 和 Google Calendar 集成、多账户管理、邮件搜索和撰写、日历事件管理)、学术研究工具(如 Semantic Scholar 集成、PubMed 搜索、arXiv 论文访问、IACR 密码学文献库访问)、AI 数据库管理(如 MySQL Server 集成、知识图谱记忆服务、DuckDB 集成、Airtable 集成)。 面对 AI 幻觉问题时,可使用结构化思考工具辅助判断,如决策矩阵用于面对多个选择时做出更理性的决策,检查清单用于执行复杂任务时确保每个步骤按计划完成,风险评估模型用于做重要决策时分析不同方案的风险并制定应对措施。 在让 AI 像人类一样思考方面,构建逻辑体感轮子,包括逻辑推理功能和内容抽象功能。内容抽象功能能够高效地组织内容,体现结构化思维,通过心智单元的抽象思维高效地组织复杂任务。
2025-04-14
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出10个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是为您生成的 10 个业务价值高、具备可行性的 AI 应用场景介绍: 1. 人才招聘与筛选 What:利用 AI 技术对求职者的简历进行自动筛选和分析,评估其与岗位的匹配度。 Why:节省 HR 大量的时间和精力,提高招聘效率和准确性。 How:通过自然语言处理和机器学习算法,训练模型识别关键信息和技能。 2. 员工培训与发展 What:根据员工的技能水平和职业发展目标,定制个性化的培训计划。 Why:提升员工的能力和绩效,增强员工对企业的忠诚度。 How:利用大数据分析员工的工作表现和学习需求,推荐相关课程和学习资源。 3. 薪酬福利管理 What:运用 AI 预测市场薪酬趋势,为企业制定合理的薪酬策略。 Why:保持企业薪酬的竞争力,吸引和留住优秀人才。 How:收集和分析行业薪酬数据,结合企业的财务状况和战略目标进行优化。 4. 员工绩效评估 What:借助 AI 实时监测员工的工作表现,提供客观的绩效评估。 Why:减少人为偏差,确保评估的公正性和准确性。 How:利用工作流程数据和行为分析模型进行评估。 5. 员工关系管理 What:通过 AI 分析员工的情绪和满意度,及时发现问题并解决。 Why:营造良好的工作氛围,提高员工的工作积极性和创造力。 How:使用情感分析技术处理员工的反馈和交流信息。 6. 组织架构优化 What:利用 AI 分析企业的业务流程和人员配置,提供组织架构调整建议。 Why:提高企业的运营效率和灵活性,适应市场变化。 How:基于数据分析和模拟优化算法进行评估和推荐。 7. 人力资源规划 What:根据企业的战略目标和业务发展预测人力资源需求。 Why:提前做好人才储备和招聘计划,保障企业的正常运营。 How:运用数据分析和预测模型进行规划。 8. 企业文化传播 What:使用 AI 生成个性化的企业文化宣传内容,提高传播效果。 Why:增强员工对企业文化的认同感和归属感。 How:利用自然语言生成技术和个性化推荐算法。 9. 智能客服 What:在 HR 服务中引入 AI 客服,解答员工常见问题。 Why:快速响应员工需求,提高服务质量。 How:训练智能客服模型,涵盖常见的 HR 问题和解决方案。 10. 人才库管理 What:利用 AI 对人才库进行分类和更新,提高人才库的利用效率。 Why:方便快速找到合适的人才,降低招聘成本。 How:运用数据挖掘和分类算法进行管理。
2025-04-14
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出3-5个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是为您提供的 3 个业务价值高、具备可行性的 AI 应用场景介绍: 场景一:AI 在企业招聘中的应用 What:利用 AI 技术进行简历筛选、人才匹配和面试评估。 Why:能够快速处理大量简历,提高招聘效率和准确性,节省人力和时间成本,同时更精准地找到符合岗位需求的人才。 How:通过引入相关的 AI 招聘软件,与企业现有的招聘系统集成,对简历进行关键词提取和分析,利用机器学习算法进行人才匹配,并通过视频面试中的语音和表情分析辅助评估候选人。 场景二:AI 助力个性化人力资源管理 What:根据员工的个人特点和工作表现,提供个性化的培训计划、职业发展建议和绩效评估。 Why:能够充分发挥员工的潜力,提高员工满意度和忠诚度,促进企业的长期发展。 How:收集员工的工作数据、学习记录和绩效表现等信息,运用 AI 算法进行分析和预测,为员工制定专属的发展方案,并通过移动应用或内部系统向员工推送相关建议和培训课程。 场景三:AI 打造无人值守的 HR 平台 What:实现 HR 业务的自动化处理,如员工请假审批、薪酬计算和福利发放等。 Why:减少人工操作的错误和繁琐流程,提高 HR 工作的效率和准确性,使 HR 人员能够专注于更有价值的战略工作。 How:整合企业内部的各种 HR 系统和数据,利用 RPA 和 AI 技术实现流程的自动化,同时建立监控和预警机制,确保平台的稳定运行。
2025-04-14
飞书+AI的应用案例
以下是飞书+AI的应用案例: 在企业运营方面,包括日常办公文档材料撰写整理、营销对话机器人、市场分析、销售策略咨询,以及法律文书起草、案例分析、法律条文梳理和人力资源简历筛选、预招聘、员工培训等。 在教育领域,协助评估学生学习情况,为职业规划提供建议,针对学生情况以及兴趣定制化学习内容,论文初稿搭建及论文审核,帮助低收入国家/家庭通过 GPT 获得平等的教育资源。 在游戏/媒体行业,有定制化游戏、动态生成 NPC 互动、自定义剧情、开放式结局,出海文案内容生成、语言翻译及辅助广告投放和运营,数字虚拟人直播,游戏平台代码重构,AI 自动生成副本。 在零售/电商领域,包括舆情、投诉、突发事件监测及分析,品牌营销内容撰写及投放,自动化库存管理,自动生成或完成 SKU 类别选择、数量和价格分配,以及客户购物趋势分析及洞察。 在金融/保险行业,有个人金融理财顾问、贷款信息摘要及初始批复、识别并检测欺诈活动风险、客服中心分析及内容洞。 线下活动方面: 活动宣传:用飞书文档制作活动宣传页面,用 AI 快速制作海报,用 GPTs 写人员分配和主持人台词,活动从策划到开始仅用 2 天时间。 活动报名:使用飞书的多维表格完成报名表及数据统计。 活动过程:大家在线协同,一起编辑文档,演示时共同展示一个文档。 活动记录:有相关的记录页面。 办活动的初衷是宣扬 AI 不只是降本增效的工具,还有很多乐趣等待挖掘,例如大理户外圆桌讨论、清迈的 AI 逛古城、杭州的 AI 玄学小组。
2025-04-13