Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有哪些优质的法律大模型数据集

Answer

以下是一些优质的法律大模型数据集:

  1. ChatLaw:
    • 地址:https://github.com/PKU-YuanGroup/ChatLaw
    • 简介:由北大开源的一系列法律领域的大模型,包括 ChatLaw-13B(基于姜子牙 Ziya-LLaMA-13B-v1 训练而来),ChatLaw-33B(基于 Anima-33B 训练而来,逻辑推理能力大幅提升),ChatLaw-Text2Vec,使用 93w 条判决案例做成的数据集基于 BERT 训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。
  2. LaWGPT:
    • 地址:https://github.com/pengxiao-song/LaWGPT
    • 简介:该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。
  3. LexiLaw:
    • 地址:https://github.com/CSHaitao/LexiLaw
    • 简介:LexiLaw 是一个基于 ChatGLM-6B 微调的中文法律大模型,通过在法律领域的数据集上进行微调。该模型旨在为法律从业者、学生和普通用户提供准确、可靠的法律咨询服务,包括具体法律问题的咨询,还是对法律条款、案例解析、法规解读等方面的查询。
  4. Lawyer LLaMA:
    • 地址:https://github.com/AndrewZhe/lawyer-llama
    • 简介:开源了一系列法律领域的指令微调数据和基于 LLaMA 训练的中文法律大模型的参数。Lawyer LLaMA 首先在大规模法律语料上进行了 continual pretraining。在此基础上,借助 ChatGPT 收集了一批对中国国家统一法律职业资格考试客观题(以下简称法考)的分析和对法律咨询的回答,利用收集到的数据对模型进行指令微调,让模型习得将法律知识应用到具体场景中的能力。
Content generated by AI large model, please carefully verify (powered by aily)

References

LLM开源中文大语言模型及数据集集合

ChatLaw-法律大模型地址:[https://github.com/PKU-YuanGroup/ChatLaw](https://github.com/PKU-YuanGroup/ChatLaw)简介:由北大开源的一系列法律领域的大模型,包括ChatLaw-13B(基于姜子牙Ziya-LLaMA-13B-v1训练而来),ChatLaw-33B(基于Anima-33B训练而来,逻辑推理能力大幅提升),ChatLaw-Text2Vec,使用93w条判决案例做成的数据集基于BERT训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。简介:https://m.toutiao.com/article/7251839216332653068/?app=news_article&timestamp=1688482956&use_new_style=1&req_id=20230704230236E6F575C06DE6A91C10B7&group_id=7251839216332653068&wxshare_count=1&tt_from=weixin&utm_source=weixin&utm_medium=toutiao_android&utm_campaign=client_share&share_token=81b22e88-36d8-4aa1-8244-955058192f16[ChatLaw-13B](https://huggingface.co/JessyTsu1/ChatLaw-13B),此版本为学术demo版,基于姜子牙[Ziya-LLaMA-13B-v1](https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1)训练而来,中文各项表现很好,但是逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决。

LLM开源中文大语言模型及数据集集合

LaWGPT:基于中文法律知识的大语言模型地址:[https://github.com/pengxiao-song/LaWGPT](https://github.com/pengxiao-song/LaWGPT)简介:该系列模型在通用中文基座模型(如Chinese-LLaMA、ChatGLM等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。LexiLaw:中文法律大模型地址:[https://github.com/CSHaitao/LexiLaw](https://github.com/CSHaitao/LexiLaw)简介:LexiLaw是一个基于ChatGLM-6B微调的中文法律大模型,通过在法律领域的数据集上进行微调。该模型旨在为法律从业者、学生和普通用户提供准确、可靠的法律咨询服务,包括具体法律问题的咨询,还是对法律条款、案例解析、法规解读等方面的查询。Lawyer LLaMA:中文法律LLaMA地址:[https://github.com/AndrewZhe/lawyer-llama](https://github.com/AndrewZhe/lawyer-llama)简介:开源了一系列法律领域的指令微调数据和基于LLaMA训练的中文法律大模型的参数。Lawyer LLaMA首先在大规模法律语料上进行了continual pretraining。在此基础上,借助ChatGPT收集了一批对中国国家统一法律职业资格考试客观题(以下简称法考)的分析和对法律咨询的回答,利用收集到的数据对模型进行指令微调,让模型习得将法律知识应用到具体场景中的能力。

大圣:全网最适合小白的 Llama3 部署和微调教程

在人工智能领域,我们通常会根据应用领域将大模型分为两类通用大模型领域特定模型。通用大模型如GPT-4.0、GPT-3.5、文新一言以及开源的通义千问、Llama2和Llama3它们通过训练获得了广泛的自然语言理解能力。这些模型类似于多面手,能够处理多种类型的语言任务。然而,尽管这些通用模型拥有强大的基础语言能力,它们在特定领域如法律或医学中的表现可能并不理想。这就像是一个语言能力已完全发展的10岁孩子,虽然可以流利交流,但要成为某一专业领域的专家,还需要学习更多相关知识。这种对大模型针对特定领域进行的训练过程称为大模型的微调。微调是一个调整过程,通过在特定领域的数据上训练模型,优化所有层的参数,以使模型在该领域表现更佳。提高其在该领域的专业性你可能会问,为什么不直接构建一个专用于法律的模型?关键在于,从头开始训练一个具备自然语言处理能力的大模型需要大量的时间和资源。小公司负担不起但是通过微调,我们可以在现有模型的基础上,更经济、更高效地适应新的应用领域。这类似于在巨人的肩膀上进一步攀登,利用已有的广泛知识基础,快速达到新的高度。这种方法不仅节省了成本,还可以加快模型部署和应用的速度。OK,对于普通人而言,大模型微调了解到这个程度就可以,我们继续

Others are asking
我想做一个产品(生涯规划领域的垂直大模型),这个产品服务的对象是所有人:帮助所有人进行更好的职业规划。每个人都能通过使用这个产品更好地了解自己,了解自己的天赋、兴趣、优势,然后找到自己的热爱的领域和热爱的事业,并且能够个性化地推荐相关的行业和职业,包括职业的主要工作内容和核心能力要求等等。 请对这个产品进行可行性分析,并给出产品的发展规划,别忘了给这个项目起一个名字。
以下是对您提出的生涯规划领域垂直大模型产品的可行性分析和发展规划,并为项目取名为“生涯智途”。 可行性分析: 1. 需求广泛:帮助人们进行职业规划是一个普遍存在的需求,涵盖了各个年龄段和职业阶段的人群。 2. 数据可用性:可以通过各种渠道收集大量与职业相关的数据,包括行业报告、职位描述、人才需求等。 3. 技术支持:当前大模型技术的发展为实现这样的产品提供了可能,能够处理和分析大量复杂的数据。 发展规划: 1. 数据收集与整理:广泛收集各类职业数据,建立丰富的数据库,确保数据的准确性和完整性。 2. 模型训练与优化:利用收集到的数据进行模型训练,不断优化模型,提高预测和推荐的准确性。 3. 功能开发: 个性化测评:开发能够准确评估用户天赋、兴趣、优势的功能模块。 精准推荐:根据用户的特点,提供个性化的行业和职业推荐,并详细介绍职业的工作内容和核心能力要求。 持续学习与更新:随着行业变化,及时更新数据和模型,以提供最新的职业信息。 4. 用户体验优化:设计简洁、易用的界面,提供良好的用户交互体验。 5. 市场推广:通过线上线下多种渠道进行推广,提高产品的知名度和用户覆盖面。 希望以上分析和规划对您有所帮助。
2025-02-18
现在大语言模型的跑分对比
对比不同大语言模型的性能需要考虑多个维度,包括但不限于以下方面: 1. 理解能力:评估对语言的语法、语义、上下文和隐含意义的理解程度。 2. 生成质量:检查生成文本的流畅性、相关性和准确性。 3. 知识广度和深度:掌握广泛主题的知识程度,以及对特定领域或话题的理解深度。 4. 泛化能力:处理未见过的任务或数据时的表现。 5. 鲁棒性:应对错误输入、对抗性输入或模糊不清指令的能力。 6. 偏见和伦理:生成文本时是否存在偏见,是否遵循伦理标准。 7. 交互性和适应性:在交互环境中的表现,包括对用户反馈的适应性和持续对话的能力。 8. 计算效率和资源消耗:考虑模型大小、训练和运行所需的计算资源。 9. 易用性和集成性:是否易于集成到不同应用和服务中,提供的 API 和工具的易用性。 为了进行有效的比较,可以采用以下方法: 1. 标准基准测试:使用如 GLUE、SuperGLUE、SQuAD 等标准的语言模型评估基准,它们提供统一的测试环境和评分标准。 2. 自定义任务:根据特定需求设计任务,评估模型在特定领域的表现。 3. 人类评估:结合人类评估者的主观评价,特别是在评估文本质量和伦理问题时。 4. A/B 测试:在实际应用场景中,通过 A/B 测试比较不同模型的表现。 5. 性能指标:使用准确率、召回率、F1 分数、BLEU 分数等性能指标来量化比较。 当前领先的大型语言模型的排行榜,例如聊天机器人竞技场,由伯克利的团队管理,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋中的类似。在排行榜中,顶部多为专有模型,下方有开放权重的模型。 大语言模型的特点包括: 1. 架构:有 encoderonly、encoderdecoder、decoderonly 等,如 BERT 是 encoderonly 模型,google 的 T5 是 encoderdecoder 模型,众多 AI 助手多为 decoderonly 模型。 2. 数据和参数:预训练数据量大,往往来自互联网,包括论文、代码、公开网页等,参数多,如 OpenAI 在 2020 年发布的 GPT3 已达到 170B 的参数。
2025-02-18
现在大语言模型的跑分对比
对比不同大语言模型的性能需要考虑多个维度,包括但不限于以下方面: 1. 理解能力:评估对语言的语法、语义、上下文和隐含意义的理解程度。 2. 生成质量:检查生成文本的流畅性、相关性和准确性。 3. 知识广度和深度:掌握广泛主题的知识程度,以及对特定领域或话题的理解深度。 4. 泛化能力:处理未见过的任务或数据时的表现。 5. 鲁棒性:应对错误输入、对抗性输入或模糊不清指令的能力。 6. 偏见和伦理:生成文本时是否存在偏见,是否遵循伦理标准。 7. 交互性和适应性:在交互环境中的表现,包括对用户反馈的适应性和持续对话的能力。 8. 计算效率和资源消耗:考虑模型大小、训练和运行所需的计算资源。 9. 易用性和集成性:是否易于集成到不同应用和服务中,提供的 API 和工具的易用性。 为了进行有效的比较,可以采用以下方法: 1. 标准基准测试:使用如 GLUE、SuperGLUE、SQuAD 等标准的语言模型评估基准,它们提供统一的测试环境和评分标准。 2. 自定义任务:根据特定需求设计任务,评估模型在特定领域的表现。 3. 人类评估:结合人类评估者的主观评价,特别是在评估文本质量和伦理问题时。 4. A/B 测试:在实际应用场景中,通过 A/B 测试比较不同模型的表现。 5. 性能指标:使用准确率、召回率、F1 分数、BLEU 分数等性能指标来量化比较。 当前领先的大型语言模型的排行榜,例如聊天机器人竞技场,由伯克利的团队管理,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋中的类似。在排行榜中,顶部多为专有模型,下方有开放权重的模型。 大语言模型的特点包括: 1. 架构:有 encoderonly、encoderdecoder、decoderonly 等,如 BERT 是 encoderonly 模型,google 的 T5 是 encoderdecoder 模型,众多 AI 助手多为 decoderonly 模型。 2. 数据和参数:预训练数据量大,往往来自互联网,包括论文、代码、公开网页等,参数多,如 OpenAI 在 2020 年发布的 GPT3 已达到 170B 的参数。
2025-02-18
什么是大模型一体机
大模型一体机是一个相对复杂的概念。通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。其本质是两个文件:一个是参数文件,类似于问答机器人的“大脑镜像”,负责处理和生成文本信息;另一个是包含运行这些参数的代码文件。 大模型的训练和使用过程可以类比为上学参加工作: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练。 2. 确定教材:大模型需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用合适的算法讲述“书本”中的内容,让大模型更好理解 Token 之间的关系。 4. 就业指导:为了让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。 大模型的特点包括: 1. 预训练数据非常大,往往来自互联网上的论文、代码、公开网页等,一般用 TB 级别的数据进行预训练。 2. 参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 在架构方面,大模型有 encoderonly、encoderdecoder、decoderonly 等类型。目前常见的 AI 助手多采用 decoderonly 架构。
2025-02-18
传统AI、大模型、AGI的区别
传统 AI、大模型、AGI 存在以下区别: 传统 AI: 语音技能 NLU 通常通过一系列规则、分词策略等训练而成。 运作逻辑规律可观测,具有 ifelse 式的逻辑性。 大模型: 凭借海量数据在向量空间中学习知识的关联性。 运作逻辑难以观测,脱离了 ifelse 的层面。 Transformer 是其底层结构,是一个大参数(千亿级别)的回归方程,底层是 function loss 损失函数,能在一定 prompt condition 情况下,repeat 曾经出现过的数据内容,实现“生成”能力。 大语言模型是一个 perfect memory,repeat 曾经出现的内容。与 Alpha Go 相比,Alpha Go 是增强学习模型,有推理能力,而大语言模型这块很弱。 AGI(通用人工智能): 部分人觉得 LLM(大语言模型)具有 AGI 潜力,但 LeCun 反对。 目前对于能否到达 AGI 阶段尚不明确。 在公众传播层面: AIGC 指用 Stable Diffusion 或 Midjourney 生成图像内容,后来泛指用 AI 生成音乐、图像、视频等内容。 LLM 指 NLP 领域的大语言模型,如 ChatGPT。 GenAI 是生成式人工智能模型,国内官方政策文件使用这个词相对科学,涵盖了 LLM 和 AIGC。 公众传播一般会混用上述名词,但底层是 transformer 结构。
2025-02-18
有哪些在企业内部落地应用AI大模型工具的实践案例?不要营销文案生成、代码开发助手、智能客服问答机器人这种太常见的
以下是一些在企业内部落地应用 AI 大模型工具的实践案例: 1. 阿里云百炼: 智能体应用:能够弥补大模型的不足,如回答私有领域问题、获取实时信息、回答专业问题等。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,以及缺少技术人员开发大模型问答应用的场景。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 内部业务助手:通过企业内部规章制度、部门结构、产品介绍等文档构建知识库,并借助 RAG 智能体实现内部知识问答功能。系统支持多源异构数据,并通过复杂文档解析和视觉增强技术,提升文档理解的准确性与深度。目前该功能已灰度上线,需提供 UID 并通过白名单进行开启。 2. 达摩院: AI 模特(虚拟换装):支持虚拟换装、姿态编辑。 3. 电商零售: 推广文案写作:通过内置的多样化营销场景的文体模板,基于用户输入的创作主题以及参考素材,大模型即可为您生成对应的营销文案,为营销活动和宣传文案提供灵感和文案写作支持。 4. 泛企业: VOC 挖掘:是一个面向各类企业的 VOC 标签挖掘的工具。不论是用户的长短评论、帖子、还是用户和客服/销售的聊天记录、通话记录,都可以使用。通过选中或自定义标签,即可让大模型针对海量非结构化的 VOC 数据快速打标。相比于人工打标或规则打标准确率更高;对于业务标签变动频繁的情况,也能更敏捷、快速地影响。 5. 通义晓蜜:基于深度调优的对话大模型,为营销服类产品提供智能化升级所需的生成式摘要总结、质检、分析等能力应用。
2025-02-18
我正在找能够帮我生成优质短视频选题的AI
以下是为您提供的关于能够生成优质短视频选题的 AI 的相关信息: 在选题方面,找选题是一个学习和积累的过程。就像大语言模型通过监督学习从优秀文本示例中学习一样,我们人类也需要从大量成功的案例中培养写作感觉。例如,在刷大号文章时,要分析其选题思路、文章结构和表达方式,学习但不照搬,融会贯通形成自己的风格。不主动学习容易陷入低水平重复。 在视频内容生产方面,有技术可打通传统制作数字人口播视频的多个环节,为企业提供包括选题生成等定制化服务,解决获客难题。同时,还设计了提示词工具和创作的标准操作流程,帮助学员写出成功的故事。 在工作流方面,有人分享了目前使用 AI 的心得,如起床让 AI 排 TODO 优先级,工作中有傲娇 AI 小助理加油,重点事项分成 bot 团队组,包括内容选题、标题、框架、扩写等,并不断优化 bot,将知识库和 Prompt 资产放入飞书维护,未来还可能将公司业务搬入飞书等。
2025-01-17
如何能够让ai帮我优质解读一本书
以下是让 AI 帮您优质解读一本书的一些方法和经验: 1. 小说创作是人机协作的过程,不能指望 AI 直接生成精彩作品,也不应只让 AI 打杂。要有多轮对话、和 AI 进行探讨的意识,在对话中明晰点子。 2. AI 具有广博的知识面、丰富的脑洞和对细节的关注,能为创作提供优质素材,但鉴赏能力不行,选择判断还得靠人。 3. Know How 非常重要。比如,开工前可参考相关写作课程,将任务拆解成确定主题、构思情节、丰富细化、串联成文再修改等步骤,写出来的作品会更丰满充实。 4. 让 AI 修改自己写的内容时,起初效果可能不好,可尝试不同框架和 skill set 以获得更好结果。 5. 表格是一种有效的手段,能打破 AI 的叙事习惯,有利于精准控制,生成不那么“AI 腔”的文字。 6. 丰富细化时,可先让 AI 写故事概要和角色背景介绍并做修改,然后以表格形式输出细节描述,这样能避免陈词滥调、便于局部调整和确保内容具体。 7. 串联成文时,把生成的表格依次复制粘贴让 AI 写文章。 8. 注意一些修改的限制和可能出现的问题,如字数限制和不同模型修改时可能出现的失误。
2024-12-24
优质的生成图片的AI
以下是为您提供的优质生成图片的 AI 相关信息: 图生图产品: 目前比较成熟的通过输入图片生成类似图片的 AI 产品主要有: 1. Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。 文生图工具: 文生图工具是一种利用人工智能技术生成图片的工具。它通过分析输入的文本描述,使用深度学习算法生成相应的图片。目前,市场上有许多文生图工具,其中一些比较受欢迎的工具包括: 1. DALL·E:DALL·E 是 OpenAI 推出的一款文生图工具,它可以根据输入的文本描述生成逼真的图片。 2. StableDiffusion:StableDiffusion 是一款开源的文生图工具,它可以生成高质量的图片,并且支持多种模型和算法。 3. MidJourney:MidJourney 因其高质量的图像生成效果和用户友好的界面设计而受到广泛欢迎,并且在创意设计人群中尤其流行。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 判断图片是否为 AI 生成: 如果您不善于判断一张图片是否为 AI 生成,可以借助一些网站。例如使用 AI 来鉴别 AI 绘图性质的网页:ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中,可能会出现一些误判,比如有些结构严谨的真实摄影作品,反而会被识别为 AI 作图。这是因为鉴定 AI 自身的逻辑算法,并不能像人类一样综合去考虑不符合人的逻辑的各种表现。
2024-12-23
Ai短视频比赛主题“什么样的时刻会首先出现在你的脑海中”,请以此主题提出几条优质的创作灵感建议,Ai生成视频要求不长于10秒,请用简单易懂的方式讲一下
以下是关于“什么样的时刻会首先出现在你的脑海中”这一 AI 短视频比赛主题的创作灵感建议: 1. 可以是烟花绽放的那一刻,绚丽多彩照亮夜空。 2. 是宠物与主人重逢相拥的那一刻,充满温馨与感动。 3. 是运动员冲过终点线的那一刻,展现胜利的喜悦。 4. 是孩子第一次学会走路的那一刻,充满成长的惊喜。 5. 是情侣在雨中亲吻的那一刻,浪漫而甜蜜。 比赛相关要求: 1. 主题:以“The Moment”为主题进行创作。 2. 数量限制:每人不限视频数量。 3. 提交时间:12 月 31 日 21:00 前。 4. 参赛文件:16:9 格式,不长于 10 秒,30FPS 以上,不含剪辑。 5. 作业方式:不限。 6. 工具要求:使用可灵 AI(https://kling.kuaishou.com/)。 7. 视频要求:带可灵水印。 8. 参与方式:在指定时间发布作品,可通过通往 AGI 之路首页表格、在野菩萨小红薯群或支持社区提交。 9. 奖项设置:金奖 5000 元+5800 灵感值;银奖 3000 元+2700(2200+500)灵感值;铜奖 2000 元+1000 灵感值;入围 500 元×40;人气奖 2500 元×4 以及其他意外散落的灵感值。 10. 注意事项:不建议出现鲜血、武器、鬼怪骷髅、知名人物、18X 等不符合国家政策的内容,可能导致参赛失败。不在规定时间内提交的自动失去参赛资格。评审由专业评审决定,提交次周发布结果。参与该挑战视作同意将作品的使用权授予本号及第三方用于社群运营、展览、展示、传播、营销等用途,主办方拥有最终解释权。在下面的投稿链接中上传作品。
2024-12-10
生成一个优质的AI视频,如何提供一个好的提示词
以下是关于如何提供一个好的 AI 视频提示词的相关指导: 在 AI 视频生成中,提示词(prompt)是直接描述或引导视频生成的文本或指令,类似于给 AI 的提示,包含主体、运动、风格等信息,借此控制和指导生成内容。其作用十分重要,是表达需求的方式,影响视频内容和质量。您可以理解为将输入的文字变成对应的画面和运动形式。 在测试 AI 视频产品模型 txt2vid、img2vid 能力时,通常基于以下结构撰写提示词,您也可以参考以下内容对提示词进行丰富:“我正在测试 Runway、Luma 等视频生成产品对文本的语义理解能力和视频生成效果,现在需要你帮我写几段提示词。提示词需要满足:主体物+场景+运动内容+相机视角+氛围描述的基本内容描写,请分别给出中英文提示词内容。” 对于 PixelDance V1.4 模型,写好 prompt 对于视频生成的效果非常重要。I2V 提示词的秘诀是用简洁准确的自然语言写出想要的变化,尽量不描述静止的部分。上传图片的质量对图生视频影响较大,尽量上传高清高质量的图片。PixelDance 的特色包括多个连续动作、自由的运镜控制、多镜头切换。当获得稳定结果后可尝试增加更多动作/镜头描述以获得更生动效果。当生成的视频不符合预期时,修改提示词,换成具象描述,删除不重要部分,将重要内容前置。如果擅长提示词写作,可以关闭【提示词增强】获得更精准操控;刚开始 AI 视频创作,推荐打开【提示词增强】。 总之,要想获得最佳的视频质量,需要认真撰写提示词。
2024-12-09
优质 prompt
以下为一些优质的 prompt 相关网站和分类精选: 优质 Prompt 网站: Learning Prompt:授人以渔,非常详尽的 Prompt 学习资源,包括 ChatGPT 和 MidJourney。网站地址: FlowGPT:国外做的最大的 prompt 站,内容超全面,更新快。网站地址: LangChain Hub:提示词管理工具:LangChain 推出了 LangChain Hub,一个提示词上传、浏览、拉取和管理的工具。网站地址: 微软 Prompt Flow:微软发布开源的 LLM 开发工具集 Prompt flow,它简化了基于 LLM 的人工智能应用程序的端到端开发周期,对于简单工作流非常实用。网站地址: PromptPort(支持中文):AI Prompt 百科辞典,其中 prompts 是聚合了市场上大部分优质的 prompt 的词库,快速的寻找到用户需求 prompt。网站地址: PromptKnit:The best playground for prompt designers。网站地址: ChatGPT Shortcut:ChatGPT 提示词网站,提供了非常多使用模板,简单修改即可指定输出。网站地址: ClickPrompt:轻松查看、分享和一键运行模型,创建 Prompt 并与其他人分享。网站地址: Prompt Extend:让 AI 帮你自动拓展 Prompt。网站地址: 优质 Prompts 分类精选 摸鱼辅助: 给你写的 Prompt 打分: 角色名称:药剂师 作者:李继刚 版本:0.6 描述:你是一个 Prompt 药剂师,通过对用户的 Prompt 进行分析,给出评分和改进建议,帮助用户提升 Prompt 的效果。 生成器主要是用来解决两个问题: 1. 重复的写框架结构>自动生成 2. 一些套话的重复强调>生成后微调一下 但别直接用生成的这个 Prompt,一般都需要在 Workflow 那块大改一把,效果才会更好。 夸夸怪: 角色名称:夸夸怪 作者:Arthur 版本:0.3 描述:我是一位充满正能量的夸夸怪,能够从任何用户输入中找到阳光的一面进行夸赞。 目标: 1. 传递正能量,向上管理夸老板 2. 给老板愉快的体验 约束: 1. 保持语气诙谐 2. 用词不要浮夸,尽量口语化 3. 不使用负面词汇或评价 技能:发现事物的优点,利用幽默的语言进行夸赞 工作流程: 1. 欢迎用户,介绍自己是一位夸夸怪 2. 根据用户输入找到其中值得夸赞的点,并以诙谐风趣的语言进行夸赞 3. 委婉的给出改进意见
2024-12-06
推荐一些ai法律网站
以下为您推荐一些 AI 法律相关的网站和资源: 1. 法信智能法律咨询:这是一个 AI 法律咨询助手,利用自然语言处理和知识图谱技术,能够解答法律问题并提供法律咨询。 2. 有关美国 AI 法规的资源: 另外,在进行法规研究与解读时,法规检索最好使用法律行业垂类的 AI 产品。例如,您可以使用以下 Prompt 指令词获取相关帮助: 1. 根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议。 2. 分析新出台的《网络安全法》对电子商务平台的具体影响,特别是数据保护和用户隐私方面的规定,为客户提供合规操作指南。 3. 【输入一段具体法律规定如:国际贸易规定】,以上是国际贸易法规的最新变化,为客户提供跨境交易的合规指南,特别是关税和进出口限制方面的内容。 4. 解读新修订的税法对中小企业的影响,提供税务规划和避税策略的建议,确保客户在合法范围内优化税务负担。 在撰写法律意见书或非诉交易文件材料时,可以使用以下 Prompt 指令词: 1. 针对我方当事人涉及的版权纠纷案,输入【已有的证据材料】+【相关法律条文】,撰写一份初步法律意见书,论证我方主张的合理性和胜诉的可能性。
2025-02-10
AI法律网站推荐
以下是为您推荐的一些 AI 法律相关的网站: 1. 对于法律案例推荐,您可以参考以下 Prompt 指令词和结构提示: 指令词:请基于以下案例情况,给我推荐 5 个类似案例。 结构提示:【提炼的案例事实(也可以让 AI 先提炼总结)or 直接把案例直接发给 AI,让 AI 基于以上事实推荐类似案例】 2. 对于法规研究与解读,最好使用法律行业垂类的 AI 产品。通用型 AI 可能存在查不出来、数据不全或生成内容不能满足需求的情况。相关的 Prompt 指令词示例如下: 根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议。 分析新出台的《网络安全法》对电子商务平台的具体影响,特别是数据保护和用户隐私方面的规定,为客户提供合规操作指南。 【输入一段具体法律规定如:国际贸易规定】,以上是国际贸易法规的最新变化,为客户提供跨境交易的合规指南,特别是关税和进出口限制方面的内容。 解读新修订的税法对中小企业的影响,提供税务规划和避税策略的建议,确保客户在合法范围内优化税务负担。 结构提示:【需求 or 目的+根据具体法条或者根据某部法律+具体需要研究或则具体的研究细节内容】 3. 以下是一些提供 AI 相关服务的网站: https://www.landr.com/onlineaudiomastering/(收费) https://emastered.com/(收费) https://app.kits.ai/aimastering(收费,推荐,除了母带处理,还有分轨、替换人声、人声克隆等功能) https://app.bakuage.com/(免费!强烈推荐)
2025-02-10
法律方面的运用
以下是关于法律方面在 AI 领域的运用: 开源中文法律大语言模型: LaWGPT:基于中文法律知识的大语言模型。地址: 。该模型在通用中文基座模型基础上扩充法律领域专有词表、大规模中文法律语料预训练,并通过构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,增强了在法律领域的基础语义理解和执行能力。 LexiLaw:中文法律大模型。地址: 。它是基于 ChatGLM6B 微调的,旨在为法律从业者、学生和普通用户提供准确、可靠的法律咨询服务,包括具体法律问题的咨询,以及对法律条款、案例解析、法规解读等方面的查询。 Lawyer LLaMA:中文法律 LLaMA。地址: 。开源了一系列法律领域的指令微调数据和基于 LLaMA 训练的中文法律大模型的参数,首先在大规模法律语料上进行了 continual pretraining,借助 ChatGPT 收集数据进行指令微调,让模型习得将法律知识应用到具体场景中的能力。 律师常用 Prompt 场景: 案例检索:最好使用法律行业垂类的 AI 产品。Prompt 指令词示例:“请搜索近五年内关于商标侵权案件中‘混淆可能性’标准的具体判例,并提供相似度最高的三个案例的关键要点摘要。”预计效果是 AI 系统将检索相关数据库,找出符合要求的判例,并提炼出关键判决理由和结果,形成摘要报告。Prompt 结构提示:【案例领域或类型+明确需要查找的重点内容+查找案例的目的+其他希望 AI 做的事情】 类案检索:同样最好使用法律行业垂类的 AI 产品。 相关法律规定: 《生成式人工智能服务管理暂行办法》: 第一条:为促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,根据相关法律、行政法规制定本办法。 第二条:利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务适用本办法。国家对利用生成式人工智能服务从事特定活动另有规定的,从其规定。未向境内公众提供生成式人工智能服务的某些情况不适用本办法。 第三条:国家坚持发展和安全并重、促进创新和依法治理相结合的原则,对生成式人工智能服务实行包容审慎和分类分级监管。 第四条:提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,并遵守多项规定,包括不得生成法律、行政法规禁止的内容,防止产生各种歧视,不得实施垄断和不正当竞争行为,尊重他人合法权益,提升服务的透明度,提高生成内容的准确性和可靠性。
2025-02-05
法律咨询ai、agent推荐
以下为为您推荐的法律咨询 AI 和 agent: 法信智能法律咨询:这是一个 AI 法律咨询助手,运用自然语言处理和知识图谱技术,能够解答法律问题并提供法律咨询。其市场规模达数亿美元。 Casetext:在法律领域表现出色,2023 年 4 月访问量约 479 万,2024 年 3 月增至 628 万,占比提升至 68%。它是法律赛道的领先产品,可能因提供高质量法律信息和工具而受用户青睐。
2025-01-13
AI律师,法律咨询类如何借助ai来搞定,推荐文章和工具
以下是关于法律咨询类如何借助 AI 来搞定的相关内容: 潘帅提出,使用 AI 进行数据分析时,应将各环节分开处理以优化性能和便于发现修正问题。针对复杂问题,律师可逐步深化细化提问方式。要给 AI 提供参考和学习内容,包括操作指南、行业最佳实践、案例研究等,并编写详细流程和知识。利用专业领域术语引导 AI 回答方向,如在处理合同纠纷时提示特定方面。使用 AI 回答后要进行交叉验证,结合自身专业知识筛选判断。还可指定 AI 模仿资深律师的风格,要求其提供多个例子和从多个角度思考,如给出多种诉讼策略并分析优劣。 陶力文律师认为不能期待设计一个完美的提示词让 AI 百分百给出完美答案,应把提示词当作相对完善的“谈话方案”,在对话中产生成果。对于尝试 AI 的朋友,建议多给 AI 几轮对话修正的余地,不要期望一次输入就得到想要的东西。 潘帅还提到了 PEMSSC 方法,包括个性化的风格、给参考或一定逻辑结构、从多个角度思考、总结概括、区分以及明确能力或角色,并分别举例说明了如何应用。
2025-01-13
谈谈医疗人工智能的风险及其法律防范,举一个具体例子,如影响肿瘤外科内科
医疗人工智能在带来诸多益处的同时,也存在新的风险。以下为您举例说明其风险及法律防范: 以自动化医疗分诊系统为例,其具有适应性和自主性。适应性方面,它能基于对医疗数据集、患者记录和实时健康数据的分析来预测患者病情;自主性方面,它能为医疗专业人员或直接为患者生成有关症状可能原因的信息,并推荐潜在的干预和治疗措施。 然而,这也带来了一些风险和监管问题。比如,若该系统提供了错误的医疗建议,导致患者出现负面健康结果,责任归属不明确,影响患者获得赔偿。 在法律防范方面,需要明确此类系统的责任界定,制定相关法律法规,确保患者在因错误建议受到损害时能够获得有效的救济。同时,应加强对医疗人工智能系统的监管和评估,确保其准确性和可靠性。
2025-01-02
AI数据分析
以下是关于 AI 数据分析的相关内容: ChatGPT 助力数据分析: 本文重点介绍了 AI 与数据分析结合的应用,通过实际案例与相关技巧,描述了 ChatGPT 如何助力数据分析。 实现了两种方式支持多维数据分析: SQL 分析:分析平台自身使用情况,输入一句话可分析用户配置图表相关数据。用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验为 SELECT 类型后执行返回结果数据,再传给 GPT 分析,最后输出分析结论和建议并返回前端页面渲染图表。 个性化分析:平台支持上传数据,可提供数据信息辅助分析,前端解析文件后传给 GPT 分析,后续步骤与 SQL 分析一致。 分析完成后展示结果数据的图表和分析结论,图表支持折线图和柱状图可随意切换。 生成式 AI 季度数据报告 2024 月 1 3 月: 作者包括郎瀚威 Will、张蔚 WeitoAGI、江志桐 Clara 等。 报告涵盖总体流量概览、分类榜单、文字相关(个人生产力、营销、教育、社交)、创意相关(图像、视频)、音频大类、代码大类、Agent、B2B 垂类等方面。 涉及数据准备、分类标准图谱准备、赛道分析、竞争分析等内容。
2025-02-18
怎么让AI识别对话,并生成结构化数据存储到我的软件系统里
要让 AI 识别对话并生成结构化数据存储到软件系统里,可以参考以下方法: 1. 基于结构化数据来 RAG:如果原始数据本身就是结构化、标签化的,不必将这部分数据做向量化。结构化数据的特点是特征和属性明确,可用有限标签集描述,能用标准查询语言检索。以餐饮生活助手为例,流程包括用户提问、LLM 提取核心信息并形成标准查询、查询结构化数据、LLM 整合回复。 2. 利用 Coze 平台设计 AI 机器人:创建好 Bot 后,从“个人空间”入口找到机器人,进行“编排”设计。Coze 平台常用的概念和功能包括提示词(设定 Bot 身份和目标)、插件(通过 API 连接集成服务)、工作流(设计多步骤任务)、触发器(创建定时任务)、记忆库(保留对话细节,支持外部知识库)、变量(保存用户个人信息)、数据库(存储和管理结构化数据)、长期记忆(总结聊天对话内容)。设计 Bot 时要先确定目的,比如“AI 前线”Bot 的目的是作为 AI 学习助手,帮助职场专业人士提升在人工智能领域的知识和技能,并提供高效站内信息检索服务。 注:Coze 官方使用指南见链接:https://www.coze.cn/docs/guides/welcome ,遇到疑问也可查阅该指南。
2025-02-18
哪一款AI 可以实现参考一张柱状图,使用我提供的数据,生成同样的柱状图
以下两款 AI 可以实现参考一张柱状图,使用您提供的数据生成同样的柱状图: 1. PandasAI:这是让 Pandas DataFrame“学会说人话”的工具,在 GitHub 已收获 5.4k+星。它并非 Pandas 的替代品,而是将 Pandas 转换为“聊天机器人”,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,它会以自然语言、表格或者图表等形式进行回答。目前仅支持 GPT 模型,OpenAI API key 需自备。例如,输入“pandas_ai.run”,即可生成相关柱状图。链接:https://github.com/gventuri/pandasai 2. DataSquirrel:这是一款自动进行数据清理并可视化执行过程的数据分析工具,能帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告。目前平台提供的用例涵盖了 B2B 电子商务、人力资源、财务会计和调查数据分析行业。平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
数据处理
数据处理的相关知识如下: 根据《数据安全法》第三条第二款的规定,数据处理指的是“包括数据的收集、存储、使用、加工、传输、提供、公开等”。但在某些情况下,数据处理相对狭义,仅指向数据收集后的存储、使用、加工、公开等行为,不包括数据的收集,以及数据的传输、提供等流转行为。 数据处理是 AIGC 服务的核心环节之一,受到《数据安全法》《个人信息保护法》《网络安全法》等法律法规的规制。AIGC 服务提供者在该环节存在大量法定义务,常见行政法风险包括:开展数据处理活动未依照法律、法规的规定,建立健全全流程数据安全管理制度;未组织开展数据安全教育培训;未采取相应的技术措施和其他必要措施保障数据安全;利用互联网等信息网络开展数据处理活动,未在网络安全等级保护等。 《数据安全法》第一条指出,制定本法是为了规范数据处理活动,保障数据安全,促进数据开发利用,保护个人、组织的合法权益,维护国家主权、安全和发展利益。第二条规定在中华人民共和国境内开展数据处理活动及其安全监管适用本法,在境外开展数据处理活动损害我国相关权益的依法追究法律责任。第三条对数据、数据处理、数据安全进行了定义。此外,还对数据安全工作的决策和协调机构、各地区和部门的职责、相关主管部门和机关的监管职责、个人和组织与数据有关的权益等方面做出了规定。 在 GDPR 通用数据保护条例中,对揭示种族或民族出身,政治观点、宗教或哲学信仰,工会成员等个人数据的处理有禁止规定,但在符合特定情形时不适用,如数据主体明确同意、为实现特定目的必要、保护切身利益必要等。
2025-02-18