Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

法律 大模型 都有哪些

Answer

以下是一些法律大模型:

  • ChatLaw:由北大开源的一系列法律领域的大模型,包括 ChatLaw-13B(基于姜子牙 Ziya-LLaMA-13B-v1 训练而来)、ChatLaw-33B(基于 Anima-33B 训练而来,逻辑推理能力大幅提升)、ChatLaw-Text2Vec。使用 93 万条判决案例做成的数据集基于 BERT 训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。地址:https://github.com/PKU-YuanGroup/ChatLawChatLaw-13B,此版本为学术 demo 版,基于姜子牙Ziya-LLaMA-13B-v1训练而来,中文各项表现很好,但逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决。
Content generated by AI large model, please carefully verify (powered by aily)

References

LLM开源中文大语言模型及数据集集合

ChatLaw-法律大模型地址:[https://github.com/PKU-YuanGroup/ChatLaw](https://github.com/PKU-YuanGroup/ChatLaw)简介:由北大开源的一系列法律领域的大模型,包括ChatLaw-13B(基于姜子牙Ziya-LLaMA-13B-v1训练而来),ChatLaw-33B(基于Anima-33B训练而来,逻辑推理能力大幅提升),ChatLaw-Text2Vec,使用93w条判决案例做成的数据集基于BERT训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。简介:https://m.toutiao.com/article/7251839216332653068/?app=news_article&timestamp=1688482956&use_new_style=1&req_id=20230704230236E6F575C06DE6A91C10B7&group_id=7251839216332653068&wxshare_count=1&tt_from=weixin&utm_source=weixin&utm_medium=toutiao_android&utm_campaign=client_share&share_token=81b22e88-36d8-4aa1-8244-955058192f16[ChatLaw-13B](https://huggingface.co/JessyTsu1/ChatLaw-13B),此版本为学术demo版,基于姜子牙[Ziya-LLaMA-13B-v1](https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1)训练而来,中文各项表现很好,但是逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决。

大圣:全网最适合小白的 Llama3 部署和微调教程

在人工智能领域,我们通常会根据应用领域将大模型分为两类通用大模型领域特定模型。通用大模型如GPT-4.0、GPT-3.5、文新一言以及开源的通义千问、Llama2和Llama3它们通过训练获得了广泛的自然语言理解能力。这些模型类似于多面手,能够处理多种类型的语言任务。然而,尽管这些通用模型拥有强大的基础语言能力,它们在特定领域如法律或医学中的表现可能并不理想。这就像是一个语言能力已完全发展的10岁孩子,虽然可以流利交流,但要成为某一专业领域的专家,还需要学习更多相关知识。这种对大模型针对特定领域进行的训练过程称为大模型的微调。微调是一个调整过程,通过在特定领域的数据上训练模型,优化所有层的参数,以使模型在该领域表现更佳。提高其在该领域的专业性你可能会问,为什么不直接构建一个专用于法律的模型?关键在于,从头开始训练一个具备自然语言处理能力的大模型需要大量的时间和资源。小公司负担不起但是通过微调,我们可以在现有模型的基础上,更经济、更高效地适应新的应用领域。这类似于在巨人的肩膀上进一步攀登,利用已有的广泛知识基础,快速达到新的高度。这种方法不仅节省了成本,还可以加快模型部署和应用的速度。OK,对于普通人而言,大模型微调了解到这个程度就可以,我们继续

2024AIGC法律风险研究报告(更新版).pdf

文本生成(text generation)涉及使用机器学习(machine learning)模型,根据从现有文本数据中学习的模式生成新的文本。用于文本生成的模型可以是马尔科夫链(Markov Chains)、循环神经网络(RNN)、长短时记忆网络(LSTMs),2AIGC法律风险研究报告以及凭借其延长的注意力广度(attention span)而彻底改变了AI领域的Transformer等。文本生成在自然语言处理、聊天机器人和内容创建领域(自动写作、文本摘要)有许多应用。[heading1]一些具有代表性的海外项目:[content]➢GPT-4(OpenAI):目前最先进的自然语言生成模型,可用于回答问题、撰写文章等。➢Gemini Ultra(Google):多模态人工智能模型,采用神经网络架构,对标GPT-4,可用于回答问题、生成代码、处理文本等。➢Claude 3 Opus(Anthropic):多模态模型,能处理超过1百万token的输入,具有实时聊天、数据处理、分析预测等功能;实现了接近完美的召回率。[heading1]一些具有代表性的国内项目:[content]➢“悟道・天鹰”(北京智源人工智能研究院):“悟道・天鹰”(Aquila)是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。➢文心一言(百度):大语言模型,可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。

Others are asking
最近的论文AI模型
以下是关于 AI 模型的相关知识: 1. 概念:生成式 AI 生成的内容称为 AIGC。 2. 概念与关系: AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习使用有标签的训练数据,目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习的数据没有标签,算法自主发现规律,经典任务如聚类,例如让模型将一堆新闻文章根据主题或内容特征分成相似组。 强化学习从反馈中学习,以最大化奖励或最小化损失,类似训小狗。 深度学习是一种参照人脑有神经网络和神经元(因层数多而称深度)的方法,神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),像上下文理解、情感分析、文本分类。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,它完全基于自注意力机制(SelfAttention)处理序列数据,无需依赖循环神经网络(RNN)或卷积神经网络(CNN)。
2025-03-09
【深度拆解】ChatGPT-4o背后的技术革新:从语言模型到多模态跨越
ChatGPT4o 背后的技术革新具有重要意义。人类的感知多样,仅靠语言描述世界远远不够,多模态理解非常有用,能更全面学习世界、理解人类需求等。2023 年 9 月 GPT4v 发布,将大语言模型竞赛带入多模态模型时代,如 ChatGPT 能看图说话、画图,Google 的 Gemini 支持多种模态,但 OpenAI 常抢先发布。今年 5 月 OpenAI 发布 GPT4o,向智能体方向迈进,其是之前技术的集大成者,通过端到端神经网络混合训练视觉、语音和文本数据,平均音频输入反应时间为 300 毫秒,能感悟人类表达的情绪等。OpenAI 未公开 GPT4o 技术细节,唯一线索来自内部炼丹师的博客 AudioLM。此外,GPT4 是 OpenAI 的多模态工具,在编程任务中表现出色,ChatGPT 是用户友好界面,可与高级语言模型交互。2024 年 5 月 14 日 OpenAI 发布 GPT4o,效率高、价格降低、延迟缩短。9 月 16 日 OpenAI 推出 o1 系列模型,在复杂任务中表现优异,o1mini 适合编码任务,两个模型已在 ChatGPT 中提供,有免费或收费版本。
2025-03-09
我想整理现在国内和国外的大语言模型产品并需要你整理差异还有时间轴
以下是对国内外大语言模型产品的整理及差异: 国内大语言模型: 通用模型:如文心一言、讯飞星火等,能够处理自然语言。 垂直模型:专注于特定领域,如小语种交流、临床医学、AI 蛋白质结构预测等。 具有代表性的项目:“悟道・天鹰”(北京智源人工智能研究院)是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型;文心一言(百度)可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。 国外大语言模型: 具有代表性的项目:GPT4(OpenAI)是目前最先进的自然语言生成模型,可用于回答问题、撰写文章等;Gemini Ultra(Google)是多模态人工智能模型,采用神经网络架构,对标 GPT4,可用于回答问题、生成代码、处理文本等;Claude 3 Opus(Anthropic)是多模态模型,能处理超过 1 百万 token 的输入,具有实时聊天、数据处理、分析预测等功能,实现了接近完美的召回率。 时间轴方面: 国内:去年 7 月大模型百花齐放。 国外:相关模型也在不断发展和更新。 在工作原理上,大语言模型通常包括训练数据、算力、模型参数等要素。在训练数据一致的情况下,模型参数越大能力越强。Transformer 架构是大语言模型训练的常见架构,具备自我注意力机制能理解上下文和文本关联。同时,大模型可能存在幻觉,即因错误数据导致给出错误答案,优质数据集对其很重要。此外,Prompt 分为 system prompt、user prompt 和 assistant prompt,写好 Prompt 的法则包括清晰说明、指定角色、使用分隔符、提供样本等。还可以基于通用大模型进行 Fine tuning 微调,以适应特定领域的需求。
2025-03-07
如何搭建大模型
搭建大模型需要注意以下几个方面: 1. 认识到开发大模型应用的复杂性,许多细节和阶段在实际操作中才会逐渐显现,因此并非易事。 2. 提示词设计需要精细工作,精心设计和调试是确保流程顺畅和应用有价值的关键,其直接影响模型输出质量和应用效果。 3. 构建有效的大型语言模型应用需要: 重视工程化,避免模型应用无法维护。 根据项目需求选择合适的开发框架。 了解业务深层次需求,设定流程环节以确保模型能解决实际问题。 在每个环节精心设计提示词,引导模型提供准确有用的回复。 确保应用在提供服务时遵守安全和伦理标准。 通过不断测试和迭代优化模型性能和用户体验。 成功部署后持续维护和更新,以适应需求变化。 掌握这些关键点,能确保构建的模型应用技术先进,真正解决用户问题并提供有价值的服务。此外,本次的彩蛋更新加入了“Emotion”字段,智能体构建专家会动态推理智能体情感设定,帮助制作更有情商的智能体。
2025-03-07
不能用APP思维、传统数字平台思维去做大模型创业和人工智能创业,二者在底层逻辑和商业模式等方面完全不同
大模型创业和人工智能创业与 APP 思维、传统数字平台思维在底层逻辑和商业模式等方面存在显著差异。大模型和人工智能创业更注重数据的深度处理、算法的优化创新以及对复杂问题的解决能力。相比之下,APP 思维通常侧重于用户界面和功能的设计,以满足特定的用户需求;传统数字平台思维则更多关注平台的搭建和用户流量的获取与运营。在大模型和人工智能领域,技术的突破和创新是关键,需要投入大量资源进行研发,并且要面对更高的技术门槛和不确定性。而 APP 和传统数字平台的创业相对更侧重于市场推广和用户体验的优化。总之,不能简单地用 APP 思维和传统数字平台思维来指导大模型和人工智能创业。
2025-03-07
是否有可以免费使用的可以辅助机械设计的AI大模型
以下是一些可以免费使用且能辅助机械设计的 AI 大模型: 1. Trae 国内版:内置豆包 1.5 pro、DeepSeek 满血版等大模型,无限量免费使用。其作为 AI IDE,整体比插件好用,连接稳定快速,界面根据国内用户习惯定制。 2. 阿里的通义千问大模型:有免费接口,但可能存在一定的免费额度限制。 3. 智谱 AI(ChatGLM):有免费接口,同样可能有免费额度的限制。 4. 科大讯飞(SparkDesk):提供免费接口,可能有限制免费额度的 Token。 此外,谷歌的 Gemini 大模型和海外版 Coze 的 GPT4 模型免费且能图片识别,但使用时需要给服务器挂梯子。
2025-03-07
人工智能法律
以下是关于人工智能法律的相关内容: 《人工智能权利法案蓝图》提出了人工智能权利法案的相关内容。 《全球人工智能治理大变局之欧盟人工智能治理监管框架评述及启示》中提到: 1. 欧盟人工智能监管体系对中国的启示包括纳入道德伦理和人权考量的以风险为基准的统一人工智能治理。但伦理道德和人权的高度概括性、抽象性和不确定性给融入人工智能治理带来挑战,我国《科技伦理审查办法(试行)》是积极探索,但人工智能的特殊性可能无法体现,且“不可接受的风险”和“高风险”的界定存在不确定性和模糊性,以风险为基准的人工智能管理框架成效有待观望和研讨。 《人工智能法案》的相关规定包括: 1. 通过适当的设计、测试和分析,在开发前和整个开发过程中,用适当的方法(如让独立专家参与)证明对健康、安全、基本权利、环境、民主和法治的合理可预见风险的识别、减少和缓解,以及开发后剩余不可缓解风险的记录。 2. 处理和纳入仅受适当数据治理措施约束的数据集用于基础模型,特别是检查数据源的适用性和可能的偏差以及适当的缓解措施。 3. 设计和开发基础模型,以在其整个生命周期内通过适当的方法(如让独立专家参与模型评估、记录分析和广泛测试)实现适当水平的性能、可预测性、可解释性、可纠正性、安全性和网络安全性。 4. 设计和开发基础模型时,利用适用的标准来减少能源使用、资源使用和浪费,并提高能源效率和系统的整体效率,但不损害相关的现有联盟和国家法律。在第 40 条所述的标准公布之前,此义务不适用。基础模型应具备能够测量和记录能源和资源消耗以及在技术可行的情况下系统部署和使用在整个生命周期内可能产生的其他环境影响的能力。 5. 制定广泛的技术文档和易懂的使用说明,以使下游供应商能够遵守第 16 条和第 28(1)条规定的义务。 6. 建立质量管理体系,以确保并记录对本条的遵守情况,并有可能在满足这一要求方面进行试验。
2025-02-27
有哪些deepseek 和法律相关的内容吗
以下是与 DeepSeek 和法律相关的内容: 在应用开发方面,有人尝试用 DeepSeek 翻译一本原版书,其中提到翻译过程中可能会涉及一些敏感内容(比如法律相关),国内的大模型有较多过滤机制,这部分内容 DeepSeek 可能处理不了。碰到这种情况可以转移去其他模型。 游戏科学创始人、黑神话悟空制作人冯骥评价 DeepSeek 时提到,可以用它检查合同里的法律陷阱。
2025-02-25
法律AI工具
以下是关于法律 AI 工具的相关信息: 律师在工作中的优势包括: 1. 在沟通和谈判中能够与客户方、相对方、其他机构建立信任、表达观点、促成交易等。 2. 能够针对新兴行业或监管空白提出合规建议,如为新技术制定合法性指导。 3. 作为专业人士,在紧急情况下能做出专业判断,提供及时的法律建议和解决方案。 律师不擅长的方面有: 1. 处理大量信息和数据时人工效率非常有限,如大量文件调查中的数据提取和整理。 2. 可能难以记住各类案件中的所有事实和细节,尤其是在复杂案件中。 3. 在处理复杂案件时,可能会面临情绪、精力、时间等带来的压力,从而影响专业判断。 基于以上,律师和 AI 的协同是一种借助互相优势、相互加持的关系。律师运用大模型时,关键任务是根据不同的法律业务场景,精准地提出问题、指令(Prompt),以引导 AI 发挥最大效用。例如: 1. 在处理信息检索与整理任务时,律师可以指导 AI 精确抓取相关法律法规、先例判决等关键信息,迅速获得案件准备所需的素材,花更多时间进行法律分析。 2. 当需要自动化处理文档时,律师可以指导 AI 生成和修改标准化合同。 一些法律 AI 工具推荐: 1. :为精英律师事务所量身打造的生成 AI,用于解决世界各地各种法律体系中最复杂的法律挑战。它可以建立定制的 LLMs,覆盖每个实践领域和司法管辖区,上周获得了红衫和 Open AI 领投的 2000 万美元融资。 以下是一些 Prompt 指令词的示例: 1. 针对一起商业秘密泄露案件,分析可能的法律责任和赔偿范围,撰写法律意见书,为客户提供应对策略。 2. 为一家计划上市的公司提供关于公司治理结构的法律意见书,包括股东权益保护和董事会职责,确保符合《公司法》和证券法规的要求。 3. 就一起消费者权益保护案件提供法律意见,分析商家可能面临的赔偿责任和消费者维权途径,为客户制定应对措施。 4. 为一项公司股权转让交易起草股权转让协议,确保协议详细规定转让方和受让方的信息、股权转让的份额、转让价格、支付方式和时间表、股权转让的先决条件、以及双方在交易完成后的权利和义务。同时,提出关于保密、违约责任和争议解决的条款建议。 5. 起草一份涉及初创公司股权转让的协议,明确创始股东向新投资者转让股权的条件、价格、支付方式,以及新投资者加入后的公司治理结构和决策流程。 6. 为一项涉及上市公司股份转让的交易起草协议,包括股份的详细描述、转让价格、支付安排、股份转让的监管要求,以及转让后对公司控制权的影响。 7. 起草一份涉及家族企业股权内部转让的协议,确保条款涵盖家族成员之间的股权分配、转让价格的确定方式、家族企业治理结构的调整,以及家族成员在股权转让后的权益保护。同时,提出如何处理家族企业的继承和长期发展计划。
2025-02-21
推荐一些ai法律网站
以下为您推荐一些 AI 法律相关的网站和资源: 1. 法信智能法律咨询:这是一个 AI 法律咨询助手,利用自然语言处理和知识图谱技术,能够解答法律问题并提供法律咨询。 2. 有关美国 AI 法规的资源: 另外,在进行法规研究与解读时,法规检索最好使用法律行业垂类的 AI 产品。例如,您可以使用以下 Prompt 指令词获取相关帮助: 1. 根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议。 2. 分析新出台的《网络安全法》对电子商务平台的具体影响,特别是数据保护和用户隐私方面的规定,为客户提供合规操作指南。 3. 【输入一段具体法律规定如:国际贸易规定】,以上是国际贸易法规的最新变化,为客户提供跨境交易的合规指南,特别是关税和进出口限制方面的内容。 4. 解读新修订的税法对中小企业的影响,提供税务规划和避税策略的建议,确保客户在合法范围内优化税务负担。 在撰写法律意见书或非诉交易文件材料时,可以使用以下 Prompt 指令词: 1. 针对我方当事人涉及的版权纠纷案,输入【已有的证据材料】+【相关法律条文】,撰写一份初步法律意见书,论证我方主张的合理性和胜诉的可能性。
2025-02-10
AI法律网站推荐
以下是为您推荐的一些 AI 法律相关的网站: 1. 对于法律案例推荐,您可以参考以下 Prompt 指令词和结构提示: 指令词:请基于以下案例情况,给我推荐 5 个类似案例。 结构提示:【提炼的案例事实(也可以让 AI 先提炼总结)or 直接把案例直接发给 AI,让 AI 基于以上事实推荐类似案例】 2. 对于法规研究与解读,最好使用法律行业垂类的 AI 产品。通用型 AI 可能存在查不出来、数据不全或生成内容不能满足需求的情况。相关的 Prompt 指令词示例如下: 根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议。 分析新出台的《网络安全法》对电子商务平台的具体影响,特别是数据保护和用户隐私方面的规定,为客户提供合规操作指南。 【输入一段具体法律规定如:国际贸易规定】,以上是国际贸易法规的最新变化,为客户提供跨境交易的合规指南,特别是关税和进出口限制方面的内容。 解读新修订的税法对中小企业的影响,提供税务规划和避税策略的建议,确保客户在合法范围内优化税务负担。 结构提示:【需求 or 目的+根据具体法条或者根据某部法律+具体需要研究或则具体的研究细节内容】 3. 以下是一些提供 AI 相关服务的网站: https://www.landr.com/onlineaudiomastering/(收费) https://emastered.com/(收费) https://app.kits.ai/aimastering(收费,推荐,除了母带处理,还有分轨、替换人声、人声克隆等功能) https://app.bakuage.com/(免费!强烈推荐)
2025-02-10
法律方面的运用
以下是关于法律方面在 AI 领域的运用: 开源中文法律大语言模型: LaWGPT:基于中文法律知识的大语言模型。地址: 。该模型在通用中文基座模型基础上扩充法律领域专有词表、大规模中文法律语料预训练,并通过构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,增强了在法律领域的基础语义理解和执行能力。 LexiLaw:中文法律大模型。地址: 。它是基于 ChatGLM6B 微调的,旨在为法律从业者、学生和普通用户提供准确、可靠的法律咨询服务,包括具体法律问题的咨询,以及对法律条款、案例解析、法规解读等方面的查询。 Lawyer LLaMA:中文法律 LLaMA。地址: 。开源了一系列法律领域的指令微调数据和基于 LLaMA 训练的中文法律大模型的参数,首先在大规模法律语料上进行了 continual pretraining,借助 ChatGPT 收集数据进行指令微调,让模型习得将法律知识应用到具体场景中的能力。 律师常用 Prompt 场景: 案例检索:最好使用法律行业垂类的 AI 产品。Prompt 指令词示例:“请搜索近五年内关于商标侵权案件中‘混淆可能性’标准的具体判例,并提供相似度最高的三个案例的关键要点摘要。”预计效果是 AI 系统将检索相关数据库,找出符合要求的判例,并提炼出关键判决理由和结果,形成摘要报告。Prompt 结构提示:【案例领域或类型+明确需要查找的重点内容+查找案例的目的+其他希望 AI 做的事情】 类案检索:同样最好使用法律行业垂类的 AI 产品。 相关法律规定: 《生成式人工智能服务管理暂行办法》: 第一条:为促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,根据相关法律、行政法规制定本办法。 第二条:利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务适用本办法。国家对利用生成式人工智能服务从事特定活动另有规定的,从其规定。未向境内公众提供生成式人工智能服务的某些情况不适用本办法。 第三条:国家坚持发展和安全并重、促进创新和依法治理相结合的原则,对生成式人工智能服务实行包容审慎和分类分级监管。 第四条:提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,并遵守多项规定,包括不得生成法律、行政法规禁止的内容,防止产生各种歧视,不得实施垄断和不正当竞争行为,尊重他人合法权益,提升服务的透明度,提高生成内容的准确性和可靠性。
2025-02-05