目前在法律大模型领域,以下是一些做得较好的产品:
随着大语言模型的不断发展,对于大规模模型的推理需求将会持续增加。行云通过自研GPU内核以及创新硬件架构,为行业发展提供超低成本和超大带宽容量的解决方案。行云目前规划的两款产品将有助于解决大模型芯片成本问题,通过更开放的白盒方案,在不引入业务迁移成本的同时,降低对昂贵的英伟达高端显卡依赖。行云目前计划推出两款产品,第一款主要用于低成本市场,在接近消费级显卡的价格下,单卡显存容量达到300-400GB。行云第二款产品,单卡显存接近800GB,单卡可对标当前8卡服务器平台,大幅度降低成本。可根本性降低推理成本,协助下游客户更快完成商业闭环。麦伽智能项目简介麦伽智能是清华大学互联网司法研究院的成果转化伙伴,合作开发LegalOne法律大模型,从人民法院智能化场景切入,致力于打造未来社会综合治理的基础设施。项目陈述麦伽智能基于LegalOne法律大模型,研发了精准语义检索平台、法律咨询系统、审判辅助系统等多款产品,服务于高级、中级和基层各级人民法院的审判业务、诉源治理、多元解纷等场景。相关产品正在上海、山东、苏州、深圳、成都等地开展试点应用。未来,法律大模型将成为社会综合治理的基础设施,从司法机关向政府行政部门、企业和个人拓展。清程极智项目简介
ChatLaw-法律大模型地址:[https://github.com/PKU-YuanGroup/ChatLaw](https://github.com/PKU-YuanGroup/ChatLaw)简介:由北大开源的一系列法律领域的大模型,包括ChatLaw-13B(基于姜子牙Ziya-LLaMA-13B-v1训练而来),ChatLaw-33B(基于Anima-33B训练而来,逻辑推理能力大幅提升),ChatLaw-Text2Vec,使用93w条判决案例做成的数据集基于BERT训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。简介:https://m.toutiao.com/article/7251839216332653068/?app=news_article×tamp=1688482956&use_new_style=1&req_id=20230704230236E6F575C06DE6A91C10B7&group_id=7251839216332653068&wxshare_count=1&tt_from=weixin&utm_source=weixin&utm_medium=toutiao_android&utm_campaign=client_share&share_token=81b22e88-36d8-4aa1-8244-955058192f16[ChatLaw-13B](https://huggingface.co/JessyTsu1/ChatLaw-13B),此版本为学术demo版,基于姜子牙[Ziya-LLaMA-13B-v1](https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1)训练而来,中文各项表现很好,但是逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决。
文本生成(text generation)涉及使用机器学习(machine learning)模型,根据从现有文本数据中学习的模式生成新的文本。用于文本生成的模型可以是马尔科夫链(Markov Chains)、循环神经网络(RNN)、长短时记忆网络(LSTMs),2AIGC法律风险研究报告以及凭借其延长的注意力广度(attention span)而彻底改变了AI领域的Transformer等。文本生成在自然语言处理、聊天机器人和内容创建领域(自动写作、文本摘要)有许多应用。[heading1]一些具有代表性的海外项目:[content]➢GPT-4(OpenAI):目前最先进的自然语言生成模型,可用于回答问题、撰写文章等。➢Gemini Ultra(Google):多模态人工智能模型,采用神经网络架构,对标GPT-4,可用于回答问题、生成代码、处理文本等。➢Claude 3 Opus(Anthropic):多模态模型,能处理超过1百万token的输入,具有实时聊天、数据处理、分析预测等功能;实现了接近完美的召回率。[heading1]一些具有代表性的国内项目:[content]➢“悟道・天鹰”(北京智源人工智能研究院):“悟道・天鹰”(Aquila)是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。➢文心一言(百度):大语言模型,可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。