以下是为您提供的大模型入门指南:
一、什么是大模型
大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够理解自然语言,进行文本生成、推理问答、对话、文档摘要等工作。
二、大模型的训练和使用过程类比
在LLM中,Token被视为模型处理和生成的文本单位,可以代表单个字符、单词、子单词等,在将输入进行分词时,会对其进行数字化,形成一个词汇表。
三、本地大模型部署
以ComfyUI ollama为例:
相关链接:
四、小白快速上手Stable Diffusion
用stable diffusion可以把自己想象成一个画家,在起笔画画之前,要先确定画的风格,比如是二次元动漫、三次元的现实照片还是盲盒模型。确定照片风格后,就要切换大模型,不同的模型代表着不同的照片风格,也就是SD界面左上角的“Stable Diffusion模型”。假如想生成一个真人AI小姐姐,可选用chilloutmix的大模型。关于模型的获取和存放位置,后续会详细介绍。
通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)在LLM中,Token([2])被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token是原始文本数据与LLM可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary),比如:The cat sat on the mat,会被分割成“The”、“cat”、“sat”等的同时,会生成下面的词汇表:|Token|ID||-|-||The|345||cat|1256||sat|1726||…|…|
先下载ollama安装安装好了不会有任何界面弹出,可以在电脑桌面右下角或者隐藏图标里面找到之后再去下载对应的模型选择模型,复制对应的命令打开命令行界面,输入对应的模型获取命令等待下载完成,就可以看到[heading3]设置目录[content]下载的模型后面就会保存到D:\ollama\blobs[heading3]docker安装[content]安装会下载一些文件安装后,改下这个目录,不要放在c盘[heading3]Open webui安装[content]输入下面命令安装成功后,回到docker点击,会自动打开网页第一次使用,需要注册一个账号选择一个下载好的模型就可以开始使用了模型的安装sk-btYGWrHmHbd8zf5kB6D97241DfEc4b5a8576E1Ce9d9fB006[heading3]错误解决[content]端口的占用,有时候也可能没有占用,但是在Windows上也会出现。运行下面两条命令可以解决。[heading3]相关链接:[content]comfyui-ollamahttps://github.com/stavsap/comfyui-ollama?tab=readme-ov-fileOllamahttps://ollama.com/dockerhttps://www.docker.com/Open webuihttps://openwebui.com/
用stable diffusion可以把自己想象成一个画家在起笔画画之前,我们要先确定我们画的是什么风格的画,是二次元动漫、三次元的现实照片、还是盲盒模型。因此,在我们确定了我们照片风格之后我们就要去切换大模型,不同的模型就代表着不同的照片风格。也就是SD界面左上角的“Stable Diffusion模型”假如现在我想生成一个真人AI小姐姐,就选用chilloutmix的大模型那么问题来了,我们这些模型从哪来呢?下载的模型放在哪里呢?在我分享给大家的链接里面,有部分比较常用的大模型(后续还有比较好的模型也会分享给大家)大家可以根据文件夹名称找到需要的模型。另外,这篇文章的第三部分会跟大家详细介绍去哪里下载模型,模型存放的位置,所以一定要看到最后!