学术类大模型-WayToAGI

回答

以下是关于学术类大模型的相关信息：

大模型商业化落地的现状：在医疗行业，大模型的应用主要涵盖疾病的诊断与预测、药物研发以及个性化医疗三个方向。例如，2020 年麻省理工学院利用 AI 发现了新型广谱抗生素 Halicin，研究者先构建由两千个性能已知分子组成的训练集来训练 AI，让其学习分子特点并总结规律，再对美国 FDA 已通过的六万多个分子进行分析，最终识别出符合要求的分子。目前很多医疗研究机构都在进行医疗大模型的开发研究，大模型在医疗领域潜力巨大。

什么是大模型：通俗来讲，大模型是输入大量语料，让计算机获得类似人类的“思考”能力，能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练、使用过程：

找学校：训练大模型需要大量计算，GPU 更合适，只有购买得起大量 GPU 的才有资本训练。
确定教材：大模型需要大量数据，几千亿序列（Token）的输入基本是标配。
找老师：用合适算法讲述“书本”内容，让大模型更好理解 Token 之间的关系。
就业指导：为让大模型更好胜任某一行业，需要进行微调（fine tuning）指导。
搬砖：就业指导完成后，进行如翻译、问答等工作，在大模型里称为推导（infer）。

此外，清华大学计算机科学系的学生小 A（aaronxic）投稿了 Transformer 101 系列，从自身经验出发总结梳理新手友好的 transformer 入坑指南。其知乎个人主页：https://www.zhihu.com/people/aaronxic 。欢迎更多共建者一起投稿、充实知识库。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

开发：AI应用大模型商业化落地现状与思考

首先来看医疗行业，这是关乎每个人生命健康的重要领域。大模型在医疗行业的应用主要涵盖三个方向：疾病的诊断与预测、药物研发以及个性化医疗。从医疗前期的图像诊断，基因组学和精准医疗到药物研发阶段再到最后病人的个性化医疗，人工智能都有其适合的应用场景。例如，在2020年，麻省理工学院利用AI发现了一种名为Halicin的新型广谱抗生素，它不仅能有效杀灭对现有抗生素产生耐药性的细菌，而且不会使细菌产生新的耐药性。这一突破性发现源于AI的助力。研究者先搞了一个由两千个性能已知的分子组成的训练集，这些分子都被标记好了是不是可以抑制细菌生长，用它们去训练AI。AI自己学习这些分子都有什么特点，总结了一套“什么样的分子能抗菌”的规律。之后又对美国FDA已通过的六万多个分子中进行分析，最终成功识别出了一个符合所有要求的分子，这就是Halicin。之后研究者开始做实验证明，它真的非常好使，大概很快就会用于临床，造福人类。这个例子充分展示了AI大模型在医疗领域的巨大潜力，目前很多医疗研究机构都进行医疗大模型的开发研究，大模型在医疗领域大有可为！

大模型入门指南

通俗来讲，大模型就是输入大量语料，来让计算机获得类似人类的“思考”能力，使之能够理解自然语言，能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习，那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程：1.找学校::训练LLM需要大量的计算，因此GPU更合适，因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大，需要的数据量特别多，几千亿序列（Token）的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容，让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后，为了让大模型能够更好胜任某一行业，需要进行微调（fine tuning）指导5.搬砖::就业指导完成后，下面就要正式干活了，比如进行一次翻译、问答等，在大模型里称之为推导（infer）

小A-技术开发/大模型

小A（aaronxic）是清华大学计算机科学系的学生，他投稿了他写的Transformer 101系列，从自己实际入坑的经验出发，尝试总结梳理出新手友好的transformer入坑指南。一方面能倒逼自己理清知识脉络，另一方面希望能让后面的新同学少走弯路，更快拿到自己想要的知识。欢迎更多共建者一起投稿、充实知识库。知乎个人主页：https://www.zhihu.com/people/aaronxic