直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

学术类大模型

回答

以下是关于学术类大模型的相关信息:

大模型商业化落地的现状: 在医疗行业,大模型的应用主要涵盖疾病的诊断与预测、药物研发以及个性化医疗三个方向。例如,2020 年麻省理工学院利用 AI 发现了新型广谱抗生素 Halicin,研究者先构建由两千个性能已知分子组成的训练集来训练 AI,让其学习分子特点并总结规律,再对美国 FDA 已通过的六万多个分子进行分析,最终识别出符合要求的分子。目前很多医疗研究机构都在进行医疗大模型的开发研究,大模型在医疗领域潜力巨大。

什么是大模型: 通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练、使用过程:

  1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练。
  2. 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。
  3. 找老师:用合适算法讲述“书本”内容,让大模型更好理解 Token 之间的关系。
  4. 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。
  5. 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称为推导(infer)。

此外,清华大学计算机科学系的学生小 A(aaronxic)投稿了 Transformer 101 系列,从自身经验出发总结梳理新手友好的 transformer 入坑指南。其知乎个人主页:https://www.zhihu.com/people/aaronxic 。欢迎更多共建者一起投稿、充实知识库。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

开发:AI应用大模型商业化落地现状与思考

首先来看医疗行业,这是关乎每个人生命健康的重要领域。大模型在医疗行业的应用主要涵盖三个方向:疾病的诊断与预测、药物研发以及个性化医疗。从医疗前期的图像诊断,基因组学和精准医疗到药物研发阶段再到最后病人的个性化医疗,人工智能都有其适合的应用场景。例如,在2020年,麻省理工学院利用AI发现了一种名为Halicin的新型广谱抗生素,它不仅能有效杀灭对现有抗生素产生耐药性的细菌,而且不会使细菌产生新的耐药性。这一突破性发现源于AI的助力。研究者先搞了一个由两千个性能已知的分子组成的训练集,这些分子都被标记好了是不是可以抑制细菌生长,用它们去训练AI。AI自己学习这些分子都有什么特点,总结了一套“什么样的分子能抗菌”的规律。之后又对美国FDA已通过的六万多个分子中进行分析,最终成功识别出了一个符合所有要求的分子,这就是Halicin。之后研究者开始做实验证明,它真的非常好使,大概很快就会用于临床,造福人类。这个例子充分展示了AI大模型在医疗领域的巨大潜力,目前很多医疗研究机构都进行医疗大模型的开发研究,大模型在医疗领域大有可为!

大模型入门指南

通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)

小A-技术开发/大模型

小A(aaronxic)是清华大学计算机科学系的学生,他投稿了他写的Transformer 101系列,从自己实际入坑的经验出发,尝试总结梳理出新手友好的transformer入坑指南。一方面能倒逼自己理清知识脉络,另一方面希望能让后面的新同学少走弯路,更快拿到自己想要的知识。欢迎更多共建者一起投稿、充实知识库。知乎个人主页:https://www.zhihu.com/people/aaronxic

其他人在问
学术类AI产品
以下是关于学术类 AI 产品的相关信息: AI 练功房 By AI 产品江湖: 作者信息:《AI 产品江湖》由“混世魔王和他的朋友们”共同发起。混世魔王毕业于爱丁堡大学人工智能专业,负责过多个 AI 平台产品,将持续为大家分享典型 AI 产品,并搭建 Demo 模型器。魔王和他的朋友们也会以 AI 行业一线从业者的视角分享行业见闻。 目录:咨询我应该用什么 AI 产品。 健身类 AI 产品: AI 健身是指利用人工智能(AI)技术来辅助或改善健身训练和健康管理的方法。它利用 AI 算法和数据分析来个性化地指导用户进行锻炼、提供健康建议、监测运动进度和提供反馈。AI 健身可以根据用户的健康状况、身体指标、运动目标和偏好,提供定制化的训练计划和建议,以帮助用户更有效地达到健康和健身目标。这种技术可以应用于健身应用程序、智能健身设备和在线健身培训等领域,为用户提供更智能、更个性化的健身体验。 当涉及到健身的 AI 工具时,有以下几个不错的选择: Keep:中国最大的健身平台,为用户提供全面的健身解决方案,以帮助用户实现其健身目标。https://keep.com/ Fiture:沸彻魔镜由核心 AI 技术打造,集硬件、丰富课程内容、明星教练和社区于一体。https://www.fiture.com/ Fitness AI:利用人工智能进行锻炼,增强力量和速度。https://www.fitnessai.com/ Planfit:健身房家庭训练与 AI 健身计划,AI 教练是专门针对健身的生成式人工智能,使用 800 多万条文本数据和 ChatGPT 实时提供指导。https://planfit.ai/ 相似问题:请帮我推荐关于健身的 AI。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-08-09
如何利用AGI创建3D打印的模型
利用 AGI 创建 3D 打印模型的方法如下: 1. 将孩子的画转换为 3D 模型: 使用 AutoDL 部署 Wonder3D:https://qa3dhma45mc.feishu.cn/wiki/Pzwvwibcpiki2YkXepaco8Tinzg (较难) 使用 AutoDL 部署 TripoSR:https://qa3dhma45mc.feishu.cn/wiki/Ax1IwzWG6iDNMEkkaW3cAFzInWe (小白一学就会) 具体实物(如鸟/玩偶/汽车)的 3D 转换效果最佳,wonder3D 能智能去除背景(若效果不佳,需手动扣除背景) 对于一些非现实类玩偶类作品,wonder3D 识别效果不佳时,可先使用 StableDiffusion 将平面图转换为伪 3D 效果图再生成模型。以 usagi 为例,先通过 SD 生成 3D 的 usagi,再将 usagi 输入 wonder3D。 2. 生成特定模型,如创建一个乐高 logo 的 STL 文件: 设计乐高 logo:使用矢量图形编辑软件(如 Adobe Illustrator 或 Inkscape)创建或获取矢量格式的乐高 logo,确保符合标准。 导入 3D 建模软件:将矢量 logo 导入到 3D 建模软件(如 Blender、Fusion 360 或 Tinkercad)中。 创建 3D 模型:在 3D 建模软件中根据矢量图形创建 3D 模型,调整尺寸和厚度以适合打印。 导出 STL 文件:将完成的 3D 模型导出为 STL 文件格式。 以下是在 Blender 中使用 Python 脚本创建简单 3D 文本作为乐高 logo 并导出为 STL 文件的步骤: 打开 Blender,切换到“脚本编辑器”界面。 输入脚本,点击“运行脚本”按钮,Blender 将创建 3D 文本对象并导出为 STL 文件。 检查生成的 STL 文件,可根据需要调整脚本中的参数(如字体、位置、挤压深度等)以获得满意的乐高 logo 3D 模型。 此外,还有一些其他动态: 阿里妈妈发布了:https://huggingface.co/alimamacreative/FLUX.1TurboAlpha ,演示图片质量损失小,比 FLUX schell 本身好很多。 拓竹旗下 3D 打印社区 Make World 发布 AI:https://bambulab.com/zh/signin ,3D 生成模型找到落地和变现路径。 上海国投公司搞了一个:https://www.ithome.com/0/801/764.htm ,基金规模 100 亿元,首期 30 亿元,并与稀宇科技(MiniMax)、阶跃星辰签署战略合作协议。 智谱的:https://kimi.moonshot.cn/ 都推出基于深度思考 COT 的 AI 搜索。 字节跳动发布:https://mp.weixin.qq.com/s/GwhoQ2JCMQwtLN6rsrJQw ,支持随时唤起豆包交流和辅助。 :https://x.com/krea_ai/status/1844369566237184198 ,集成了海螺、Luma、Runway 和可灵四家最好的视频生成模型。 :https://klingai.kuaishou.com/ ,现在可以直接输入文本指定对应声音朗读,然后再对口型。
2024-12-20
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20
通过提示词可以提高模型的数学计算能力吗
通过提示词可以在一定程度上提高模型的数学计算能力。例如 PoT 技术,它是思维链技术的衍生,适用于数值推理任务,会引导模型生成一系列代码,再通过代码解释器工具进行运算,这种方式能显著提升模型在数学问题求解上的表现。PoT 作为 CoT 的衍生技术,遵循零样本和少样本的学习范式,零样本 PoT 与 CoT 方法相似,不需要大量样本即可进行有效推理,少样本 PoT 也通过较少样本优化模型表现。但需要注意的是,大模型在解决数学问题时可能存在不够可靠的情况。
2024-12-20
哪一个开源大语言模型对中文支持比较好?
以下是一些对中文支持较好的开源大语言模型: 1. OpenChineseLLaMA: 地址: 简介:基于 LLaMA7B 经过中文数据集增量预训练产生的中文大语言模型基座,对比原版 LLaMA,该模型在中文理解能力和生成能力方面均获得较大提升,在众多下游任务中均取得了突出的成绩。 2. BELLE: 地址: 简介:开源了基于 BLOOMZ 和 LLaMA 优化后的一系列模型,同时包括训练数据、相关模型、训练代码、应用场景等,也会持续评估不同训练数据、训练算法等对模型表现的影响。 3. Panda: 地址: 简介:开源了基于 LLaMA7B,13B,33B,65B 进行中文领域上的持续预训练的语言模型,使用了接近 15M 条数据进行二次预训练。 4. Llama2Chinese13bChat: 地址: 5. Gemma7bit: 地址: 此外,AndesGPT 在语言理解与抽取、角色扮演能力上排名国内前一,在代码、生成与创作、上下文对话能力上排名国内前三,各项能力较为均衡,聚焦在移动设备端的应用。Baichuan213BChat 是百川智能自主训练的开源大语言模型,是中文开源模型的主导力量。
2024-12-20
说明jetson orin nano可以使用什么模型?Grok-1模型可以吗?
目前没有关于 Jetson Orin Nano 是否可以使用 Grok1 模型的明确信息。但一般来说,Jetson Orin Nano 可以支持多种常见的深度学习模型,如基于 TensorFlow、PyTorch 框架开发的模型等。具体能够使用哪些模型,还需要考虑模型的计算需求、内存占用以及 Jetson Orin Nano 的硬件配置和性能限制等因素。
2024-12-20
怎么用已经公布的源代码,自己拥有一个私人ai。详细步骤,并且列出硬件设施,说明jetson orin nano可以使用什么模型?
目前已公布的源代码种类繁多,要利用其拥有一个私人 AI 并非简单直接的过程,且需要一定的技术知识和经验。 一般来说,以下是大致的步骤: 1. 选择合适的源代码:根据您的需求和技术能力,从众多已公布的源代码中选择适合的项目。 2. 环境搭建:安装所需的开发工具、编程语言和相关依赖库。 3. 数据准备:收集和整理适合训练和优化模型的数据。 4. 代码理解与修改:深入理解所选源代码的结构和逻辑,根据您的需求进行必要的修改和优化。 5. 训练模型:使用准备好的数据对模型进行训练。 6. 评估与优化:对训练好的模型进行评估,根据评估结果进行进一步的优化。 关于硬件设施,Jetson Orin Nano 是一款性能不错的嵌入式计算设备。它可以支持多种模型,例如常见的深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)等。但具体能使用哪些模型,还取决于模型的规模、计算需求以及您对性能和资源的要求。
2024-12-20