Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我是一名高中历史老师,请问用什么大模型能帮我做教学设计

Answer

以下为您推荐一些利用大模型辅助高中历史教学设计的案例:

  • 有一位历史老师使用 GPT 给学生讲课,通过 GPT 生成一个“沉浸式”历史片段游戏,让学生扮演一个角色“设身处地”地做决策,学生的作业是找出 GPT 的错误。例如明朝灭亡、南京、1645 年 5 月的相关案例,您可以参考:https://chat.openai.com/share/86815f4e-674c-4410-893c-4ae3f1b7412e/continue 。
  • 对于历史专业的学生,当他们遇到像 ChatGPT 这样的语言模型时,已经训练有素能够识别一些常见的陷阱,如事实不准确等,并通过事实核查、分析体裁和受众、在相关来源中搜索等技能来解决这些问题。
  • 语言模型对于历史学家和历史专业的学生是有益的,但对于历史老师和其他教育工作者在短期内可能会带来一些问题,需要重新思考许多作业的布置方式。

您可以尝试借鉴这些案例,根据您的教学需求和学生特点,对大模型的应用进行调整和优化。

Content generated by AI large model, please carefully verify (powered by aily)

References

教育:一个历史老师用GPT给学生讲课

推荐一篇文章,一个历史老师用GPT给学生讲课,https://resobscura.substack.com/p/simulating-history-with-chatgpt亮点有两个:1、通过GPT生成一个"沉浸式"历史片段游戏,让学生扮演一个角色"设身处地"的做决策。2、学生的作业是找出GPT的错误。可以试试这个案例,明朝灭亡,南京,1645年5月(GPT3.5)https://chat.openai.com/share/86815f4e-674c-4410-893c-4ae3f1b7412e/continue(文科生未来的作业越来越难了)英文版本:Since January of 2023,I’ve been experimenting with using large language models(LLMs)like ChatGPT as a teaching tool in my history classes at UC Santa Cruz.I’ve been thinking about the implications of AI in teaching since I first began using GPT-2 back in 2019.I have also been following along avidly as my wife[Roya Pakzad](https://www.royapakzad.co/)works on testing the human rights impacts of AI systems(Roya was a consultant for OpenAI in 2022,where she served on the “red team” for adversarial testing of a pre-release version of GPT-4; you can read her account of that work[here](https://royapakzad.substack.com/p/old-advocacy-new-algorithms)).What follows are some thoughts about what I believe to be a novel use of LLMs:using them to simulate interactive historical settings as part of a university assignment.The results of these early trials are why I am personally much more excited about generative AI than many of my colleagues — though I also concede that in the short term,cheating will be a major problem.

教育:一个历史老师用GPT给学生讲课

For example,imagine a high school student who is asked to analyze the first letter of Hernán Cortés to the Emperor Charles V.The student might dutifully paraphrase the conquistador’s account of the Aztec capital of Tenochititlan — including this[famously jarring description of Aztec temples as “mosques”](https://archive.org/details/fernandocorteshi01cort/page/154/mode/2up)(mezquitas).A history major would be able to go further.Why did Cortés use this confusing term?Cortés was born during the final decade of the[Reconquista](https://en.wikipedia.org/wiki/Reconquista).For this reason,he was intimately acquainted with non-Christian religiosity — but only in the context of Muslim religiosity.A large religious structure that was not a Christian church was for him,almost by default,a mosque — even when it was actually the[Templo Mayor](https://en.wikipedia.org/wiki/Templo_Mayor).Likewise,a history major would be able to recognize that Cortés was writing within a genre — an ambitious subject’s letter to a monarch — which tends toward self-promotion.And they would be able to fact check Cortés’ claims against those of other primary and secondary sources.Perhaps they would conduct some exploratory Google searches along the lines of “primary source conquest of Mexico” or “Aztec account of Cortés.” They might also look around for recent secondary sources by searching library catalogues and the footnotes on Cortés’ Wikipedia page and discover Matthew Restall’s[revisionist take](https://notevenpast.org/when-montezuma-met-cortes-the-true-story-of-the-meeting-that-changed-history-by-matthew-restall-2018/)on the subject.

教育:一个历史老师用GPT给学生讲课

When history majors encounter LLMs,then,they are already trained to recognize some of the by-now-familiar pitfalls of services like ChatGPT — such as factual inaccuracies — and to address them via skills like fact-checking,analyzing genre and audience,or reading “around” a topic by searching in related sources.Importantly,too,because so many sources are out of copyright and available in multilingual editions on Wikipedia and Wikisource,language models are abundantly trained on historical primary sources in hundreds of different languages.[(1)](https://resobscura.substack.com/p/simulating-history-with-chatgpt#footnote-1-136683347)For these reasons,I agree with Tyler Cowen that language models are[specifically a good thing for historians](https://marginalrevolution.com/marginalrevolution/2023/01/chatgpt-and-the-revenge-of-history.html)— but I would go further and say that they are also specifically a good thing for history majors.On the other hand,I foresee major problems for history teachers and other educators in the short-term.[Ted Underwood is right](https://tedunderwood.com/2023/07/31/we-can-save-what-matters-about-writing-at-a-price/):we professors are going to have to fundamentally rethink many of our assignments.I’ve seen many people dismiss ChatGPT as an essay writing tool because simply plugging in a prompt from an assignment results in a weak piece of writing.But LLMs are all about iterative feedback,and experimenting with well-known prompting methods dramatically improves results.

Others are asking
请问有没有可以读学术论文的AI
以下是一些可以辅助阅读学术论文的 AI 工具: 1. 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,能提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化的软件,有助于复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化论文编写。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 如果您的医学课题需要 AI 给出修改意见,可以考虑以下工具: 1. Scite.ai:为研究人员等打造的创新平台,提供引用声明搜索等工具,增强对科学文献的洞察。 2. Scholarcy:能从文档提取结构化数据,生成文章概要,包含关键概念等板块内容。 3. ChatGPT:强大的自然语言处理模型,可提供修改意见和帮助。 在 2023 年 12 月 28 日的历史更新中,在“激发学习动力”板块新增了“Connected Papers”网站,可通过可视化图表浏览学术论文。在中国 AI 网站中新增了“彩云小梦”,是一个帮您续写故事的 AI 产品。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-20
我想用AI软件生产年终总结报告,请问用哪种软件合适
以下是一些适合用于生成年终总结报告的 AI 软件及相关资源: 1. Claude Artifacts:文章《年底了,惊艳一次,用 Claude Artifacts 生成年终总结,简洁明快还能无限复用》介绍了其生成年终总结的特点,如简洁明快、可无限复用。通过编辑和实时预览功能,能一次性创建模板并不断修改使用,且改进后产出更稳定,简化创作过程。 2. 您还可以参考以下报告和文章获取更多信息: 《》 《》 《》 《》 生成式 AI 季度数据报告 2024 月 1 3 月 《》 《》
2025-01-20
请问waytoagi的定位是什么
WaytoAGI 是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。它于 2023 年 4 月 26 日诞生,在没有任何推广的情况下,一年时间已有超过 70 万用户和超千万次的访问量,是很多 AI 爱好者知识的源头。社群的 Slogan 是让更多的人因 AI 而强大,有很多学社和共学共建的活动。它不仅是一个知识库,还是连接学习者、实践者和创新者的社区,让大家在这里碰撞思想,相互鼓舞,一同成长。打开“waytoagi.com”就可以找到社群。
2025-01-20
我想做自媒体影片简单而快捷请问用什么工具。
如果您想做自媒体影片简单而快捷,可以考虑以下工具和方法: 1. 剪映:它有很多人性化设计和简单的音效库、小特效。方便之处在于操作相对简单,但无法协同工作和导出工程文件,难以与其他软件进行工程联通,可能影响视频的商业化效果。剪辑流程包括视频粗剪(确定画面逻辑)、视频定剪(调整和替换画面素材)、音效/音乐(注意版权问题)、特效(如光影效果)、包装(如字幕,可智能匹配字幕再修改)。 2. 四大 AI 视频工具(Pika、Pixverse、Runway、SVD):在生成角色形象时,每个 prompt 可描述为景别+角色特征+位置关系+环境+影片风格+比例,多次生成可能得到匹配的形象。但在场景一致性和双人关系镜头生成方面可能存在困难。 3. 除了工具,故事也很重要: 故事来源:包括原创(自身或周围人的经历、做过的梦、想象的故事等)和改编(经典 IP、名著、新闻、二创等)。 剧本写作:编剧有一定门槛,不能单纯套剧作理论和模板,应多实践、总结经验。短片创作可从自身或朋友经历改编、短篇故事改编入手,多与他人讨论故事。
2025-01-18
我是一个AI新手并且没有编程能力,如果我想要一个属于自己的AI智能体,并解决实际生活中的一些问题,请问有什教程吗?
以下是为您提供的创建属于自己的 AI 智能体的相关教程: 1. 扣子 Coze: 扣子官网: 可以通过简单 3 步创建智能体:首先起一个智能体的名称,然后写一段智能体的简单介绍,最后使用 AI 创建一个头像。开发完成后,还可以将自己构建的 Bot 发布到各种社交平台和通讯软件上。 2. 基于公开的大模型应用产品(如 Chat GLM、Chat GPT、Kimi 等): 点击“浏览 GPTs”按钮。 点击“Create”按钮创建自己的智能体。 使用自然语言对话进行具体设置或手工设置。 开始调试您的智能体并发布。 此外,智能体具有以下特点: 1. 强大的学习能力:能够通过大量的数据进行学习,从而获得对语言、图像等多种信息的理解和处理能力。 2. 灵活性:可以适应不同的任务和环境,表现出较高的灵活性和适应性。 3. 泛化能力:能够将学到的知识泛化到新的情境中,解决之前未见过的类似问题。 智能体应用类型包括: 1. 智能体应用(Assistant):基于上下文对话,自主决策并调用工具来完成复杂任务的对话式 AI 应用。示例场景如客户服务、个人助理、技术支持等。 2. 工作流应用(Workflow):将复杂任务拆解为若干子任务,以提高工作流程可控性的流程式 AI 应用。 3. 智能体编排应用:支持多智能体协作的流程式 AI 应用,能够编排多个智能体的执行逻辑,也可以使多个智能体自动规划和执行任务。
2025-01-11
请问什么是AGI
AGI 即通用人工智能(Artificial General Intelligence),是指具有人类水平的智能和理解能力的 AI 系统。 它有以下特点和相关内容: 与弱人工智能不同,强人工智能能够完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。 目前还只是一个理论概念,还没有任何 AI 系统能达到这种通用智能水平。 阿兰·图灵提出了图灵测试,将某一计算机系统和真人进行比较,若人类评审员在文本对话中无法区分真人和计算机系统,那么这个计算机系统就会被认为是“智能”的,该测试目前也被用作“智能”的定义。 例如 OpenAI 有关于实现 AGI 的计划,如原计划在 2026 年发布的 GPT7 因埃隆·马斯克的诉讼而被暂停,计划在 2027 年发布的 Q2025(GPT8)将实现完全的 AGI。GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。 更多信息请见 。
2025-01-10
做出AI教学零基础开始的计划,学期2个月
以下是为您制定的零基础开始的 AI 教学计划,学期为 2 个月: 第一个月: 1. 第一周 了解 AI 的基本概念和应用领域,包括 AI 绘画、自然语言处理等。 熟悉常见的 AI 工具和软件,如 StableDiffusion(SD)、Midjourney 等。 2. 第二周 深入学习 SD 的基础教程,掌握其基本操作和功能。 开始尝试使用 SD 进行简单的创作,如生成一些简单的图像。 3. 第三周 继续巩固 SD 的使用技巧,尝试更复杂的创作,如不同风格的图像生成。 学习如何优化图像生成的效果,如调整参数、选择合适的数据集等。 4. 第四周 探索 AI 变现的途径,了解如何将 AI 技术应用于实际项目中。 参与相关的社群讨论,与其他学习者交流经验。 第二个月: 1. 第一周 学习新的 AI 工具,如 Midjourney,并熟悉其操作和特点。 练习使用 Midjourney 进行文生图的创作,打磨提示词的使用技巧。 2. 第二周 深入研究 AI 在不同领域的应用案例,如证件照制作等。 尝试将所学的 AI 技术应用到实际项目中,如制作简单的证件照应用。 3. 第三周 总结前两个月的学习经验,查漏补缺,解决遇到的问题。 继续探索创新的 AI 应用方式和解决方案。 4. 第四周 对整个学期的学习成果进行评估和展示。 思考未来在 AI 领域的发展方向和进一步学习的计划。
2025-01-22
微信机器人最新教学
以下是一些微信机器人的相关教程: 共学版本:包含大多数教程内容,学完前三天就能做出不错的机器人,强烈建议学习。 Stuart:【入门级】教你用最简单的方式搭建微信机器人 马上观看看:通过云服务器,dify,智能微秘书来免费搭建微信机器人 Yaki:GPT/MJ 接入微信 DIN:全程白嫖拥有一个 AI 大模型的微信助手 熊猫大侠:基于 COW 框架的 ChatBot 实现步骤 大雨:轻松上手 Docker:一站式指南助你成为容器化技术高手 张梦飞:【保姆级教程】这可能是你在地球上能白嫖到的,能力最强的超级微信机器人!一步一图,小白友好 张梦飞:【保姆级】一步一图,手把手教你把 AI 接入微信
2025-01-20
教学AI工具
以下是为您提供的关于教学 AI 工具的相关信息: 4 岁儿童练习英语口语的 AI 工具: LingoDeer(https://www.lingodeer.com/):通过游戏和互动活动教学,提供多种课程,包括字母、数字、语法和词汇,还有家长仪表板可跟踪孩子进度和设置学习目标。 Busuu(https://www.busuu.com/):提供英语及多种语言课程,教学方法多样,有音频、视频课程和互动练习,具备社区功能可与其他孩子练习口语。 Memrise(https://www.memrise.com/):使用抽认卡和游戏教学,涵盖基本词汇到会话技巧,有社交功能可与朋友家人一起学习。 Rosetta Stone(https://www.rosettastone.com/):采用沉浸式教学法,让孩子在自然环境中学习英语,具有语音识别功能辅助发音。 Duolingo(https://www.duolingo.com/):免费的语言学习应用,课程游戏化,保持孩子的参与度。 为孩子选择时,需考虑年龄、兴趣和学习风格,还应考虑应用程序的功能和成本。 AI 摊主速成脑暴会: AI 娱乐与算命:包括 AI 算命、星盘、八字、人格测试、趣味算命、游戏化互动等,示例项目如 AI 算命(15 积分)、星盘解析等。 技术与工具教学:涵盖 Prompt 技巧、AI 工具安装、提示词优化、复杂模型训练、文档信息提取等,如 Prompt 技巧传授(10 积分)、MJ/Sd 出图(10 积分)等。 个性化小工具:有小红书账号文案、表情包、爆款名片生成、定制黄历、智能对话、内容分享等,例如小红书爆款文案(10 积分)、个人知识笔记(3 积分)等。 体验型项目:包括 AI 桌宠、人工智能体互动、数字人互动、项目商业模式咨询、AI 情感陪伴等,如桌宠体验(10 积分)、数字人体验(10 积分)等。 拜登签署的 AI 行政命令(2023.10.30): 在医疗保健领域推进负责任地使用 AI 以及开发平价救命药物,卫生与公众服务部将建立安全项目接收并处理涉及 AI 的危害或不安全医疗实践报告。 通过创建资源支持教育工作者部署支持 AI 的教育工具,塑造 AI 在教育方面的潜力,例如学校中的个性化辅导。 在支持工人方面,AI 改变了美国的工作和工作场所,总统指示采取以下行动:制定原则和最佳实践,以减轻对工人的危害并最大限度地发挥 AI 的益处,解决工作岗位流失、劳动标准、工作场所公平、健康和安全以及数据收集等问题;制作关于 AI 对劳动力市场潜在影响的报告,并研究和确定加强联邦对面临劳动力中断(包括来自 AI)的工人支持的选项。 在促进创新和竞争方面,确保美国继续在创新和竞争方面领先。
2025-01-19
微信超级AI知识助手教学(下)
以下是关于微信超级 AI 知识助手教学(下)的相关信息: 时间:12 月 11 日 20:00 () 内容:个人助手的微信多模态接入教学 讲师:@张梦飞
2025-01-14
人工智能赋能教学创新工作坊
以下是关于“智慧课程培育建设暨人工智能赋能教学创新工作坊”的相关信息: 举办时间:2024 年 9 月 20 日—9 月 23 日 举办地点:云南·昆明 举办方:知行教师发展平台 参与人员:苏永康(上海交通大学)、张翼然(湖南农业大学) 相关内容: 工具推荐:Bot.360.com 多模型竞技,选取最佳答案;用 heyGen 定制“数字分身”。 智慧课程设计方面:包括 AI 助力教学设计、生成式 AI 对课件制作与微课生成的变革、学情分析与作业测评中 AI 的引领作用、教育数字化转型中的人机协同创新、数据智能化中 AI 对数据收集与可视化的加速,以及案例分析与实践反馈。 学情分析与作业测评方面:主观题 AI 辅助批改的策略与实践,以及 Q&A AI 助力作业测评的未来想象,并分享了相关案例。 人工智能深度融入教学过程:由张翼然(湖南农业大学教育学院教育技术系副教授,拥有国家教学成果奖、国家级和省级精品在线课程、省级教学竞赛一等奖、省级金课,是苹果认证教师、技术派教师)进行讲解。
2025-01-11
有没有一种可以根据我的教学大纲生成一个课程海报的工具
以下为您介绍几种可以根据教学大纲生成课程海报的工具及相关操作: 1. COZE 应用: 访问地址:https://www.coze.cn/s/iDsBwYLF/ 功能包括生成教案、趣味课堂、课后作业、教案 PPT、作业批改等。 教案 PPT 内容基于前面生成的教学大纲,可能需要手动进行少许内容修正。 下载 PPT 可能需要充值。 2. 在线生图定制主题海报: 操作步骤: 选择模型,如例图 4 选择儿童>皮克斯。 输入画面描述,按主体+氛围+视角+画质的顺序输入关键词,可使用自选关键词,并用括号强调关键词。 选择画面大小,制作主题海报可选择 9:16 的宣传海报比例和 17283072 的分辨率。 进行其他设置,增加作图数量可一次性生成多幅图片方便挑选。 优化海报可使用可画(https://www.canva.cn/?displaycomoption=true)在线编辑。 希望以上内容对您有所帮助。
2025-01-08
SD模型
Stable Diffusion(SD)模型是由 Stability AI 和 LAION 等公司共同开发的生成式模型,参数量约 1B,可用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等任务。 文生图任务是将文本输入到 SD 模型,经过一定迭代次数生成符合描述的图片。例如输入“天堂,巨大的,海滩”,模型生成美丽沙滩图片。 图生图任务在输入文本基础上再输入一张图片,模型根据文本提示重绘输入图片使其更符合描述,如在沙滩图片上添加“海盗船”。 输入的文本信息需通过“桥梁”CLIP Text Encoder 模型转换为机器数学信息。该模型作为 SD 模型中的前置模块,将输入文本编码生成 Text Embeddings 特征矩阵,用于控制图像生成。 目前 SD 模型使用的是中的 Text Encoder 模型,其只包含 Transformer 结构,由 12 个 CLIPEncoderLayer 模块组成,模型参数大小为 123M,输出 Text Embeddings 的维度为 77x768。 以下是相关资源获取方式: SD 模型权重:关注 Rocky 的公众号 WeThinkIn,后台回复“SD 模型”,可获得包含多种模型权重的资源链接。 SD 保姆级训练资源:关注 Rocky 的公众号 WeThinkIn,后台回复“SDTrain”,可获得包含数据处理、模型微调训练及基于 SD 的 LoRA 模型训练代码等全套资源。 Stable Diffusion 中 VAE、UNet 和 CLIP 三大模型的可视化网络结构图:关注 Rocky 的公众号 WeThinkIn,后台回复“SD 网络结构”,即可获得网络结构图资源链接。
2025-01-22
到今天,大语言模型还会产生“幻觉”吗
截至今天,大语言模型仍会产生“幻觉”。 大语言模型偶尔会根据输入输出一些荒谬或不符合事实的内容,目前各家大语言模型在该问题上的表现都不尽如人意。产生“幻觉”的原因包括: 1. 样本存在错误(Imitative Falsehoods):如果大语言模型学习的“教材”中有错误,它也容易给出错误回答。缓解该问题的一个办法是上采样(Up Sampling)。 2. 信息过时(Outdated Factual Knowledge):以前正确的信息现在可能过时了。 此外,大语言模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。如果在其训练过程中,模型被暴露于大量知识之中,它并没有完美地记忆所见到的信息,并不十分清楚自己的知识边界,可能会尝试回答有关深奥话题的问题,并虚构听起来有道理但实际不正确的内容。 在构建应用程序时,可以使用一些技术来避免这种情况,例如要求模型先从文本中找到相关引文,然后使用引文回答问题,并将答案追溯回源文件,这通常有助于减少“幻觉”的发生。
2025-01-22
本地部署大模型
以下是关于本地部署大模型的详细步骤: 1. 部署大语言模型: 下载并安装 Ollama: 根据电脑系统,从 https://ollama.com/download 下载 Ollama。 下载完成后,双击打开,点击“Install”。 安装完成后,将 http://127.0.0.1:11434/ 复制进浏览器,若出现相关字样则表示安装完成。 下载 qwen2:0.5b 模型(若设备充足可下载更大模型): Windows 电脑:点击 win+R,输入 cmd 点击回车。 Mac 电脑:按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,选择“终端”应用程序。 复制相关命令行,粘贴进入并回车,等待自动下载完成。 2. ComfyUI ollama 本地大模型部署: 先下载 ollama 安装,安装完成后可在电脑桌面右下角或隐藏图标中找到。 下载对应的模型,选择模型并复制对应的命令。 打开命令行界面,输入对应的模型获取命令,等待下载完成。 模型下载后会保存到 D:\\ollama\\blobs 。 进行 docker 安装,安装会下载一些文件,安装后更改目录,不要放在 C 盘。 进行 Open webui 安装,输入相关命令,安装成功后回到 docker,点击会自动打开网页,第一次使用需注册账号,选择下载好的模型即可开始使用。 3. 错误解决: 端口占用问题,在 Windows 上可能出现,运行相关两条命令可解决。 4. 相关链接: comfyuiollama:https://github.com/stavsap/comfyuiollama?tab=readmeovfile Ollama:https://ollama.com/ docker:https://www.docker.com/ Open webui:https://openwebui.com/ 此外,还有一篇思路来源于视频号博主黄益贺的相关内容,作者按照其视频进行了实操并附加了一些关于 RAG 的额外知识。文中提到读完本文可以学习到如何使用 Ollama 一键部署本地大模型、通过搭建本地聊天工具了解 ChatGPT 信息流转、RAG 的概念及核心技术、通过 AnythingLLM 软件搭建完全本地化的数据库等内容。虽然大多数人不需要自己部署大模型,但期望通过本文的指导能够折腾一遍,从而做到知其然且知其所以然。
2025-01-22
大模型评分
大模型评分通常会根据不同的赛事或评估体系有所差异。 在金融行业的大模型挑战赛中,评测任务形式为给定一组参考文档和问题,要求模型按指定格式生成答案。赛事主办方会根据选手提供的回答与参考答案对比,并根据关键字段命中情况进行评分。评分公式涉及关键词命中总次数、关键词总数、小题数和得分等参数。例如在示例问题中,根据每个小题的回答正确情况计算得分,完全正确得满分 1 分,部分正确则根据命中比例计算得分。 在其他的大模型评估方面: FlagEval(天秤)大模型评测体系及开放平台,旨在建立科学、公正、开放的评测基准、方法、工具集,创新构建了“能力任务指标”三维评测框架,细粒度刻画基础模型的认知能力边界,可视化呈现评测结果。地址:https://github.com/FlagOpen/FlagEval 。 CEval 构造了一个覆盖多个学科的中文知识和推理型测试集,并给出了当前主流中文 LLM 的评测结果。地址:https://github.com/SJTULIT/ceval 。 SuperCLUElyb 是中文通用大模型匿名对战评价基准,以众包方式提供匿名、随机的对战,并发布了初步结果和基于 Elo 评级系统的排行榜。地址:https://github.com/CLUEbenchmark/SuperCLUElyb 。 斯坦福发布的大模型排行榜 AlpacaEval 支持两种模式的模型评估方式:alpaca_eval 和 alpaca_eval evaluate_from_model 。评测过程分为选择评估集并计算输出、计算 golden 输出、通过指定的自动标注器计算胜率等步骤。相对于人工标注,全自动化的 AlpacaEval 具有较低的经济成本和时间成本。
2025-01-22
有哪些能够本地部署的AI视频生成模型
以下是一些能够本地部署的 AI 视频生成模型: 1. Stable Video Diffusion 模型: 准备工作:手动下载相关内容,分别放到指定路径。 模型选择:点击下拉箭头选择不同模型版本,勾选 load Model。 视频创作:支持图生视频,图片来源可选择 Midjourney、Stable Diffusion 等生成的图片,上传到 SVD 进行视频生成,可调节左侧参数控制效果。 保存路径:生成的视频在 outputs 下。 2. LTXVideo 模型: 基于 2B 参数 DiT,能够以 768x512 分辨率生成 24 FPS 的视频,速度比观看还快。 专为 RTX 4090 等 GPU 优化,使用 bfloat16 精度,实现高效内存使用且不影响质量。 ComfyUI 现已支持该模型,用户只需下载模型文件并获取工作流即可在本地运行。 3. Sora 模型: 功能:文生视频、图生视频、视频生视频,支持多种视频定制选项,如分辨率、视频长度和视频风格;具有故事板功能,允许用户通过时间线指导视频中的多个动作;提供混音和编辑功能,包括视频混音、延伸和剪辑、创建循环视频等;还有混合功能,可将两个视频场景合并成一个新的场景。 费用和订阅套餐:对于拥有 OpenAI Plus 或 Pro 账户的用户,使用包含在现有订阅中。OpenAI Plus 订阅每月 50 次视频生成次数,OpenAI Pro 订阅无限次慢速队列生成,500 次正常速度的视频生成次数。用户可根据需要选择更高分辨率的视频生成,但可能会减少每月使用次数。发布初期,某些地区(如欧洲和英国)可能会有延迟。
2025-01-21
国内文生图模型
以下是关于国内文生图模型的相关信息: Recraft 模型:用 8 个月自研模型,包含处理数据的模型、标注工作、训练 OCR 模型、新构建的数据集等。Recraft 生成带有长文本图像的流程图解,但存在生成默认是外国面孔而非亚洲面孔且生成的亚洲人不太自然的情况,可能与数据集有关。只有少数公司真正从头训练模型,创建自己的模型困难且成本高,需要超强团队和资金。 模型能力方面: 文本编码器的能力是文生图模型语义理解能力的关键。一开始大部分模型使用 CLIP 作为文本编码器,但存在一些问题。新的模型纷纷优化文本编码器能力,如引入更大更强的 T5XXL 或结合多个特征,但开源模型在中文生图方面能力一般。 腾讯开源的 HunyuanDiT 是较可用的中文生图模型,但仍存在优化空间。 Kolors 是最近开源的给力文生图模型,改进全面,技术实力强。
2025-01-21