以下是为您仿写的一套试题:
一、AI 在教育中的应用
二、Kimi 的 prompt 技巧
三、GPT-4.5 的评估
先上几张作业单截图,请大家先猜猜这个作业单有多少是AI生成的。嗯,除了排版,AI率为100%。2022年教育部颁布的新课程标准里提到「开展差异化教学」,「加强个别指导」。这个愿望是美好的,但是一线教师有着繁重的行政任务,根本不可能有精力去为每个学生量身定制。但现在,我们借助大模型使得个性化学习、定制化作业变得不再是部分家庭的专属。只要提示词到位,示例清晰,AI非常善于模仿测试题(高学段理科可能还够呛)。我试过让它模仿中高考,托福雅思,SAT(美国高考),GRE(美国研究生入学考),都模仿得有模有样。这意味着,教师拥有AI就拥有了源源不断的真题库。学生也拥有了源源不断的错题练习库。我以一种题型为例。[heading4]1、选词填空出题小助手(教学评估)[content]英语学科这个提示词的逻辑,可以迁移到语文学科(文心一言或者Kimi等国产大模型也可以用)感谢社群的蕾蕾老师在方法论上的支持。GPT 4.0的实测输出。
当然,要获得对知识点掌握程度的了解,最直接的方式就是“做卷子”,这是我们从小到大学校教育根深蒂固植入脑海的。那么,就让Kimi出题吧:Kimi真是一个耿直boy,直接把题的答案一起给出来了。还是一道题一道题来吧:可以随时让它告诉你得分情况:或者随时终止测试:[heading3]Kimi-费曼学习法[content]为了更加深入地掌握知识,一个常用的方法是“费曼学习法”。就是通过向别人讲解你对一个知识点的认识,以教带学,在解释不清楚时再返回去进一步学习:Kimi可以变成实践“费曼学习法”的绝佳拍档。你可以先做听众,让它给你解释某个概念,自己不算发问,从而加深对知识的理解:Kimi会使用一些简单易懂的比喻来解释“反向传播”的概念,这时候我可以对它的解释加以质疑,进而进行讨论:当然,更具挑战的是让Kimi作为听众,你作为解释者:它想要知道CNN是什么概念?我也用类比的方式做了解释,Kimi发表了评述并进一步追问:通过对这些问题的进一步探讨,可以将我引到知识的深处。
We also evaluate models on a set of 87 multiple choice questions that require expert and tacit knowledge,connections between fields,and additional calculations.These questions were grouped into the following nine topics:radiological exposure,dispersal device design and engineering,sabotage of nuclear power infrastructure,sabotage of non-power nuclear/radiological infrastructure,acquisition of legal radioisotopes which may be repurposed,illicit acquisition of industrial15radionuclides,illicit acquisition of medical radionuclides,evasion of CWMD detectors,development of enrichment technology,and development of improvised nuclear devices.We see significant improvement from GPT-4o to GPT-4.5,at a 9% uplift.Post-mitigation deep research is the highest scoring model at 74%.Evaluation questions for both the contextual nuclear knowledge evaluation and radiological and nuclear expert knowledge evaluation were written by Dr.Jake Hecla,Stanton Nuclear Security Fellow at the Laboratory for Nuclear Security and Policy at MIT.Hecla completed his PhD in Nuclear Engineering at UC Berkeley.