Chat with Wiki - 音频生成会议纪要

Answer

以下是关于音频生成会议纪要的相关内容：

使用钉钉闪记生成会议纪要的步骤：

第一步打开钉钉闪记。
结束录音后点击“智能识别”。
点击智能摘要，即可获得本次会议的纪要。
如果需要更多内容，复制所有文案或下载文本文件到https://kimi.moonshot.cn/GPT、GLM、通义千问等大语言模型对话框中，再将会议内容发送。

该场景对应的关键词库包括：会议主题、参与人员、讨论议题、关键观点、决策、时间、地点、修改要求、文本格式、语言风格、列表、段落。

提问模板有：

第一步：用飞书会议等软件整理好会议记录，并分段式发给 ChatGPT 生成总结：
- 请根据以下会议资料，整理会议的关键信息，包括：会议主题、参与人员、讨论议题、关键观点和决策。
- 会议资料：
  - 时间：XXX 年 XXX 月 XXX 日
  - 地点：XXXX
  - 参与人员：XXX、XXX
  - 会议主题：XXXX
  - 讨论内容：
    - Speaker1：XXX
    - Speaker2：XXX
    - Speaker3：XXX
第二步：检查生成的总结：
- 请根据我提供的会议补充信息和修改要求，对 XXX 部分进行修改：
  - 会议补充信息：XXXX
  - 修改要求：XXXX
第三步：优化文本格式和风格
- 请将生成的总结，以 XXX 形式呈现（例如：以列表的形式、以段落的形式、使用正式/非正式的语言风格）
- 请给上述会议总结，提供修改意见，并根据这个修改意见做最后的调整

另外，在基础通识课的智能纪要章节中：

先介绍了视频生成原理及视频体积占比等内容，然后回顾 Meta 模型。Meta 的模型能生成视频和声音，细节处理很棒，可以替换物体、换脸等，其视频生成模型将 diffusion 架构换成纯 Transformer 架构，基于 LLAMA3 训练，在图像文本对齐等方面与其他方式存在区别，还采用流式训练提高速度和质量。
提到 Transformer 模型的流匹配、Sono 音频生成工具与豆包声音克隆功能。本章节提到可以查看完整论文中的原理部分，其基于 Transformer 模型的流匹配优于扩散模型。还介绍了 Sono 音频生成工具，输入简单提示词就能创作音乐。另外，提到豆包 APP 端可创建 AI 智能体，创建个人声音并录制念文本就能做声音训练，用自己声音对话。
首先提到 Notebook LN 项目，然后重点讲述端测大模型，包括其可部署在多种设备、参数量小、可利用设备自身芯片运算、参数量和计算复杂度被减少的方式等，还介绍了知识蒸馏模型，最后提到 AI 工程平台及其典型例子 define。

Content generated by AI large model, please carefully verify (powered by aily)

References

办公：会议总结

通义听悟｜飞书妙记｜钉钉闪记都可以录音转文字，以下以钉钉闪记为例[heading3]1.第一步打开钉钉闪记[heading3]2.结束录音后点击“智能识别”[heading3]3.点击智能摘要，就可以获得本次会议的纪要了[heading3]4.如果需要更多内容[content]复制所有文案或下载文本文件到[https://kimi.moonshot.cn/](https://kimi.moonshot.cn/)GPT，GLM，通义千问等大语言模型对话框中，再将会议内容发送[heading3]该场景对应的关键词库（12个）：[content]会议主题、参与人员、讨论议题、关键观点、决策、时间、地点、修改要求、文本格式、语言风格、列表、段落。[heading3]提问模板（3个）：[content]第一步：用飞书会议等软件整理好会议记录，并分段式发给ChatGPT生成总结：提问模板：请根据以下会议资料，整理会议的关键信息，包括：会议主题、参与人员、讨论议题、关键观点和决策。会议资料：1、时间：XXX年XXX月XXX日2、地点：XXXX3、参与人员：XXX、XXX4、会议主题：XXXX5、讨论内容：Speaker1：XXXSpeaker2：XXXSpeaker3：XXX第二步：检查生成的总结：提问模板：请根据我提供的会议补充信息和修改要求，对XXX部分进行修改：1、会议补充信息：XXXX2、修改要求：XXXX第三步：优化文本格式和风格提问模板：1、请将生成的总结，以XXX形式呈现（例如：以列表的形式、以段落的形式、使用正式/非正式的语言风格）2、请给上述会议总结，提供修改意见，并根据这个修改意见做最后的调整

02-基础通识课

[heading2]智能章节本章节先介绍了视频生成原理及视频体积占比等内容，然后回顾Meta模型。Meta的模型能生成视频和声音，细节处理很棒，可以替换物体、换脸等，其视频生成模型将diffusion架构换成纯Transformer架构，基于LLAMA3训练，在图像文本对齐等方面与其他方式存在区别，还采用流式训练提高速度和质量。[01:29:03](https://waytoagi.feishu.cn/minutes/obcn8c6pm95g22581ei4p1l4?t=5343000)Transformer模型的流匹配、Sono音频生成工具与豆包声音克隆功能本章节提到可以查看完整论文中的原理部分，其基于Transformer模型的流匹配优于扩散模型。还介绍了Sono音频生成工具，输入简单提示词就能创作音乐。另外，提到豆包APP端可创建AI智能体，创建个人声音并录制念文本就能做声音训练，用自己声音对话。[01:31:00](https://waytoagi.feishu.cn/minutes/obcn8c6pm95g22581ei4p1l4?t=5460000)端侧大模型相关概念及AI工程平台简述本章节首先提到Notebook LN项目，然后重点讲述端测大模型，包括其可部署在多种设备、参数量小、可利用设备自身芯片运算、参数量和计算复杂度被减少的方式等，还介绍了知识蒸馏模型，最后提到AI工程平台及其典型例子define。[01:35:20](https://waytoagi.feishu.cn/minutes/obcn8c6pm95g22581ei4p1l4?t=5720000)AI工程平台相关概念及AI对工作流的影响