Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

你可以帮我总结一段AI发展历史吗

Answer

AI 技术的发展历程大致可分为以下几个阶段:

  1. 早期阶段(1950s - 1960s):包括专家系统、博弈论、机器学习初步理论。
  2. 知识驱动时期(1970s - 1980s):以专家系统、知识表示、自动推理为主要特点。
  3. 统计学习时期(1990s - 2000s):出现了机器学习算法,如决策树、支持向量机、贝叶斯方法等。
  4. 深度学习时期(2010s - 至今):深度神经网络、卷积神经网络、循环神经网络等技术得到广泛应用。

当前 AI 的前沿技术点包括:

  1. 大模型,如 GPT、PaLM 等。
  2. 多模态 AI,如视觉 - 语言模型(CLIP、Stable Diffusion)、多模态融合。
  3. 自监督学习,如自监督预训练、对比学习、掩码语言模型等。
  4. 小样本学习,包括元学习、一次学习、提示学习等。
  5. 可解释 AI,涉及模型可解释性、因果推理、符号推理等。
  6. 机器人学,涵盖强化学习、运动规划、人机交互等。
  7. 量子 AI,包含量子机器学习、量子神经网络等。
  8. AI 芯片和硬件加速。

此外,还有一些关于 AI 发展的相关文章,如《机器之心的进化/理解 AI 驱动的软件 2.0 智能革命》,从关键人物推动的学术进展、算法和理念的涌现、公司和产品的进步、还有脑科学对神经网络的迭代影响这四个维度来深刻理解“机器之心的进化”。《走入 AI 的世界》中提到过去的 AI 多完成人脸识别等分类判断任务,而生成式 AI 的诞生在写文章、画画、写歌等方面展现出类似人类的智慧。

Content generated by AI large model, please carefully verify (powered by aily)

References

问:AI的技术历史和发展方向,目前最前沿的技术点有哪些

AI技术的发展历程和前沿技术点可以概括如下:[heading2]AI技术发展历程[content]1.早期阶段(1950s-1960s):专家系统、博弈论、机器学习初步理论2.知识驱动时期(1970s-1980s):专家系统、知识表示、自动推理3.统计学习时期(1990s-2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)4.深度学习时期(2010s-至今):深度神经网络、卷积神经网络、循环神经网络等[heading2]当前AI前沿技术点[content]1.大模型(Large Language Models):GPT、PaLM等2.多模态AI:视觉-语言模型(CLIP、Stable Diffusion)、多模态融合3.自监督学习:自监督预训练、对比学习、掩码语言模型等4.小样本学习:元学习、一次学习、提示学习等5.可解释AI:模型可解释性、因果推理、符号推理等6.机器人学:强化学习、运动规划、人机交互等7.量子AI:量子机器学习、量子神经网络等8.AI芯片和硬件加速

机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命

就在过去几个月里,因为美联储的加息,科技公司的资本狂欢宣告结束,美国上市的SaaS公司股价基本都跌去了70%,裁员与紧缩是必要选项。但正当市场一片哀嚎的时候,Dall-E 2发布了,紧接着就是一大批炫酷的AI公司登场。这些事件在风投界引发了一股风潮,我们看到那些兜售着基于生成式AI(Generative AI)产品的公司,估值达到了数十亿美元,虽然收入还不到百万美元,也没有经过验证的商业模式。不久前,同样的故事在Web 3上也发生过!感觉我们又将进入一个全新的繁荣时代,但人工智能这次真的能带动科技产业复苏么?本文将带你领略一次人工智能领域波澜壮阔的发展史,从关键人物推动的学术进展、算法和理念的涌现、公司和产品的进步、还有脑科学对神经网络的迭代影响,这四个维度来深刻理解“机器之心的进化”。先忘掉那些花里胡哨的图片生产应用,我们一起来学点接近AI本质的东西。全文共分为六个章节:1.AI进化史-前神经网络时代、Machine Learning的跃迁、开启潘多拉的魔盒2.软件2.0的崛起-软件范式的转移和演化、Software 2.0与Bug 2.03.面向智能的架构- Infrastructure 3.0、如何组装智能、智能架构的先锋4.一统江湖的模型- Tran sformer的诞生、基础模型、AI江湖的新机会5.现实世界的AI -自动驾驶新前沿、机器人与智能代理6.AI进化的未来-透视神经网络、千脑理论、人工智能何时能通用?文章较长,累计22800字,请留出一小时左右的阅读时间,欢迎先收藏再阅读!文中每一个链接和引用都是有价值的,特别作为衍生阅读推荐给大家。

走入AI的世界

过去的其他AI,更多的应用成果是完成诸如人脸识别这样分类判断的任务,虽然方便了我们的生活,但在使用的过程中,我们能够清晰的感受到他不是人,而是充满机器感的僵硬程序。生成式AI的诞生,让我们看到原来AI可以和人一样创作交流,他没有像一些人期待的那样,最先做好擦桌子扫地的基础工作任务,而是在写文章、画画、写歌等方面涌现出人类般的智慧,其表现出的惊人能力,把一众平凡的人类个体“碾压的渣都不剩”。图4什么是生成式AI-1篇幅所限,更多有趣的知识和故事我们不做更多的展开了,关于AI发展史,我们就聊到这里。

Others are asking
开发软件 系统规划,哪个AI工具最适合
以下是一些适合用于绘制逻辑视图、功能视图、部署视图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑、功能和部署视图,用户可通过拖放轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源建模语言,与 Archi 工具配合使用,支持逻辑视图创建。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑、功能和部署视图等。 6. draw.io(现称为 diagrams.net):免费在线图表软件,允许创建各种类型图表,包括逻辑和部署视图。 7. PlantUML:文本到 UML 转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑和部署视图。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑和部署视图。 需要注意的是,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,应考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。 此外,对于软件项目经理,以下是一些适合的 AI 工具: 1. 项目管理和任务跟踪工具:如 Jira、Trello 等,已开始集成 AI 功能,辅助制定计划、分配任务、跟踪进度等。 2. 文档和协作工具:微软的 Copilot 可集成到 Office 套件中,为项目文档撰写、编辑等提供 AI 助手功能。一些云存储服务如 Google Drive 也开始提供 AI 驱动的文档管理和协作功能。 3. 风险管理和决策支持工具:一些 AI 工具可帮助识别和分析项目风险,并提供决策建议。 4. 沟通和协作工具:AI 助手可辅助进行团队沟通协调、客户关系维护等。 5. 创意生成工具:如文心一格、Vega AI 等,可以帮助快速生成创意图像素材。 随着 AI 技术的发展,越来越多的工具正在为软件项目经理提供智能化的辅助功能,涵盖项目管理的各个环节,有助于提高工作效率和决策能力。
2025-01-10
AI agent
以下是关于 AI Agent 的相关信息: 当您经常使用各种 AI 聊天工具但觉得不够用时,希望大模型搭配更多工具和能力以提供更稳定服务和输出,就可以关注 AI Agent 板块。 百宝箱是来自阿里系的一款 AI Agent 相关产品。登录链接为:https://tbox.alipay.com/proabout 。如果您是不会写代码、对 AI Agent 毫无使用经验的小白,或者看到宣传想尝试百宝箱的使用方法和能力,这篇分享可能对您有帮助。 测试百宝箱的原因是作者所在的小队伍“来都来了”参加比赛,发现其大力搞比赛所以一试究竟。 百宝箱当前大模型随便用,如通义千问·Max、月之暗面、智谱、百灵等,且统统免费。 在文旅和传媒方面,支付宝为百宝箱提供了天然渠道。作者刚好考虑在这方面探索,试用时看到相关标签栏露出,期待其带来渠道和流量。由于刚推广,力度较大。 此外,为您提供一些生成式人工智能的相关链接: Ask a Techspert:What is generative AI? https://blog.google/insidegoogle/googlers/askatechspert/whatisgenerativeai/ Build new generative AI powered search&conversational experiences with Gen App Builder: https://cloud.google.com/blog/products/aimachinelearning/creategenerativeappsinminuteswithgenappbuilder What is generative AI? https://www.mckinsey.com/featuredinsights/mckinseyexplainers/whatisgenerativeai Google Research,2022&beyond:Generative models: https://ai.googleblog.com/2023/01/googleresearch2022beyondlanguage.htmlGenerativeModels Building the most open and innovative AI ecosystem: https://cloud.google.com/blog/products/aimachinelearning/buildinganopengenerativeaipartnerecosystem Generative AI is here.Who Should Control It? https://www.nytimes.com/2022/10/21/podcasts/hardforkgenerativeartificialintelligence.html Stanford U&Google’s Generative Agents Produce Believable Proxies of Human Behaviors: https://syncedreview.com/2023/04/12/stanfordugooglesgenerativeagentsproducebelievableproxiesofhumanbehaviours/ Generative AI:Perspectives from Stanford HAI: https://hai.stanford.edu/sites/default/files/202303/Generative_AI_HAI_Perspectives.pdf Generative AI at Work: https://www.nber.org/system/files/working_papers/w31161/w31161.pdf
2025-01-10
有没有可以观看英文视频直接即时翻译的AI
以下是一些与观看英文视频直接即时翻译相关的 AI 应用和解决方案: 1. GPT 在官方发布的视频中,能够为英语用户和西班牙语用户进行实时翻译,具有近乎惊人的反应速度。 2. 开发的 AI 双语字幕方案: 用 whisper 生成原视频的英文字幕。 让 GPT 结合字幕全文翻译,并根据原英文字幕的拆分,将译文进行同样行数的拆分。 将 GPT 译文拆分的结果插入到原英文字幕文件中形成新的双语字幕文件。 3. 100 个 AI 应用中的相关例子,如科大讯飞翻译耳机,能够实现实时语言翻译,方便交流。 希望这些信息对您有所帮助。
2025-01-10
有没有可以观看英文视频直接翻译的AI
以下是一些可以观看英文视频直接翻译的 AI 相关信息: 一种解决方案是:先用 whisper 生成原视频的英文字幕,预设 whisper 生成的字幕没问题(whisper 的问题不探讨);然后让 GPT 结合字幕全文翻译,并让其根据原英文字幕的拆分,将译文进行同样行数的拆分;最后将 GPT 译文拆分的结果插入到原英文字幕文件中形成一个新的双语字幕文件。这个过程中所有的执行脚本都是让 GPT 写的。 以下是几个视频 AIGC 工具: Opusclip:利用长视频剪成短视频。 Raskai:短视频素材直接翻译至多语种。 invideoAI:输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:屏幕/播客录制>PPT 方式做视频。 veed.io:自动翻译自动字幕。 clipchamp:微软的 AI 版剪映。 typeframes:类似 invideoAI,内容呈现文本主体比重更多。 google vids:一口大饼。
2025-01-10
总结一下24年国产AI大模型的主要进展
2024 年国产 AI 大模型的主要进展包括: 9 月: 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 21 日:大模型测试基准研究组正式成立。 23 日:钉钉 365 会员上线。 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 国内大模型落地情况: 2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。大模型的竞争,正在加速成为体系化之战。
2025-01-09
国产AI大模型的应用
国产 AI 大模型的应用主要体现在以下几个方面: 1. 百度文心大模型:在 2024 年大模型中标项目数量和金额大幅增长,凭借 40 个中标项目和 2.74 亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业应用广泛。其落地需要全栈技术能力支持,百度智能云通过完善的 AI 基础设施整合全栈技术,获得广泛行业认可。 2. Qwen 系列:是国内唯一出现在 OpenAI 视野里、可以参与国际竞争的国产大模型。在 OpenAI 认可的榜单中表现出色,多次冲进榜单,得分不断提高。其开源模型累计下载量突破 1600 万,国内外有海量开发者基于其开发模型和应用。 3. 免费的大模型 APP:包括 Kimi 智能助手、文心一言、通义千问。 Kimi 智能助手:由 Moonshot AI 出品,具有超大“内存”,能读长篇小说和上网冲浪。 文心一言:百度出品的 AI 对话产品,定位为智能伙伴,能写文案、想点子、聊天和答疑解惑。 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。 此外,还有如“非遗贺春”魔多蛇年春节 AI 模型创作大赛等相关活动。
2025-01-09
哪个AI工具可以对音频内容进行总结
以下是一些可以对音频内容进行总结的 AI 工具: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 3. 讯飞听见(https://www.iflyrec.com/):讯飞旗下智慧办公服务平台。 4. Otter AI(https://otter.ai/):转录采访和会议纪要。 5. BibiGPT·AI 音视频内容一键总结(https://b.jimmylv.cn/) 6. 15 个值得一试的 YouTube 视频摘要 AI 工具(https://nealschaffer.com/youtubevideosummarizerai/) 7. summarize.tech:AIpowered video summaries(https://www.summarize.tech/) 8. NotebookLM:最早主打的是智能笔记,上传文件之后会自动生成概览性的总结。用户可以在对话框里,根据上传文本的内容,直接用文字提问。支持长文本,语言目前只支持英文。
2025-01-07
哪个AI可以对音频进行总结
以下是一些可以对音频进行总结的 AI 工具和公司: 声音检测方面: :通过更强的听觉感知创造卓越的人类体验。 :先进的声音识别解决方案,能够分类如尖叫、枪声、咳嗽和哭泣等声音。 :下一代声音 AI 平台,能够像人类一样理解任何声音。 :语音控制的家庭自动化系统。 :世界上首个智能家居听觉系统。 :可用于从音频源中提取隐藏数据的 AI 模型。 :无需键盘、按钮或触摸屏,无缝融合物理世界和数据世界。 :为手机、VR/AR 头戴设备、智能手表、扬声器和笔记本电脑提供上下文感知。 :智能音频穿戴设备。 :我们将声音转化为信息。 :使用先进的深度学习技术进行声音事件检测和上下文识别,为世界上的每一个声音赋予意义。 语音增强与操作方面: :实时语音和口音转换流媒体服务。 :为高效在线会议提供的 AI 驱动软件解决方案。 :免费的实时语音变换器。 :为创作者、开发者和虚拟会议提供的降噪产品。 :软件在复杂声学环境中提升语音的清晰度和可懂度。 :不制作音频,让音频更好。 :会议和音频的降噪。 :采用最先进的 AI 技术消除视频会议通话中的所有背景噪音。 :一套 AI 驱动的音频质量增强工具。 :将智能手机变成高级语音增强设备的应用程序。 :去除干扰性背景噪音的智能手机应用程序。 :用于音频和语音产品的智能音频解决方案。 :通过引入机器学习功能来革新麦克风。 :生成式 AI 音频增强。 音视频总结方面:
2025-01-07
我想要设计一个以班级期末总结为主题的40分钟班会课,请你帮我推荐一下有哪些AI软件可以完成这项任务
目前没有专门针对设计班级期末总结主题班会课的特定 AI 软件。但您可以借助一些通用的工具来辅助您完成,例如: 1. 文字处理工具,如 Microsoft Word 或 WPS,帮助您撰写班会课的流程和内容。 2. 思维导图工具,如 XMind 或百度脑图,用于梳理班会课的框架和要点。 3. 演示文稿工具,如 Microsoft PowerPoint 或 Keynote,制作展示用的 PPT 来辅助讲解。 希望这些建议对您有所帮助。
2025-01-07
在中国能使用的,可以总结一本书精华的AI软件
目前在中国可以使用的能够总结一本书精华的 AI 软件相对较少。一些常见的具有文本处理和分析能力的 AI 工具,如百度的文心一言、字节跳动的云雀等,可能在一定程度上辅助您进行书籍内容的理解和总结,但专门用于精准总结一本书精华的成熟软件还比较有限。
2025-01-05
在中国可以总结一本书精华的AI 软件
目前在中国,尚未有一款被广泛认可且专门用于总结一本书精华的 AI 软件。但一些通用的 AI 语言模型,如百度的文心一言、阿里的通义千问等,在一定程度上可以辅助您进行书籍内容的总结和理解。您可以通过输入书籍的相关内容,让它们为您生成概括性的文字。不过,其总结效果可能因输入内容的质量和复杂性而有所不同。
2025-01-05
请你给我提供一段coze工作流节点中,代码示例
以下是 Coze 工作流节点中的一些代码示例: 把段落按换行符(/n)拆分成数组的代码示例。 在大模型节点通过提示词和示例,让大模型直接输出数组。 使用文本处理(文本分隔)。 在 Coze 工作流中搭建框架时,首先进入 Coze,点击「个人空间工作流创建工作流」打开弹窗,根据弹窗要求自定义工作流信息,点击确认完成新建。左侧「选择节点」模块中,根据子任务需要,实际用到的有插件(提供能力工具)、大模型(实现文本内容生成)、代码(支持编写简单脚本处理数据)。按照流程图在编辑面板中拖入对应的 LLM 大模型、插件、代码节点即可完成框架搭建。
2025-01-07
我有一段视频,是法语的。要配上法语的字幕,要用什么软件
以下是一些可以为法语视频配上法语字幕的软件推荐: 1. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频精准识别,能翻译字幕生成双语字幕,已处理 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:一站式专业视频自动字幕编辑器,提供字幕制作和翻译服务,支持 95 种语言,准确率高达 98%,可自定义字幕样式。 3. Arctime:能对视频语音自动识别并转换为字幕,支持自动打轴,支持 Windows 和 Linux 等主流平台及 SRT 和 ASS 等字幕功能。 4. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 以上工具各有特点,您可根据自身需求选择最适合的。内容由 AI 大模型生成,请仔细甄别。
2024-12-31
可以绘图的AI工具,实现将我的一段话转换成流程图
以下是一些可以将一段话转换成流程图的 AI 绘图工具及使用步骤: 工具: 1. Lucidchart: 注册并登录: 选择模板:在模板库中搜索“项目管理流程图” 编辑图表:根据项目需求添加和编辑图形和流程步骤 优化布局:利用 AI 自动布局功能优化图表外观 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式 2. Creately: 简介:在线绘图和协作平台,利用 AI 功能简化图表创建过程,适合绘制流程图、组织图、思维导图等 功能:智能绘图功能,可自动连接和排列图形;丰富的模板库和预定义形状;实时协作功能,适合团队使用 官网: 3. Whimsical: 简介:专注于用户体验和快速绘图的工具,适合创建线框图、流程图、思维导图等 功能:直观的用户界面,易于上手;支持拖放操作,快速绘制和修改图表;提供多种协作功能,适合团队工作 官网: 4. Miro: 简介:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制,如思维导图、用户流程图等 功能:无缝协作,支持远程团队实时编辑;丰富的图表模板和工具;支持与其他项目管理工具(如 Jira、Trello)集成 官网: 使用步骤: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求,添加并编辑图形和文字。利用 AI 自动布局功能优化图表布局。 5. 协作和分享:如果需要团队协作,可以邀请团队成员一起编辑。完成后导出并分享图表。 此外,以下工具可以用于绘制逻辑视图、功能视图、部署视图: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可使用拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具一起使用,该工具提供图形化界面创建 ArchiMate 模型。 4. Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现在称为 diagrams.net):免费的在线图表软件,允许用户创建各种类型的图表,包括软件架构图,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本来自动生成序列图、用例图、类图等,从而帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。
2024-12-28
我想用AI做一个人物访谈录发在公众号上,请帮我生成一段200字的简介
以下是为您生成的 200 字左右的人物访谈录简介: 南瓜博士首次写小说获奖,背后离不开 AI 的助力。他先让 AI 写故事概要和角色背景介绍并做修改,还采用让 AI 以表格形式输出细节描述的技巧,打破叙事习惯,方便局部调整,确保都是具体细节。之后将生成的表格串联成文,过程中偶尔给出建议。然而,因小说字数超 2000 字,修改时 GPT4 记性不好,Claude 又改丢关键情节。但最终,在与 AI 的合作与磨合中,南瓜博士成功获奖,展现了 AI 在创作中的独特作用与挑战。
2024-12-26
我有一段视频,希望能够生成文字 有什么好用免费的工具
以下是一些可以将视频生成文字的免费工具: 1. 飞书妙记:飞书的办公套件之一,网址为 https://www.feishu.cn/product/minutes 。 2. 通义听悟:阿里推出的 AI 会议转录工具,网址为 https://tingwu.aliyun.com/home 。 3. 讯飞听见:讯飞旗下智慧办公服务平台,网址为 https://www.iflyrec.com/ 。 4. Otter AI:转录采访和会议纪要,网址为 https://otter.ai/ 。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。 另外,以下是一些文字生成视频的 AI 产品: 1. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-25
假如我拍了一段视频没说话用哪款软件配上文字可以让他张嘴说话
以下是一些可以为您拍摄的未说话视频配上文字并让人物张嘴说话的软件及相关信息: 1. GPT 的视觉功能和 TTS API:可以将脚本传递给 TTS API 生成画外音的 mp3。 2. Sadtalker:这是一款主流的开源程序,可让照片说话唱歌,达到基本的唇形同步。相关资源包括: GitHub 地址:https://github.com/OpenTalker/SadTalker 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 整合包及相关链接: 夸克网盘分享:https://pan.quark.cn/s/1d5ca9f57f5c 视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 具体步骤:点我启动,在启动界面中选择音频、图像口型同步的下载图标;下载完毕后启动应用,会弹出独立窗口;选择 sadtalker 同步器,分别导入图片和声音,根据需求选择图片预处理方式,点击 generate,由于涉及到视频的推理和转换,需做好等待准备。 3. 剪映 App:电脑端打开剪映 App,点击“开始创作”,选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号添加文字内容轨道,在界面右侧替换准备好的文字内容,为数字人提供语音播放内容及生成相对应的口型。
2024-12-18
AI的发展历史
AI 的发展历史可以追溯到二十世纪中叶,大致经历了以下几个阶段: 1. 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论出现。心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。计算机先驱图灵最早提出图灵测试,作为判别机器是否具备智能的标准。1956 年,在达特茅斯会议上,人工智能一词被正式提出,并作为一门学科确立下来。 2. 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理得到发展。但由于从专家那里提取知识并以计算机可读形式表现出来的任务复杂且成本高,20 世纪 70 年代出现“人工智能寒冬”。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等兴起。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等技术发展迅速。当前的前沿技术点包括大模型(如 GPT、PaLM 等)、多模态 AI(视觉 语言模型、多模态融合)、自监督学习(自监督预训练、对比学习、掩码语言模型等)、小样本学习(元学习、一次学习、提示学习等)、可解释 AI(模型可解释性、因果推理、符号推理等)、机器人学(强化学习、运动规划、人机交互等)、量子 AI(量子机器学习、量子神经网络等)、AI 芯片和硬件加速。
2025-01-05
人工智能的历史
人工智能作为一个领域始于二十世纪中叶。最初,符号推理流行,带来了如专家系统等重要进展,但这种方法因无法大规模拓展应用场景,且从专家提取知识、表现及保持知识库准确性复杂且成本高,导致 20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源更便宜,数据更多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能,过去十年中“人工智能”常被视为“神经网络”的同义词。 例如在创建国际象棋计算机对弈程序时,方法不断变化。 此外,人工智能和机器学习在金融服务行业应用已超十年,促成了诸多改进。大型语言模型通过生成式人工智能代表重大飞跃,正改变多个领域。 最初查尔斯·巴贝奇发明计算机,遵循受控计算理念。但有些任务如根据照片判断人的年龄无法明确编程,这类任务正是人工智能感兴趣的。如今金融、医学和艺术等领域正从人工智能中受益。
2025-01-02
人工智能历史
人工智能作为一个领域始于二十世纪中叶。最初,符号推理流行,带来了如专家系统等重要进展,但因从专家提取知识并以计算机可读形式表现及保持知识库准确性复杂且成本高,20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现卓越性能,过去十年中“人工智能”常被视为“神经网络”同义词。 在创建国际象棋计算机对弈程序方面,早期以搜索为基础,发展出阿尔法贝塔剪枝搜索算法,搜索策略在对局结束时效果好,开始时因搜索空间大需通过学习人类对局改进,后续采用基于案例的推理,现代能战胜人类棋手的程序基于神经网络和强化学习。 在创建“会说话的程序”方面,早期如 Eliza 基于简单语法规则将输入句子重新表述为问题,现代助手如 Cortana、Siri 或谷歌助手是混合系统,使用神经网络转换语音并识别意图,未来期待完整基于神经网络的模型独立处理对话,最近的 GPT 和 TuringNLG 系列神经网络取得巨大成功。 最初查尔斯·巴贝奇发明计算机用于按明确程序运算,现代计算机虽先进但仍遵循相同理念。但有些任务如根据照片判断年龄无法明确编程,因不知大脑完成任务的具体步骤,这种类型任务是人工智能感兴趣的。 译者:Miranda,原文见 https://microsoft.github.io/AIForBeginners/lessons/1Intro/README.md 。
2024-12-25
人工智能历史图谱
人工智能的历史可以追溯到二十世纪中叶。 起初,符号推理流行,带来了专家系统等重要进展,但因提取知识复杂、成本高等问题,20 世纪 70 年代出现“人工智能寒冬”。 随着计算资源便宜和数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年“人工智能”常被视为“神经网络”的同义词。 在国际象棋对弈程序方面,早期以搜索为基础,发展出阿尔法贝塔剪枝搜索算法,后来采用基于案例的推理,如今基于神经网络和强化学习,能从自身错误中学习,学习速度快于人类。 在创建“会说话的程序”方面,早期如 Eliza 基于简单语法规则,现代助手如 Cortana、Siri 等是混合系统,使用神经网络转换语音、识别意图,未来有望出现完整基于神经网络的模型处理对话,如 GPT 和 TuringNLG 系列神经网络取得成功。 近期神经网络研究在 2010 年左右有巨大发展,大型公共数据集出现,如 ImageNet 催生了相关挑战赛。2012 年卷积神经网络用于图像分类使错误率大幅下降,2015 年微软研究院的 ResNet 架构达到人类水平准确率,此后神经网络在图像分类、对话语音识别、自动化机器翻译、图像描述等任务中表现成功。 在过去几年,大型语言模型如 BERT 和 GPT3 取得巨大成功,得益于大量通用文本数据,可先预训练再针对具体任务专门化。
2024-12-25
chatgpt发展历史
ChatGPT 的发展历史如下: 在过去的一年里,许多人已主动或被动地了解了 ChatGPT,不少人可能已使用过。它能在人类生活的各个方面发挥作用。 2022 年,OpenAI 宣发时称 ChatGPT 是一种模型,其官网帮助页面称 ChatGPT 是一种服务,目前所熟知的 ChatGPT 逐渐演变成了一种可兼容多种 GPT 模型的聊天应用(服务)。 2022 年 8 月,GPT4 完成训练,是 OpenAI 的旗舰项目,强调指令遵循能力,但存在可靠性问题。 OpenAI 团队曾把产品给朋友和家人使用并考虑公开发布,之后减少对浏览功能的侧重。 团队将指令型数据和聊天数据混合,希望创造出既可以处理具体任务又能流畅聊天的模型,发现 chat 模型使用更简单,能更好地了解并处理潜在局限性,展现出更连贯的特征和更稳定的行为。
2024-12-25
如何使用AI进行中学历史教学,详细些介绍
以下是关于如何使用 AI 进行中学历史教学的一些方法和案例: 1. 利用 GPT 生成“沉浸式”历史片段游戏,让学生扮演特定角色“设身处地”地做决策,例如模拟明朝灭亡时期在南京的场景。 2. 让学生的作业是找出 GPT 生成内容中的错误,以加深对历史知识的理解和批判性思维。 3. 在历史课中,对于制作展示宏观经济学原理理解的信息图表等任务,可以使用 AI 生成的图像。 4. 对于一些需要快速制作以展示学习成果的视频,如科学课中的学习展示,可利用 AI 生成的跳切来节省时间。 同时需要注意,AI 生成的历史模拟内容并非完全准确,可能存在错误和幻觉,但有时幻觉也可能成为一种特点而非缺陷。在使用 AI 辅助教学时,要引导学生正确对待和利用 AI 生成的内容,培养他们的批判性思维和对历史知识的深入理解。
2024-12-20