直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

Ai最新进展

回答

AI 技术的发展历程如下:

  1. 早期阶段(1950s - 1960s):包括专家系统、博弈论、机器学习初步理论。
  2. 知识驱动时期(1970s - 1980s):有专家系统、知识表示、自动推理。
  3. 统计学习时期(1990s - 2000s):出现了机器学习算法,如决策树、支持向量机、贝叶斯方法等。
  4. 深度学习时期(2010s - 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。

当前 AI 的前沿技术点包括:

  1. 大模型,如 GPT、PaLM 等。
  2. 多模态 AI,例如视觉 - 语言模型(CLIP、Stable Diffusion)、多模态融合。
  3. 自监督学习,包含自监督预训练、对比学习、掩码语言模型等。
  4. 小样本学习,如元学习、一次学习、提示学习等。
  5. 可解释 AI,涉及模型可解释性、因果推理、符号推理等。
  6. 机器人学,包括强化学习、运动规划、人机交互等。
  7. 量子 AI,有量子机器学习、量子神经网络等。
  8. AI 芯片和硬件加速。

此外,绿洲资本张津剑认为 AI 技术正在加速发展,并且没有看到任何减缓的迹象。尽管媒体报道可能有所减少,但 AI 的实际进展非常迅速。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

问:AI的技术历史和发展方向,目前最前沿的技术点有哪些

1.早期阶段(1950s-1960s):专家系统、博弈论、机器学习初步理论2.知识驱动时期(1970s-1980s):专家系统、知识表示、自动推理3.统计学习时期(1990s-2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)4.深度学习时期(2010s-至今):深度神经网络、卷积神经网络、循环神经网络等

问:AI的技术历史和发展方向,目前最前沿的技术点有哪些

1.大模型(Large Language Models):GPT、PaLM等2.多模态AI:视觉-语言模型(CLIP、Stable Diffusion)、多模态融合3.自监督学习:自监督预训练、对比学习、掩码语言模型等4.小样本学习:元学习、一次学习、提示学习等5.可解释AI:模型可解释性、因果推理、符号推理等6.机器人学:强化学习、运动规划、人机交互等7.量子AI:量子机器学习、量子神经网络等8.AI芯片和硬件加速

世界好像变难了,我们该如何应对?| 对谈绿洲资本张津剑之 AI、人与生命力

加速中的AI:张津剑认为AI技术正在加速发展,并且没有看到任何减缓的迹象。尽管媒体报道可能有所减少,但AI的实际进展非常迅速。

其他人在问
怎么用ai写体制内工作总结
以下是关于使用 AI 写体制内工作总结的一些建议和相关资源: 1. 对于体制内工作总结,您可以参考以下类似的 AI 办公应用案例: 办公:会议总结,涵盖会议主题、参与人员、讨论议题、关键观点、决策、时间、地点、修改要求、文本格式、语言风格、列表、段落等方面。 办公:写邮件,例如写一封关于未及时提供数据的中等大长度的摘要邮件,并列出必须在邮件中解决的问题的项目清单。 2. 有许多 AI 工具可以帮助您编写相关内容,例如: Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,包括为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。 3. 除了上述内容,AI 还可以帮助您快速总结群聊消息、文章和 B 站视频等。例如总结文章时,可直接复制粘贴给 GPTs 让其总结。对于有字幕的 B 站视频,可通过安装油猴脚本 提取字幕,然后发送给 GPTs 总结。总结完后还可继续提问或探讨。
2024-11-06
哪些ai可以文转语音朗读文章
以下是一些可以进行文转语音朗读文章的 AI: Kimi.ai KHANMIGO(KHAN ACADEMY 的 AI 指南),其基础模型可能会针对学生的学习风格,如为有阅读障碍的学生提供自动文本转语音的帮助。 语音转文本支持的语言包括:南非荷兰语、阿拉伯语、亚美尼亚语、阿塞拜疆语、白俄罗斯语、波斯尼亚文、保加利亚文、加泰罗尼亚文、中文、克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英语、加利西亚语、德语、希腊语、希伯来语、印地语、匈牙利语、冰岛语、印度尼西亚语、意大利语、日语、卡纳达语、哈萨克语、韩语、拉脱维亚语、立陶宛语、马其顿语、马来语、马拉地语、毛里求斯语、尼泊尔语、挪威语、波斯语、波苏尼语、塔加洛语、泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语等。
2024-11-06
AI可能创作四格漫画吗
AI 可以创作四格漫画。例如,使用 DALL·E 3 时,可以通过输入关键词“4panel comics”并提前限定统一的风格,最好把每一个画面分点描述,这样能提高出图效率。群友“三亿”在小红书(ID:开放世界)也有相关作品。此外,还有一些相关的尝试,如利用扣子 Bot 输入关键词生成包含金句的图片,整个工作流程包括用户输入关键词,大模型制作金句,生成画面描述,结合描述和关键词使用插件生成图片,最后用图像流结合金句和图片。在提示词方面,不同的风格提示词如黑暗幻想风格、波普艺术、印象派等也会影响创作效果。
2024-11-06
AIGC视频制作流程和使用工具
以下是 AIGC 视频制作的流程和使用工具: 流程: 1. 前期:先定框架,包含定向、写脚本,确定内容呈现形式、调性、风格和人物设定等。 2. 中期:根据脚本出图,同步剪辑,收集音效配音。如遇到跑图中带文字乱掉等问题可进行 AI 处理和产品跟踪。 3. 后期:对现有视频进行优化,做字体包装和跟踪字体。 使用工具: 1. Runway:可以对图生视频进行更详细的控制,如控制镜头移动、通过笔刷方式控制画面元素移动等。 2. 剪映:用于视频的合成、修剪,添加音效、音乐等。 3. 季梦:可用于 AI 视频下载、首尾帧衔接等操作。 4. 可林:在人物图片生成方面有一定表现。 在视频制作中,还需注意以下方面: 1. 转场制作:考虑最终视频的衔接,制作时思考上下镜头的运动关系。 2. 配音:商业片子做好配音很重要,普通话不标准时花钱找人配音比 AI 配音效果好。 3. 字体:字体包装在视频中很重要。 4. 后期包装思路:可通过添加光效渲染氛围,对素材进行跟踪以替换产品,还可进行素材叠加。 5. 剪辑:在 AI 项目中剪辑占比较高,好的剪辑师能将素材处理得更好。 6. 镜头主接与轴线关系:镜头主接需注意景别丰富,避免越轴导致观众观感不适。 7. 调色流程:对色彩有特别要求可在达芬奇里完成剪辑调色流程,简单调色可在剪映中通过肉眼大致判断校正颜色。 在首尾帧衔接方面,需注意画面构图和元素最好有一致性,若出现渐变 bug 会 PS 的可处理。同时,在图片处理与生成中,要注意图片拖选与删除操作,合理运用提示词描述镜头和生成人物图片。
2024-11-06
aigc制作视频的流程和工具
以下是 AIGC 制作视频的流程和工具: 1. 流程: 前期:定框架,包含定向、写脚本,确定内容呈现形式、调性、风格和人物设定等。 中期:根据脚本出图,同步剪辑,收集音效配音,处理跑图中出现的问题,如文字乱掉等,并进行 AI 处理和产品跟踪。 后期:对现有视频进行优化,做字体包装和跟踪字体。 2. 工具: 剪映:可将下载的视频全选拖拽进行修剪,添加音效、音乐等,普通社交媒体分享选 1080P,需放大选 720P,码率越高越好,可自定义最高 5 万。 季梦:可上传首帧和尾帧,生成时长 6 秒较合适,1.2 版本面部易变形。 可林:可上传首帧和尾帧,脸部表现较好。 Runway:可以对图生视频有更详细的控制,比如控制镜头的移动,通过笔刷的方式控制画面元素的移动。 达芬奇:对色彩有特别要求时可用于完成剪辑调色流程。 在首尾帧衔接方面,画面构图和元素最好有一致性,如相同的透视类型。若出现渐变 bug,会 PS 的可处理,如将原图再次拖入。 在图片处理与生成方面,将图片拖进软件,框选需删除部分,对智能对象需栅格化后再删除。通过 P 图生成合理的前后景,对比不同工具生成效果,如季梦生成较完美。 在提示词运用与镜头描述方面,强调穿梭镜头相关提示词的重要性,列举多种镜头运动方式的描述词。 在人物图片生成方面,在 AI 图片生成红衣汉服美女,可规定人物面部一致性。 在配音方面,商业片子做好配音很重要,普通话不标准时花钱找人配音比 AI 配音效果好。 在字体方面,字体包装在视频中很重要。 在后期包装与剪辑方面,可通过添加光效渲染氛围,对素材进行跟踪以替换产品,还可进行素材叠加。在 AI 项目中剪辑占比 45%,好的剪辑师能将素材处理得更好。镜头主接需注意景别丰富,存在轴线问题,越轴会让观众观感不适。简单调色可在剪映中通过肉眼大致判断校正颜色,剪映中有色轮和曲线可用于调色。
2024-11-06
AI做数据分析的能力怎么样
AI 在数据分析方面具有一定的能力和优势: ChatGPT 助力数据分析:通过实际案例与相关技巧,实现了两种方式支持多维数据分析,包括 SQL 分析和个性化分析。分析完成后可展示结果数据的图表和分析结论,图表支持折线图和柱状图的随意切换。 提升认知能力:大脑需要不断学习和训练,认清“思维陷阱”,如确认偏误、锚定效应等,锻炼逻辑思维,掌握数据分析能力,避免被误导。 对于 AI PM 来说:掌握算法知识具有必要性,包括理解产品核心技术、与技术团队有效沟通、评估技术可行性、把握产品发展方向、提升产品竞争力以及提升数据分析能力。 总之,AI 在数据分析领域有其独特的价值和应用场景,但也需要结合人类的专业知识和判断来确保分析结果的准确性和可靠性。
2024-11-06
AI加教育的最新进展
以下是 AI 加教育的最新进展: 案例方面: “AI 赋能教师全场景”,来自 MQ 老师的投稿贡献。 “未来教育的裂缝:如果教育跟不上 AI”,揭示了人工智能在教育领域从理论走向实际应用带来的颠覆性改变。 “化学:使用大型语言模型进行自主化学研究”。 “翻译:怎么把一份英文 PDF 完整地翻译成中文?”,介绍了 8 种方法。 对未来的预判: 个性化学习时代已到来,AI 将作为教育生态系统的一部分与人类教师协作,为孩子提供不同的学习体验,如混合式教学、定制学习路径等。 教育工作者将成为学习的引导者和伙伴,更多关注孩子的全人发展,如创造力和社交智慧。 未来 3 年,提升人机协作效率的领域,如 AI 作业批改、备课、定制教育规划、学前启蒙等,对教育从业者蕴藏着巨大机遇。 探索实践: 过去半年多,梳理教学和育儿工作流,每个环节与 AI 协作可大幅提升效率,但也加剧了知识获取的不平等。从家长的“育”、老师的“教”和学生的“学”进行了落地实践的拆解。
2024-11-05
LLM写ABAP代码的最新进展
大型语言模型(LLM)在编写ABAP代码方面的能力正在不断提升。ABAP(高级业务应用编程)是SAP系统的编程语言,专门用于开发企业资源规划(ERP)软件。以下是一些LLM编写ABAP代码的最新进展: 1. 代码生成:LLM可以基于自然语言描述生成ABAP代码片段,帮助开发者快速实现特定功能。 2. 代码补全:通过机器学习技术,LLM能够预测并补全ABAP代码,提高开发效率。 3. 代码审查:LLM可以分析ABAP代码,识别潜在的错误和不规范的编程实践。 4. 文档生成:LLM能够根据ABAP代码自动生成文档,包括函数描述、参数说明等。 5. 模式识别:LLM可以识别ABAP编程中的常见模式和最佳实践,并在代码生成时应用这些模式。 6. 交互式学习:一些LLM提供交互式学习环境,帮助开发者通过实例学习ABAP编程。 7. 集成开发环境(IDE)插件:LLM技术被集成到ABAP开发工具中,提供智能代码提示和错误检测。 8. 自动化测试:LLM可以生成测试用例,帮助自动化ABAP代码的测试过程。 9. 性能优化:LLM可以分析ABAP代码的性能瓶颈,并提出优化建议。 10. 跨语言能力:一些LLM能够理解多种编程语言的概念,并将其应用于ABAP代码的编写。 然而,尽管LLM在编写ABAP代码方面取得了进展,但它们仍然面临一些挑战,例如: 领域特定知识:ABAP是一种领域特定的语言,需要对SAP系统有深入的理解。 复杂逻辑处理:企业级应用的逻辑可能非常复杂,LLM需要能够处理这些复杂性。 代码维护性:自动生成的代码需要易于理解和维护。 随着技术的发展,LLM在ABAP编程领域的应用将越来越广泛,但它们可能仍然需要与人类开发者合作,以确保生成的代码既高效又可靠。
2024-08-05
GPT4最新进展
GPT4是OpenAI开发的大型多模态语言模型,它能够接受图像和文本输入,并产生文本输出。以下是GPT4的一些最新进展: 1. GPT4 Turbo的发布:OpenAI推出了GPT4 Turbo的预览版,这是一个更强大的模型,它了解截至2023年4月的世界事件。GPT4 Turbo具有128K的上下文窗口,可以处理相当于300多页文本的输入。相比于GPT4,GPT4 Turbo在性能上进行了优化,提供了更低的价格,输入token价格降低了3倍,输出token价格降低了2倍。 2. 功能和性能提升:GPT4 Turbo支持多模态API调用,包括视觉功能和DALL·E 3 API。它还在指令跟随和JSON模式方面进行了改进,提供了更高的准确性和更有效的JSON格式输出。 3. 可重复输出和对数概率:GPT4 Turbo引入了新的seed参数,允许模型返回大部分时间一致的完成,这对于调试请求和编写单元测试非常有用。OpenAI还计划推出一个功能,返回最可能输出的令牌的对数概率,这将对构建搜索体验中的自动完成等功能非常有用。 4. GPT3.5 Turbo更新:除了GPT4 Turbo之外,OpenAI还发布了GPT3.5 Turbo的新版本,支持16K的上下文窗口,并改进了指令跟随、JSON模式和并行函数调用。 5. 助手API和新模态:OpenAI发布了助手API,允许开发者在自己的应用程序中构建Agent类体验。GPT4 Turbo可以通过Chat Completions API接受图像输入,实现生成标题、详细分析现实世界的图像以及阅读带有图表的文档等功能。 6. 技术报告:OpenAI发布了GPT4的技术报告,详细介绍了模型的开发、性能、能力和局限性。GPT4在多项专业和学术基准测试中展现出人类水平的表现,包括通过模拟律师资格考试并在SAT考试中取得高分。 7. 安全性和可靠性:尽管GPT4在性能上取得了显著进步,但它仍然存在一些局限性,例如可能产生不准确的信息(俗称“幻觉”)和有限的上下文窗口。OpenAI在模型开发过程中注重安全性,以减少潜在的风险。 8. 企业级服务:Azure OpenAI服务发布了企业级可用的GPT4国际预览版,允许企业构建自己的应用程序,并利用生成式AI技术提高效率。 9. 价格降低和速率限制提高:OpenAI降低了API价格,以将节省的费用传递给开发者,并提高了每分钟的令牌限制,以帮助开发者扩展应用程序。 10. 版权保护:OpenAI推出了版权保护措施,如果客户面临版权侵权的法律索赔,OpenAI将介入保护客户并支付相关费用。 这些进展显示了GPT4在多模态能力、性能优化、安全性和企业级应用方面的持续发展和创新。随着GPT4的不断改进和新功能的推出,它在自然语言处理领域的应用潜力将进一步扩大。
2024-04-22