Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

小白学ai

Answer

对于小白学习 AI,以下是一些建议:

  1. 参考学习日记:可以参考《雪梅 May 的 AI 学习日记》,其学习模式为输入→模仿→自发创造。但注意日记中的学习内容可能因 AI 发展而不适用,可去 waytoAGI 社区寻找感兴趣的最新内容。学习时间较为灵活,有空时进行即可。
  2. 调整学习状态:保持良好的学习状态,像作者在 2024 年那样有意愿、有动力且头脑清醒地学习。不必因觉得难以做到而有心理压力,能学多少算多少。
  3. 了解基本概念:建议阅读「从这里启程」熟悉术语和基础概念,浏览入门文章了解 AI 历史、应用和发展趋势。
  4. 开始学习之旅:在「入门:AI 学习路径」中找到为初学者设计的课程,推荐李宏毅老师的课程,也可通过在线教育平台按自己节奏学习。
  5. 选择感兴趣模块:AI 领域广泛,可根据兴趣选择特定模块深入学习,比如掌握提示词技巧。
  6. 注重实践尝试:理论学习后通过实践巩固知识,尝试使用各种产品并分享实践成果。
  7. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。

此外,学习资源基本都是免费开源的。

Content generated by AI large model, please carefully verify (powered by aily)

References

《雪梅 May 的 AI 学习日记》挑战 100 天和 AI 做朋友

说明:1.适合纯AI小白:如果你还在观望AI,不知道从何入手,可以参考我这个日记。你可以先看左边的目录,会发现我现在已经快到100天了,在这个时间跨度里,我从一开始的到处看看到现在觉得自己已经走在了一条学习AI的轨道上。2.学习模式是什么:我平时有记录笔记的习惯,所以积累了这份AI学习日记。我最近整理复盘了这将近100天记录的日记后,我发现我学习AI的模式是输入→模仿→自发创造。如果你没有自信一开始就用费曼学习法来接触AI,那你可以试试我这个实践出来的学习模式。3.学习内容:我日记里的学习内容你可以不用直接复用,因为AI的节奏太快了,很多学习的材料在半年后的现在可能已经不适用了。比如coze之前共学的那些课程,你会发现coze已经改版了,如果你按照老课程来模仿,产品功能不一样了,对你来说会有转换的门槛。你可以去waytoAGI社区发现你自己感兴趣的AI领域,去学习你自己想学的最新的内容。4.有时间学吗:在半年多的时间跨度中,其中有100天在学习AI,所以这里的DAY(天数)不是每天依次进行,而是有空的时候学习。目前我进行到了90天,希望自己能够坚持满100天,甚至更多时间。5.学习状态:我在2024年保持了比较好的学习状态,有意愿和动力也能头脑清醒的学进去东西。这种状态不仅体现在学AI,我在2024年还看了33本书,像《穷查理宝典》这样的大部头都能看进去。所以如果你看到这个100天日记觉得自己很难做到,那是学习状态没有到最好,不用有心里压力,能学多少算多少就行。6.有费用吗:本日记中学习资源的内容都是免费开源的,真的很感谢这些把信息开源的人,这样会AI的人才会越来越多。我也是秉持这个理念,把我的学习日记开源了

谁是人类?!—— 围观人员震颤的瞳孔和激动的心

我原以为,这种涉及代码和大模型能力的东西从来都是阳春白雪,我等小白触碰不得,可如今借由《谁是人类》这个活动,我意识到它和我就隔着几天的发烧努力——一个全程围观并做一点志愿者服务的元子语。我的AI之旅开始于prompt。显而易见,3.5刚出来的时候,对AI生成原理的理解加上prompt写得好,问问题和解决问题的效率是巨大的,当真能解决一些生活中的问题了。然而作为一个小白类型的Chat网页终端用户,更多的是临时捏一些prompt解决具体的问题,将prompt规范、抽象用以让AI拟人,当然试过,却远远做不到。不知道每一个比较小白的小伙伴,是不是都和我有类似的疑虑呢?然而来都来了,自然要参加一下,学习一下也是好的。作为一个围观人群,我虽然没有躬身入局,却因为近距离地作为线上志愿者,惊觉原来这一切其实门槛都在社区里一一解决过,需要的只是愿意花一些时间和做一些准备。在这个过程中,我也直接被点燃了。

问:新手如何学习 AI?

了解AI基本概念:首先,建议阅读「[从这里启程](https://waytoagi.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=blkjooAlLFNtvKJ2)」部分,熟悉AI的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍AI的历史、当前的应用和未来的发展趋势。开始AI学习之旅:在「[入门:AI学习路径](https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w)」中,你将找到一系列为初学者设计的课程。这些课程将引导你了解生成式AI等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如Coursera、edX、Udacity)上的课程,你可以按照自己的节奏学习,并有机会获得证书。选择感兴趣的模块深入学习:AI领域广泛(比如图像、音乐、视频等),你可以根据自己的兴趣选择特定的模块进行深入学习。我建议你一定要掌握提示词的技巧,它上手容易且很有用。实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出你的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎你实践后的分享。体验AI产品:与现有的AI产品进行互动是学习AI的另一种有效方式。尝试使用如ChatGPT、Kimi Chat、智谱、文心一言等AI聊天机器人,了解它们的工作原理和交互方式。通过与这些AI产品的对话,你可以获得对AI在实际应用中表现的第一手体验,并激发你对AI潜力的认识。

Others are asking
两张照片还原人脸,用什么AI工具
以下是一些可用于两张照片还原人脸的 AI 工具和方法: 1. Stable Diffusion: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 利用 GFPGAN 算法将人脸变清晰,可参考文章。 将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan,提示词可不写。 2. Midjourney(MJ):加上简单的相机参数、写实风格,使用 MJ v 6.0 绘图,可调整图片比例。 3. InsightFaceSwap: 输入“/saveid”,idname 可随意填写,上传原图。 换脸操作输入“/swapid”,id 填写之前设置的名称,上传分割好的图。 选择效果较好的图片,注意插件每日免费使用次数。 此外,还会用到 PS 进行图片的角度调整、裁切、裁剪、拼接等操作。
2025-02-21
AI编程的落地场景是什么
以下是 AI 编程的一些落地场景: 1. 智能体开发:从最初只有对话框的 chatbot 到具有更多交互方式的应用,低代码或零代码的工作流在某些场景表现较好。 2. 证件照应用:以前实现成本高,现在可通过相关智能体和交互满足客户端需求。 3. 辅助编程: 适合原型开发、架构稳定且模块独立的项目。 对于像翻译、数据提取等简单任务,可通过 AI 工具如 ChatGPT 或 Claude 解决,无需软件开发。 支持上传图片、文档,执行代码,甚至生成视频或报表,大幅扩展应用场景。 4. 自动化测试:在模块稳定后引入,模块变化频繁时需谨慎。 5. 快速迭代与发布 MVP:尽早发布产品,不追求完美,以天或周为单位快速迭代。 需要注意的是,AI 编程虽强,但目前适用于小场景和产品的第一个版本,在复杂应用中可能导致需求理解错误从而使产品出错。在进度不紧张时可先尝试新工具,成熟后再大规模应用。同时,压缩范围,定义清晰的 MVP(最小可行产品),先完成一个 1 个月内可交付的版本,再用 1 个月进行优化迭代。
2025-02-21
不同ai模型的应用场景
以下是不同 AI 模型的应用场景: 基于开源模型: Civitai、海艺 AI、liblib 等为主流创作社区,提供平台让用户利用 AI 技术进行图像创作和分享,用户无需深入了解技术细节即可创作出较高质量的作品。 基于闭源模型: OpenAI 的 DALLE 系列: 发展历史:2021 年初发布 DALLE,2022 年推出 DALLE 2,2023 年发布 DALLE 3,不断提升图像质量、分辨率、准确性和创造性。 模型特点:基于变换器架构,采用稀疏注意力机制,DALLE 2 引入 CLIP 模型提高文本理解能力,DALLE 3 优化细节处理和创意表现。 落地场景:2C 方面可控性强于 Midjourney,但复杂场景和细节处理能力不如 Midjourney;2B 方面与 Midjourney 场景类似。 商业化现状:通过提供 API 服务,使企业和开发者能集成到应用和服务中,采取分层访问和定价策略。 伦理和合规性:加强对生成内容的审查,确保符合伦理和法律标准。 大模型: 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 编程和代码辅助:用于代码自动补全、bug 修复和代码解释。 翻译和跨语言通信:促进不同语言背景用户之间的沟通和信息共享。 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 教育和学习辅助:创建个性化学习材料、自动回答学生问题和提供语言学习支持。 图像和视频生成:如 DALLE 等模型可根据文本描述生成相应图像,未来可能扩展到视频内容生成。 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家沉浸式体验。 医疗和健康咨询:理解和回答医疗相关问题,提供初步健康建议和医疗信息查询服务。 法律和合规咨询:帮助解读法律文件,提供合规建议,降低法律服务门槛。 这些只是部分应用场景,随着技术进步和模型优化,AI 模型在未来可能会拓展到更多领域和场景。同时,也需注意其在隐私、安全和伦理方面的挑战。
2025-02-21
爆款AI视频
以下是关于爆款 AI 视频的相关内容: 2025AI 春晚: 行业身份:首届 AI 春晚发起人&总导演,包括央视总台论坛&直播、TEDxAI 演讲、得到分享等。 爆款视频案例:快手&国家反诈中心合作,微博 650w+热搜,快手 520w+热搜(6 月 28 日);央视&海尔冰箱首支 AI 概念短片(6 月 29 日);个人制作视频,无推流,快手平台 636w 播放(6 月 29 日)。 社区与企业关系:涉及 WaytoAGI、AIGCxChina 等聚会,以及德必集团、万兴集团、福布斯 AItop50 等的论坛分享,还有嘉定区政府颁奖、温州 AI 音乐大会、腾讯研究院论坛、江西财经大学分享、宣亚集团分享等。 WTF:1w 粉 10w 粉仅仅用时 13 天,像素级拆解《动物时装秀》: 作者模仿动物时装秀账号效果不错并分享教程。一个爆款视频至少要满足以下几点: 切片:短视频通过不断切片,增加信息密度,从长视频和其他短视频中脱颖而出。 通感:利用人的直觉脑,不让观众动脑子,如头疗、水疗直播间靠声音让人舒服,美食直播间靠展示美食吸引人。 反差:可参考抖音航线里行舟大佬的相关文档。 视频模型:Sora: OpenAI 突然发布首款文生视频模型 Sora,能够根据文字指令创造逼真且充满想象力的场景,生成 1 分钟的超长一镜到底视频,女主角、背景人物等都有惊人的一致性和稳定性,远超其他 AI 视频工具。
2025-02-21
AI音频与数字人
以下是关于 AI 音频与数字人的相关信息: 数字人口播配音: 操作指引:输入口播文案,选择期望生成的数字人形象及目标语言,选择输出类型,点击开始生成。 支持的数字人形象和语言多样,能让视频制作更高效。 图片换脸: 操作指引:上传原始图片和换脸图片,点击开始生成。 图片大小上限 5M,支持 JPG、PNG 格式。 视频换脸: 操作指引:上传原始视频和换脸图片,点击生成。 音频合成数字人: 操作指引:上传音频文件,选择数字人角色和输出类型,点击开始生成。 支持 MP3 和 WAV 格式的音频文件,文件大小上限 5M,工具支持使用 100+数字人模板,可解决无素材冷启问题。 AI 配音: 多语种(包含菲律宾语、印地语、马来语等小语种)智能配音,同时支持区分男声和女声。 操作指引:输入需配音文案,选择音色,点击立即生成。 注意输入的配音文案需和选择音色语种保持一致。 AI 字幕: 操作指引:点击上传视频,开始生成,字幕解析完成后下载 SRT 字幕。 支持 MP4 文件类型,大小上限为 50M。 在数字人语音合成方面,提到了声音克隆,有新的声音克隆且音质很不错。算法驱动的数字人相关开源代码仓库有: ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 大模型:ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分:可以使用 LangChain 的模块去做自定义(https://www.langchain.com/)。 TTS:微软的 edgetts(https://github.com/rany2/edgetts)、VITS(https://github.com/jaywalnut310/vits)、sovitssvc(https://github.com/svcdevelopteam/sovitssvc)。 构建简单数字人的方式包括通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型),但仍存在一些问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-02-21
现阶段最智能的AI工具是哪一款?
现阶段很难确切地指出哪一款 AI 工具是最智能的,因为这取决于不同的应用场景和需求。以下为您介绍一些表现出色的 AI 工具: Unity 推出的两款 AI 工具: Copliot 工具:可通过与 Muse Chat 聊天快速启动创建游戏项目,如生成塔防类游戏基础框架、创建人物角色动作,还能协助编码和熟悉工程环境。 Unity Sentis:能在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强玩法和功能,是首个将 AI 模型嵌入实时 3D 引擎的跨平台解决方案。 基于 2022 年 9 月至 2023 年 8 月访问量的 10 个最佳人工智能工具: ChatGPT:访问量达 146 亿次,在美国使用率最高,男性用户占比较大,多用于写作和内容创作、教育和常识等方面。 Character AI QuillBot Midjourney Hugging Face Google Bard NovelAI CapCut JanitorAI Civitai 不同类型的 AI 工具在不同领域各有优势,例如聊天机器人在流量份额上占比较大,而图像生成器、视频生成器、语音和音乐工具等也在各自领域表现出色。您可以根据具体需求选择适合的工具。
2025-02-21
介绍几款能对YOUTUBE视频实时同声传译的AI工具,并提供使用教程,适合新手小白学习使用
以下为您介绍几款能对 YouTube 视频实时同声传译的 AI 工具及使用教程: 1. 沉浸式翻译: 主打在所有网页双语翻译、PDF 文档对照阅读。 可以一键开启网页中 YouTube 视频的双语字幕,解决了 YouTube 自带字幕翻译点击路径长的问题。 插件安装地址:https://immersivetranslate.com/ 2. 微软 Stream 中的 Copilot: 可以帮助您理解视频内容,询问并跳转到对应时间点。 此外,Youtube 还更新了五款针对创作者的 AI 工具,虽然并非完全是实时同声传译工具,但也可能对您有所帮助: 1. Dream Screen:将 AI 生成的图像或视频背景添加到 YouTube Shorts 中。 2. YouTube Create:使用新的编辑和制作应用程序编辑手机中的视频。 3. AI Insights:根据观众已在 YouTube 上观看的内容获取视频创意和大纲建议。 4. Aloud:使用自动配音工具轻松创建更多语言的内容。 5. 创作者音乐中的辅助搜索:使用这款人工智能辅助搜索工具为您的视频找到完美的配乐。 详细介绍:https://blog.google/products/youtube/youtubenewcreatortools2023/
2025-02-09
介绍几款实能对YOUTUBE视频实时同时传译的AI工具,并提供使用教程,适合新手小白学习使用
以下为您介绍几款能够对 YouTube 视频实时同时传译的 AI 工具及使用教程,适合新手小白学习使用: 1. 沉浸式翻译: 主打在所有网页双语翻译、PDF 文档对照阅读。 可以一键开启网页中 YouTube 视频的双语字幕,解决了 YouTube 自带字幕翻译点击路径长的问题。 插件安装地址:https://immersivetranslate.com/ 2. Kimi: 由月之暗面科技有限公司开发。 最大特点在于超长文本(支持最多 20 万字的输入和输出)的处理和基于文件、链接内容对话的能力。 用户可以上传多种格式文件,Kimi AI 能够阅读并理解相关内容,为用户提供基于文件内容的回复。
2025-02-09
小白学习ai的路径
以下是为小白提供的学习 AI 的路径: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,因其上手容易且实用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,还可以参考《雪梅 May 的 AI 学习日记》: 1. 适合纯 AI 小白,可先看左边的目录。 2. 学习模式是输入→模仿→自发创造。 3. 去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新内容。 4. 学习时间不是每天依次进行,有空的时候学习。 5. 保持良好的学习状态,能学多少算多少。 6. 学习资源的内容都是免费开源的。 YoYo 的学习心得: 1. 学习前状态:不理解 AI 和提示词工程,作为文科生不懂代码、英语差,注册尝试各种 AI 工具走了不少弯路。 2. 学习后现状:能搓多 Agent 的智能体,营销文案 demo,SQL 代码进阶学习应用,创建多个智能体,在公司中实践智能客服等。 3. 学习路径:关键词为“少就是多”“先有个初识”“目录索引推荐”“兴趣最重要”“先动手”,学习路径如同主线+支线的游戏通关。 4. 个人感受:学不完,找到适合自己的就好,学以致用,通过学习分享不断填补知识的缝隙来成长。
2025-01-29
小白学习AI的知识体系
对于小白学习 AI 的知识体系,以下是一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 有兴趣伙伴,可以留言互动,有需要可以提供一份 AI 工具逐渐进入状态的 tips 文章。
2025-01-25
小白学习AI
对于小白学习 AI,以下是一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,还可以参考《雪梅 May 的 AI 学习日记》,其适合纯 AI 小白,学习模式是输入→模仿→自发创造。学习内容可在 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。该日记中的学习资源都是免费开源的。 在理解技术原理与建立框架方面,可通过以下通俗易懂的内容: 1. 视频一主要回答了什么是 AI 大模型,原理是什么。 生成式 AI 生成的内容,叫做 AIGC。 相关技术名词: AI 即人工智能。 机器学习包括监督学习、无监督学习、强化学习。监督学习是有标签的训练数据,无监督学习是学习的数据没有标签,强化学习是从反馈里学习,最大化奖励或最小化损失。 深度学习参照人脑有神经网络和神经元。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 即大语言模型。 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型。
2025-01-23
零基础 小白学习AI 编程
对于零基础小白学习 AI 编程,以下是一些建议和资源: 1. 可以尝试使用 Windsurf 进行开发。它具有卓越的上下文理解能力,能够自动识别项目的重要信息,如目录结构、文件依赖关系等,还能跨文件追踪上下文。同时具备强大的功能特性,如 AI 智能代理可自动完成重复性操作,Cascade 模式提供编辑和聊天两种模式。此外,它支持多语言和跨平台,适用范围广泛。您可以在 30 分钟内用它快速开发学习网站。 2. 参考《雪梅 May 的 AI 学习日记》,其中提到了 cursor 入门的相关内容,如“AI 编程共学 2 cursor 入门”和“AI 编程共学 3 AI 拍立得”。 3. 从最基础的小任务开始,比如让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,学会必备的调试技能。 4. 明确项目需求,可以通过和 AI 的对话逐步梳理,让 AI 像高级产品经理一样向您提问,帮助您梳理出产品需求文档,方便后续开发。
2025-01-21