Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

2024年热门AI模型

Answer

以下是 2024 年的热门 AI 模型:

  • 在编码任务方面,DeepSeek 的 deepseek-coder-v2 成为社区的最爱。
  • 阿里巴巴发布的 Qwen-2 系列在视觉能力方面给社区留下深刻印象。
  • 清华大学自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目,是可在设备上运行的小型参数模型。
  • 在图像视频领域,国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,且在定制化方面进步显著,还推出了 Stable Video 3D。OpenAI 的 Sora 能生成长达一分钟的视频,并保持三维一致性等。Google DeepMind 的 Veo 能将文本和图像提示与视频输入结合生成高分辨率视频。
  • 在生物医学领域,Profluent 的 CRISPR-Cas 图谱微调后生成功能性基因编辑器,如开源的 OpenCRISPR-1。心智基础模型 BrainLM 基于功能性磁共振成像建立,能检测血氧变化等。
  • 在气象预测领域,微软创建的 Aurora 能预测大气化学,比数值模型更优且速度更快。
  • 获得诺贝尔物理学奖和化学奖的 AI 推动了机器学习理论创新,并揭示了蛋白质折叠问题。
  • 蛋白质结构预测方面,有 DeepMind 和 Isomorphic Labs 发布的 AlphaFold 3。
  • DeepMind 展示的新实验生物学能力 AlphaProteo 能设计出高亲和力的蛋白结合剂。
  • Meta 发布的 ESM3 是前沿多模态生成模型,在蛋白质序列、结构和功能上训练。
  • 学习设计人类基因组编辑器的语言模型——CRISPR-Cas 图谱。
Content generated by AI large model, please carefully verify (powered by aily)

References

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

Profluent的CRISPR-Cas图谱进行了微调,以生成具有新型序列的功能性基因编辑器。重要的是,这些编辑器首次被证明能够对体外的人类细胞DNA进行编辑。CRISPR-Cas图谱包含超过一百万个不同的CRISPR-Cas操作子,包括各种效应器系统,这些操作子是从组装的微生物基因组和宏基因组中挖掘出来的,覆盖了多种门类和生态系统。生成的序列比CRISPR-Cas图谱中的天然蛋白质更多样化,中位数相似度通常在40%至60%之间。一种针对Cas9蛋白质进行微调的模型可以生成新的编辑器,然后在人类细胞中进行了验证。其中一种编辑器提供了最佳的编辑性能,并且与SpCas9具有71.7%的序列相似性,现已开源为OpenCRISPR-1。心智基础模型:从fMRI学习大脑活动深度学习现在正在成为模拟大脑本身。BrainLM是一个基于功能性磁共振成像(fMRI)生成的6700小时人类脑活动记录而建立的基础模型,该模型可以检测到血氧变化;可以重建被遮盖的空间和时间脑活动序列,并且重要的是它可以泛化到保留分布;不仅如此,这个模型可以微调以预测临床变量例如年龄、神经质、创伤后应激障碍和焦虑症得分比图灵机或LSTM更好。科学领域的基础模型:大气微软的研究人员创建了Aurora,它是第一个预测大气化学(6种主要空气污染物,例如臭氧和一氧化碳),涉及数百个僵硬方程的模型,比数值模型更好。该模型也比使用数值预报的综合预报系统快5000倍。

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

最重要的突破是——在2024年,诺贝尔物理学奖和化学奖先后颁给AIAI不仅推动了机器学习的理论创新,还揭示了蛋白质折叠问题。其标志了人工智能AI已经真正成为一门科学学科和加速科学的工具。AI在生物医学气象等突破应用有哪些?基于深度学习和Transformer架构的蛋白质结构预测模型——AlphaFold 3由DeepMind和Isomorphic Labs发布的AlphaFold 3是一个基于深度学习和Transformer架构的蛋白质结构预测模型,能够高精度地预测包括蛋白质、DNA、RNA、配体等生物分子的结构和相互作用。它的出现将为细胞功能解析、药物设计和生物科学的发展提供有力支持。DeepMind展示新的实验生物学能力——AlphaProteo其秘密蛋白质设计团队推出第一个模型AlphaProteo是一种能够设计出具有三到三百倍亲和力的亚纳米摩尔蛋白结合剂的生成模型。生物学前沿模型的扩展:进化规模ESM3自2019年以来,Meta一直在发布基于Transformer的语言模型(进化规模模型),这些模型是通过大型氨基酸和蛋白质数据库进行训练的。今年,他们发布了ESM3,这是一种前沿多模态生成模型,它是在蛋白质序列、结构和功能上进行训练的,而不是仅仅在序列上进行训练。与传统的掩码语言建模不同,ESM3的训练过程使用可变掩码计划,使模型暴露于各种掩码序列、结构和功能的组合。ESM3能够学习预测任何模态组合的完成情况。学习设计人类基因组编辑器的语言模型——CRISPR-Cas图谱

Others are asking
2024大模型典型应用案例集
以下是 2024 大模型的一些典型应用案例及相关信息: 《2024 大模型典型示范应用案例集》汇集了 97 个优秀案例,展示了大模型技术在教育、医疗、金融、政务等多个行业和领域的应用。案例由阿里云、百度、华为等领先企业实施,上海成为应用落地的热点地区,大中型企业是主要试验场。AI 智能体和知识库成为提升大模型落地实效的关键手段。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 整体来看,在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%,其增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。 企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。 相关报告: 《信达证券:AI 行业设计领域专题报告:Adobe AI 功能覆盖全面,Canva、美图等力争上游》 《中国信通院:大模型基准测试体系研究报告(2024 年)》 《埃森哲:人工智能行业:2024 在生成式人工智能时代重塑工作、劳动力和员工》 此外,还有一些相关活动,如: 2024 年是国内大模型技术加速落地的关键年份,各大厂商如百度、阿里、字节等在 AI 大模型领域展开激烈竞争。百度凭借 40 个中标项目和 2.74 亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业,百度文心大模型的应用广泛,表现亮眼。 🏮「非遗贺春」魔多蛇年春节 AI 模型创作大赛,大赛时间 2024 年 12 月 24 日2025 年 1 月 15 日。大赛奖池【¥12000】现金奖励+官方高含金量荣誉证书+会员与算力激励+流量激励。双赛道同时开启,赛道一【春节】+赛道二【爱非遗 AI 传承】。本次活动由浙江省非遗保护中心(浙江省非遗馆)指导×浙江省非遗保护基金会主办×魔多 AI 联合承办,由提供社区传播支持。
2025-01-16
2024年人工智能指数报告 下载
以下是为您提供的 2024 年人工智能指数报告的相关下载信息: 1. 《》由微软和领英联合发布,揭示了人工智能(AI)在工作场所的快速增长和深远影响。 2. 可在知识星球下载的报告: 《》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《》企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 3. 《》数据处理应从模型为中心转向数据为中心,并强调向量数据库在提升模型服务能力中的核心作用。 4. 斯坦福大学发布的基础模型透明度指数相关报告:在上一届 SOAI 发布后不久,斯坦福大学发布了其首个基础模型透明度指数,模型开发者的平均得分为 37 分。在团队的中期更新中,这一分数攀升至 58 分。2024 年 5 月,该指数的最新一期基于 100 项指标,评估了 14 家领先的基础模型开发者的透明度,这些指标涵盖“上游”因素数据、劳动力、计算、围绕能力和风险的“模型级”因素、围绕分布的“下游”标准以及社会影响。计算和使用政策的评分出现了最强劲的改善,而“上游”评分仍然疲弱。 5. 《2024 年人工智能现状:辉煌、戏谑和“牛市”》报告链接:
2025-01-11
2024年人工智能指数报告
以下是关于 2024 年人工智能指数报告的相关内容: 斯坦福大学发布的基础模型透明度指数显示,模型开发者的平均得分从最初的 37 分攀升至中期更新的 58 分。2024 年 5 月的最新一期基于 100 项指标评估了 14 家领先的基础模型开发者的透明度,其中计算和使用政策的评分改善强劲,“上游”评分仍疲弱。 2024 年 AI 年度报告的十大预测包括:好莱坞级别的制作公司开始使用生成式人工智能制作视觉特效;美国联邦贸易委员会或英国竞争与市场管理局基于竞争理由调查微软/OpenAI 的交易;在全球人工智能治理方面进展有限;一首由人工智能创作的歌曲进入公告牌 Hot 100 前 10 名或 Spotify 2024 年热门榜单;随着推理工作负载和成本的显著增长,一家大型人工智能公司收购或建立专注于推理的人工智能芯片公司。同时也有错误预测,如生成式人工智能媒体公司在 2024 年美国选举期间的滥用行为未受到调查,自我改进的人工智能智能体在复杂环境中未超越现有技术最高水平。 预测还覆盖了人工智能领域的多个方面,如主权国家向美国大型人工智能实验室投资超 100 亿美元引发国家安全审查;完全无编码能力的人创建的应用或网站走红;前沿实验室在案件审判后对数据收集实践方式发生重大转变;早期欧盟人工智能法案实施结果比预期宽松;开源的 OpenAI o1 替代品在推理基准测试中超越;挑战者未能突破英伟达市场地位;对人形机器人投资水平下降;苹果在设备上的研究成果加速个人设备上人工智能的发展;人工智能科学家生成的研究论文被主要机器学习会议或研讨会接受;以“生成式人工智能”为元素互动的视频游戏取得突破性地位。
2025-01-11
2024ai 大事记
以下是 2024 年 AI 大事纪的相关内容: 1 月: 斯坦福大学 Mobile Aloha。 1 月 10 号 LumaAl Genie 文生 3D。 1 月 11 号 GPT store 上线。 MagnificAl 高清放大爆火。 1 月最后一天苹果 Vision Pro 宣布发售。 3 月: 潞晨科技发布 OpenSora。 Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月: 苹果发布 AI 芯片。 张吕敏发布 IC light。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月: 阿里云发布模型,海螺 AI 参战。 Google 发布 GameGen 实时生成游戏。 通义千问 2.5 系列全家桶开源。 华为发布 cloud matrix 云计算基础设施。 GPT 高级语音模式上线。 Meta 发布 AI 眼镜 Orion。 AI 代码编辑器 cursor 爆火。 10 月: Pika 发布 1.5 模型。 诺奖颁发给 AI 奠基人。 特斯拉发布机器人。 Adobe 发布 Illustrator+Al 生成矢量图。 智谱 AI 发布 autoGLM。 腾讯混元开源 3D 模型。 云深处发布机器人山猫机器狗。 Apple 发布 Mac mini。 12 月: 李飞飞发布空间智能成果。 腾讯开源混元视频模型。 Open AI 开 12 天发布会。 微软发布 Trellis 最强开源图生 3D。 Gemini2.0 视觉交互智能体。 智元机器人开始量产。 谷歌发布 Veo2 能生成 4K 视频。 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
2024AI 大事记
以下是 2024 年 AI 大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化 伊莉雅离开 OpenAI,伊利亚成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 宇树科技机器狗爆火,似奔着打架去 SORA 兑现引关注,被测试出奇怪问题 需要说明的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
2024ai大事件
以下是 2024 年 AI 领域的大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-09
AI智能体对个人工作能力培养方面的启示
AI 智能体对个人工作能力培养有以下启示: 1. 工作方法方面: 彻底让自己变成一个“懒人”。 能动嘴的不要动手,用嘴说出想做的事远比打字快。 能动手的尽量用 AI,用 AI 远比苦哈哈手敲快。 把手上的工作单元切割开,建设属于自己的智能体。 根据结果反馈不断调整自己的智能体。 定期审视自己的工作流程,看哪个部分可以更多地用上 AI。 2. 个人素质方面: 技术层面之外,个人能力的提升是核心,尤其是学习能力和创造能力。 学习能力是通过持续阅读和实践来吸收、消化和积累知识的能力,是构建个人知识体系的基础和个人成长的动力源泉。 为保持竞争力,要培养并维持旺盛的好奇心和持续学习的习惯,广泛阅读,深入研究新领域,不断探索前沿知识,全方位、多角度学习和实践,以积累知识、提高适应能力和创新思维。 3. 技术应用方面: 迅速掌握生成式人工智能的基本概念和潜在影响,重点理解其如何革新工作方式和重塑行业格局。 深入了解市场上现有的人工智能产品和工具,并积极应用到实际工作中。 学习提示词技术,编写清晰、精确的指令,引导 AI 工具产生所需结果。 探索构建智能体,让其革新工作方式,多个虚拟伙伴和助手协同工作,提高工作效率和创新能力。 需要注意的是,AI 技术的出现能把大部分人的能力提升到及格线以上,人与人之间最大的差距在于认知差距。对创建 AI 智能体感兴趣的小伙伴,可前往 WaytoAGI 开源免费社区了解(里面有保姆级教程)。
2025-01-22
AI智能体对个人工作及职业规划的启示
AI 智能体对个人工作及职业规划具有多方面的启示: 在职业规划方面: 1. 职业趋势分析:基于最新市场数据和行业报告,协助分析自身专业或职业的前景,了解未来趋势。 2. 技能评估与提升:通过测评工具评估当前职业兴趣,提供针对性学习资源和课程建议,提升专业技能。 3. 职业匹配与推荐:根据兴趣、技能和职业目标,推荐适合的职业路径和职位,提供个性化建议。 4. 职业发展规划:结合个人情况和市场需求,制定详细的短、中、长期职业发展计划,帮助在 AI 时代找到职业定位。 在个人工作方面: 1. 掌握基本概念和潜在影响:对于生成式人工智能,应迅速了解其基本概念和潜在影响,无需深入技术细节,重点在于理解其对工作方式和行业格局的革新。 2. 应用现有产品和工具:深入了解市场上的人工智能产品和工具,并积极应用于实际工作,通过实践学习其优势和局限性。 3. 学习提示词技术:掌握提示词技术,编写清晰、精确的指令,引导 AI 工具产生所需结果,提升工作效率和产出质量。 4. 探索构建智能体:构建智能体,赋予其特定角色和任务,协同工作,提高工作效率和创新能力。 总之,AI 智能体为个人提供了提效的可能,如同拥有数字员工,在职业规划和工作中都能发挥重要作用。
2025-01-22
什么是AI智能体
AI 智能体简单来说就是 AI 机器人小助手。参照移动互联网,类似 APP 应用的概念。它拥有各项能力,可以帮助人们做特定的事情。目前有不少大厂推出自己的 AI 智能体平台,如字节的扣子、阿里的魔搭社区等。体验过 GPT 或文心一言大模型的小伙伴应该知道,现在基本能用自然语言来编程,降低了编程门槛。但之前使用 GPT 或文心一言大模型时会出现胡编乱造、时效性差、无法满足个性化需求等问题,而 AI 智能体的出现正是解决这些问题的绝佳方式。AI 智能体包含了自己的知识库、工作流,还可以调用外部工具,再结合大模型的自然语言理解能力,就可以完成比较复杂的工作。所以 AI 智能体的出现就是结合自己的业务场景,针对自己的需求,捏出自己的 AI 智能体来解决自己的事情。
2025-01-22
1.AI搜索的prompt怎么写 2.AI搜论文的prompt怎么写比较好
以下是关于 AI 搜索和 AI 搜论文的 prompt 写作的相关指导: 对于 AI 搜索的 prompt 写作: 1. 明确具体的描述:使用更具体、细节的词语和短语来描述您的需求,避免过于笼统。 2. 添加视觉参考:若可能,在 prompt 中插入相关图片参考,以提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整 prompt 的整体语气和情感色彩。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最准确表达需求的描述方式。 5. 增加约束条件:为避免意外输出,添加如分辨率、比例等限制性条件。 6. 分步骤构建 prompt:将复杂需求拆解为逐步的子 prompt,引导 AI 先生成基本结构,再逐步完善。 7. 参考优秀案例:研究 AI 社区流行且有效的 prompt 范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:通过多次尝试不同写法,并根据输出效果反馈持续优化。 对于 AI 搜论文的 prompt 写作,您可以参考以下要点: 1. 设定角色为资深学术研究者,明确具备高效的学术论文阅读、总结能力。 2. 遵循“二八原则”进行论文总结。 3. 输出阅读的总结文字,包括列出论文的明确方法论、经过验证的结论等关键信息。 4. 采用结构化的内容组织方式,如使用编号、子标题和列表。 5. 按照规定概述内容解读结语的结构写作,先概述规定内容,然后解读具体内容,最后以结语结束。 6. 结合案例和挑战,增强说服力并提供解决方案。 7. 引入法规内容和实际操作案例,提供详细解释和建议。 8. 使用商业术语,确保专业性和针对性。 9. 注意文章结构,标题要开门见山、切中要害并引起目标群体悬念;第一部分说清楚要解决的问题及背景和可能导致的损失;第二部分以案例引入;第三部分对案例进一步分析;第四部分给出具体操作建议,包括事前、事中、事后的注意事项和措施。 总之,编写高质量的 prompt 需要不断实践和总结经验,熟悉 AI 模型的能力边界,保持开放思维并尝试创新描述方式。
2025-01-22
如何利用AI读书
以下是关于如何利用 AI 读书的一些方法和建议: 1. 尝试撰写结构化 prompt 或使用李继刚等的 prompt 最佳实践。 2. 进行 AI 绘画,画一幅能表达中秋的画面。 3. 实操:在中找一些案例实操。 4. 数据:查看 AI 产品榜数据库>。 5. 阅读:通往 AGI 之路知识库阅读,每日小互的推特阅读获取最新动态:http://waytoagi.com/xiaohu。 6. 探索:生成式视频案例可以找一些欣赏,有机会自己动手做一个视频。 在读书时,可参考以下案例: 1. 如读万维钢的新书《拐点》时,看到有触动但需保持批判性思考和怀疑的文本,若足够强势,当前 AI 对人的作用有三个:信息杠杆、发现自己真正想要的、帮助形成自己的观点和决策。 2. 将上述书摘整理归纳,标记重点,打赏标签,放入笔记系统,准备展开深度思考和实践。 3. 基于笔记中提到的 AI 对人的三种最终的赋能模式,以自己深度思考的问题为例,践行这套方法论,体会“信息杠杆”如何令“思维换挡”,感受如何“让自己发现究竟想要什么”。 4. 通过 AI 信息杠杆,利用 AI 搜索引擎和大模型,迅速掌握“如何用好飞书文档”“markdown 语法基础”并结合两者完成“永飞书创建提示词库、飞书+markdown 打造个人知识库”等思考。 5. 基于上述实践,生成“自己的观点和决策”,并将其打造成体系化的内容产品,实现价值。 同时,虽然在利用 AI 辅助写作等方面可能存在一些困难,如打断心流、失去掌控等,但应保持好奇和开放心态,为自己和孩子们寻找更多借助 AI 拓展思维边界的方式。
2025-01-22
做会议记录比较好用的AI工具
以下是一些做会议记录比较好用的 AI 工具: 团队会议总结 Vowel:https://www.vowel.com/ Personalized AI, Everywhere:https://www.augment.co/?ref=superhuman1_mar23&utm_source=superhuman.beehiiv.com&utm_medium=newsletter&utm_campaign=thisaicanhackinterviews Noty 会议总结为待办事项:https://noty.ai/ The 6 Best AI Tools for Meeting Notes in 2024:https://www.meetjamie.ai/blog/the6bestaimeetingtools The smartest AI team assistant Sembly AI:https://www.sembly.ai/ Briefly: AI meeting summary&email follow up Chrome 应用商店:https://chrome.google.com/webstore/detail/brieflyaimeetingsummar/bjmgcelbpkgmofiogkmleblcmecflldk Welcome fireflies.ai:https://app.fireflies.ai/ Noota Screen Recorder&Meeting Assistant Chrome 应用商店:https://chrome.google.com/webstore/detail/nootascreenrecordermee/eilpgeiadholnidgjpgkijfcpaoncchh Read Meeting Reports:https://app.read.ai/analytics/meetings Read Create Workspace:https://app.read.ai/analytics/settings/workspace/new 10 AI Notes Taking Tool to Summarize Meetings in Seconds Geekflare:https://geekflare.com/ainotestakingtools/ 此外,还有以下免费的会议语音转文字工具,不过大部分有使用的时间限制,超过一定的免费时间后可能需要付费: 飞书妙记:https://www.feishu.cn/product/minutes 通义听悟:https://tingwu.aliyun.com/home 讯飞听见:https://www.iflyrec.com/ Otter AI:https://otter.ai/ 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。腾讯会议也是一款不错的 AI 会议记录生成工具,它可以在会议过程中利用语音识别和自然语言处理技术自动生成会议记录,包括发言内容、讨论要点等,方便用户会后回顾和整理。
2025-01-22
当前有哪些热门AI工具
以下是一些当前热门的 AI 工具: 儿童练习英语口语的 AI 工具: LingoDeer:使用游戏和互动活动教孩子英语,提供各种课程,有家长仪表板。 Busuu:提供英语等多种语言课程,有多种教学方法和社区功能。 Memrise:使用抽认卡和游戏教学,有社交功能。 Rosetta Stone:使用沉浸式方法,有语音识别功能。 Duolingo:免费,使用游戏化方法,课程多样。 制作 PPT 的 AI 工具: Gamma:在线制作网站,可通过输入提示生成幻灯片,支持嵌入多媒体。 美图 AI PPT:输入文本描述生成专业设计,有丰富模板库。 Mindshow:提供智能设计功能,简化设计流程。 讯飞智文:利用语音识别和自然语言处理技术,提供多种编辑功能。 辅助写邮件的 AI 工具: Grammarly:提供语法检查、拼写纠正等功能,支持多平台和多种语言。 Hemingway Editor:简化句子结构,提高可读性。 ProWritingAid:全面的语法和风格检查,提供详细写作报告。 Writesonic:基于 AI 生成各种文本,生成速度快。 Lavender:专注邮件写作优化,提供个性化建议和模板。 在选择工具时,需考虑使用者的年龄、兴趣、学习风格、功能和成本等因素。
2024-12-21
用扣子智能体制作一个有关热门旅游景点攻略小助手的工作流,能够根据不同用户的需求,制定个性化的旅行计划,涵盖各种热门旅游景点,提供详细的行程安排、交通指南和景点特色介绍
要使用扣子智能体制作一个有关热门旅游景点攻略小助手的工作流,以下是一些参考信息: 1. 扣子智能体通常由工作流和数据库组成。工作流的设计相对简单,一个输入对接知识库,搭载豆包 function call 大模型,最后输出。数据库的收集和整理需要一定专业知识,并进行手动二次校对。 2. 插件方面,扣子平台有多种类型的插件,如看新闻、规划旅行、提高办公效率、理解图片内容等的 API,还可根据需求自制插件。 3. 工作流就像可视化的拼图游戏,由多个节点组成,包括大语言模型、代码块等,能创造复杂稳定的业务流程。 4. 扣子预置了各种场景的 Bot,如旅游大师 Bot。在 Bot 商店可查看精选的预置 Bot,选择后会被引导至编排页面,该页面分为顶部区域(显示所用大型语言模型)、人设与回复逻辑区域、技能区域(展示配置的功能,如查询航班的插件、推荐景点的工作流等)、预览与调试区域(展示交互运行结果)。 基于以上信息,您可以尝试设计热门旅游景点攻略小助手的工作流,根据不同用户需求制定个性化旅行计划,涵盖热门景点、行程安排、交通指南和景点特色介绍。但需要注意的是,工作流的设计和数据库的整理需要精心规划和准确操作。
2024-12-16
最近热门的大模型是什么
目前热门的大模型主要有以下几种: 1. 语言模型:如 GPT、PaLM 等。 2. 多模态模型:例如视觉语言模型 CLIP、Stable Diffusion 等。 大模型因其强大的能力,在众多领域有着热门的应用场景: 1. 文本生成和内容创作:可用于撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:能够与人类进行自然对话,提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助:实现代码自动补全、bug 修复和代码解释,提高编程效率。 4. 翻译和跨语言通信:理解和翻译多种语言,促进不同语言背景用户之间的沟通和信息共享。 5. 情感分析和意见挖掘:分析社交媒体、评论和反馈中的文本,识别用户情感和观点,为市场研究和产品改进提供支持。 6. 教育和学习辅助:创建个性化学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可以根据文本描述生成相应的图像,未来可能扩展到视频内容的生成。 最近,多模态大模型取得重大进展。随着数据集和模型规模不断扩大,传统的多模态模型带来巨大计算量,尤其是从头开始训练。研究人员意识到多模态研究重点在于各个模态的连接,合理方法是利用现成训练好的单模态基础模型,尤其是语言模型。这样可减少多模态训练费用,提升训练效率。多模态大模型利用语言模型为各种多模态任务提供认知能力,语言模型具有良好的语言生成、zeroshot 和 ICL 的能力,其他模态的基础模型提供高质量表征。考虑到不同模态模型是分开训练的,如何将不同模态连接起来,实现协同推理,是核心挑战。主要工作通过多模态预训练和多模态的指令微调,来实现模态之间的对齐,以及模型输出与人类意图的对齐。
2024-08-30
目前热门的AI软件有哪些
目前热门的 AI 软件包括以下几种: 1. 搜索引擎类: You.com:具有多种搜索模式且重视隐私。 Genspark:通过 Sparkpages 满足用户个性化的搜索需求。 2. 社交软件类: Butterflies AI:人类与 AI 共存的社交软件。 3. 办公软件类: Excel 相关: Excel Labs:Excel 插件,新增生成式 AI 功能,基于 OpenAI 技术,用于数据分析和决策支持。 Microsoft 365 Copilot:微软推出的整合 Word、Excel 等办公软件的 AI 工具,通过聊天形式完成任务。 Formula Bot:提供数据分析聊天机器人和公式生成器功能,支持自然语言交互。 Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能生成公式、文本内容、执行情感分析、语言翻译等。 4. 销售工作类: Salesforce 爱因斯坦:来自 Salesforce 的 AI 工具,能分析数据集识别潜在客户,生成预测性潜在客户评分,具有自动化功能。 Clari:专门从事智能收入运营的软件,能统一数据来源并创建准确的收入预测。 Hightime:销售团队的 AI 助手,处理重复性任务和耗时研究。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-08-26
如何用AI在社交媒体上追踪热门内容或主题
以下是根据你的需求,为你生成的文章: 如何用 AI 在社交媒体上追踪热门内容或主题 在当今数字化的世界中,社交媒体已成为人们获取信息和互动的主要平台之一。对于企业和个人来说,了解热门内容和主题是在社交媒体上保持竞争力和吸引力的关键。下面介绍几种使用 AI 追踪热门内容或主题的方法: Trendmate.xyz Trendmate.xyz 是一个 AI 社交媒体工具,可为用户提供内容创意。它通过分析 Facebook、Twitter、Instagram 和 TikTok 的趋势,为用户提供参与度洞察。用户只需输入关键词,即可获取热门话题和标签,从而在社交媒体上保持领先位置。此外,该工具还允许用户保存喜欢的创意,以备将来使用。 SOP:如何利用 AI 30 分钟不到打造爆款公众号文章 1. 明确主题 在撰写文章之前,需要先选定一个吸引人的主题。以当前 AI 领域的热度为例,每天都有众多新闻值得关注。可以通过阅读各类 AI 主题的公众号、追踪相关博主的动态、参与行业微信群讨论等多元化渠道,来捕捉 AI 界的最新动态。确定一个明确且引人入胜的主题,是撰写爆款文章的第一步。 2. 利用 AI 工具 以我自己为例,我通过的 Discover 功能,挖掘了近期的热点资讯,并最终选定了文章的主题:OpenAI 对马斯克言论的回应。这个主题不仅紧跟时事,而且具有较高的关注度。 AI Social Media Post Generator | SEMRUSH 1. 生成内容想法 AI 可以在几秒钟内生成与流行话题相关的大量内容想法,确保品牌保持相关和引人注目。 2. 保持定期发布 AI 可以根据受众的兴趣提供相关的帖子,让用户可以轻松地保持一致的发布计划。 3. 获取帖子的图片 AI 可以建议与用户的内容相衬的图片,帮助帖子脱颖而出。 总之,使用 AI 追踪热门内容或主题是一种有效的方法,可以帮助用户在社交媒体上保持竞争力和吸引力。上述几种工具都可以帮助用户快速、准确地获取热门内容和主题,从而提高用户的社交媒体影响力。
2024-05-30
有哪些能够本地部署的AI视频生成模型
以下是一些能够本地部署的 AI 视频生成模型: 1. Stable Video Diffusion 模型: 准备工作:手动下载相关内容,分别放到指定路径。 模型选择:点击下拉箭头选择不同模型版本,勾选 load Model。 视频创作:支持图生视频,图片来源可选择 Midjourney、Stable Diffusion 等生成的图片,上传到 SVD 进行视频生成,可调节左侧参数控制效果。 保存路径:生成的视频在 outputs 下。 2. LTXVideo 模型: 基于 2B 参数 DiT,能够以 768x512 分辨率生成 24 FPS 的视频,速度比观看还快。 专为 RTX 4090 等 GPU 优化,使用 bfloat16 精度,实现高效内存使用且不影响质量。 ComfyUI 现已支持该模型,用户只需下载模型文件并获取工作流即可在本地运行。 3. Sora 模型: 功能:文生视频、图生视频、视频生视频,支持多种视频定制选项,如分辨率、视频长度和视频风格;具有故事板功能,允许用户通过时间线指导视频中的多个动作;提供混音和编辑功能,包括视频混音、延伸和剪辑、创建循环视频等;还有混合功能,可将两个视频场景合并成一个新的场景。 费用和订阅套餐:对于拥有 OpenAI Plus 或 Pro 账户的用户,使用包含在现有订阅中。OpenAI Plus 订阅每月 50 次视频生成次数,OpenAI Pro 订阅无限次慢速队列生成,500 次正常速度的视频生成次数。用户可根据需要选择更高分辨率的视频生成,但可能会减少每月使用次数。发布初期,某些地区(如欧洲和英国)可能会有延迟。
2025-01-21
国内文生图模型
以下是关于国内文生图模型的相关信息: Recraft 模型:用 8 个月自研模型,包含处理数据的模型、标注工作、训练 OCR 模型、新构建的数据集等。Recraft 生成带有长文本图像的流程图解,但存在生成默认是外国面孔而非亚洲面孔且生成的亚洲人不太自然的情况,可能与数据集有关。只有少数公司真正从头训练模型,创建自己的模型困难且成本高,需要超强团队和资金。 模型能力方面: 文本编码器的能力是文生图模型语义理解能力的关键。一开始大部分模型使用 CLIP 作为文本编码器,但存在一些问题。新的模型纷纷优化文本编码器能力,如引入更大更强的 T5XXL 或结合多个特征,但开源模型在中文生图方面能力一般。 腾讯开源的 HunyuanDiT 是较可用的中文生图模型,但仍存在优化空间。 Kolors 是最近开源的给力文生图模型,改进全面,技术实力强。
2025-01-21
吴恩达大模型教程
以下是一些与吴恩达大模型相关的教程和资源: 面向开发者的 LLM 入门课程: 地址: 简介:一个中文版的大模型入门教程,围绕吴恩达老师的大模型系列课程展开,包括吴恩达《ChatGPT Prompt Engineering for Developers》课程中文版等。 提示工程指南: 地址: 简介:基于对大语言模型的兴趣编写的全新提示工程指南,介绍了相关论文研究等。 LangChain🦜️🔗中文网,跟着 LangChain 一起学 LLM/GPT 开发: 地址: 简介:由两位 LLM 创业者维护的 Langchain 中文文档。 LLM 九层妖塔: 地址: 简介:包含 ChatGLM 等实战与经验。 目录:吴恩达讲 Prompt https://github.com/zard1152/deepLearningAI/wiki Coze 复刻:吴恩达开源的 AI 翻译项目 复刻步骤:包括配置反思优化的提示词、结合反思优化建议再次翻译、选择输出方式等。 大语言模型分为基础 LLM 和指令微调 LLM 两类。基础 LLM 经过训练可根据文本预测下一个词,指令微调 LLM 经过训练能遵循指令,为让系统更有帮助并遵循指令,通常会使用人类反馈强化学习(RLHF)技术优化。提示的关键原则包括尽可能保证下达的指令“清晰、没有歧义”,给大模型思考的时间以及足够的时间去完成任务。
2025-01-21
有哪个大模型工具可以提供“word文本转excel表格”功能
以下是一些可以将 word 文本转 excel 表格的大模型相关方法: 1. Markdown 格式输出 Markdown 编辑器 Excel:将大模型的输出结果复制到 Markdown 编辑器(如 Typora),然后再直接复制到 Excel,就可以得到直接可用的数据文档。 2. Markdown 格式输出 Excel 数据分组:把大模型的输出直接复制到 Excel,一般使用 Excel 的数据分列功能,用“|”作为分隔符号处理数据。 3. Markdown 格式输出 Excel 数据分组:要求大模型把输出转换成 CSV 格式,然后把结果复制到 txt 文档,另存为成 csv 文件(注意:txt 另存为时,文件后缀名更改为.csv,编码选择 ANSI)。
2025-01-21
有哪个大模型工具可以提供“word技术规范书转功能清单”功能
目前尚未有确切的大模型工具专门提供“word 技术规范书转功能清单”的功能。但一些通用的自然语言处理工具和办公软件的插件可能会对您有所帮助,例如一些基于云服务的办公自动化工具,不过其效果可能因具体的文档内容和格式而有所差异。
2025-01-21
集文档管理、AI写作、资料搜索的AI大模型推荐
以下为您推荐一些集文档管理、AI 写作、资料搜索功能于一体的 AI 大模型: 1. RAG: 工作原理:就像超级智能的图书馆员,包括检索(从庞大知识库中找相关信息)、增强(筛选优化信息)、生成(整合信息给出连贯回答)。 优点:成本效益高、灵活性强、可扩展性好。 缺点:回答准确性相对不够。 相关网站:Metaso.cn(学术、研究)、So.360.com(生活、便捷)、Devv.ai(程序员、开发者)、Perplexity(付费、高质量)、Bing.com(通用)、Google.com(全球、精准)。 内幕:平均调用 9 次大语言模型,网络爬虫预先建立数据库,用便宜但推理弱的模型(免费版)。 2. 对于律师工作: AI 大模型擅长:信息检索与整理、模式识别与预测、自动化文档处理、多任务处理能力。 AI 大模型不擅长:法律解释与推理、理解道德和情感、创新或个性化的服务。 律师擅长:法律专业知识、沟通与谈判。 3. 沉浸式翻译:主打所有网页双语翻译、PDF 文档对照阅读,新功能可一键开启网页中 Youtube 视频的双语字幕。插件安装地址:https://immersivetranslate.com/ 4. Kimi:由月之暗面科技有限公司开发,最大特点是超长文本(支持最多 20 万字的输入和输出)处理和基于文件、链接内容对话的能力,能阅读并理解多种格式文件内容为用户提供回复。
2025-01-21