Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AL最新前沿

Answer

以下是 AI 领域的一些最新前沿信息:

  • 2024 年 2 月第一周:
    • Maimo:能从任何内容中提取要点。
    • Jellypod:可将订阅内容变成播客。
    • ARTU:能汇总和总结内容。
    • Lepton Search:用 500 行代码构建的 AI 搜索工具。
    • VectorShift:AI 自动化应用构建平台。
    • Findr:AI 搜索您所有软件中的内容。
    • Recraft:AI 帮助创建平面内容和矢量标志。相关链接:AIGC Weekly#57,日期:2024/02/01。
  • 2024 年 1 月第四周:
    • 扎克伯格宣布 Meta 致力于实现 AGI,将两大 AI 研究团队 FAIR 和 GenAI 合并,并投入超 90 亿美元向英伟达采购超 34000 张 H100 显卡,预计 24 年底 Meta 的 GPU 算力达 60 万个 H100。
    • 今年英伟达总的 H100 出货量将有 15 万张,Meta 采购量占 1/5。
    • Meta 正在开发名为 Llama 3 的大语言模型,以提升代码生成和逻辑推理能力。
    • 扎克伯格推动开源的通用人工智能开发方式,这也是大家关注其进展和 Llama3 的原因。相关链接:AIGC Weekly#56,日期:2024/01/23。
Content generated by AI large model, please carefully verify (powered by aily)

References

AIGC 周刊 by 歸藏

|标题|概要|图片|链接|日期||-|-|-|-|-||2024年2月第一周|Maimo:从任何内容中提取要点<br>Jellypod:将你的订阅内容变成播客<br>ARTU:汇总和总结内容Lepton Search:500行代码构建的AI搜索工具VectorShift:Al自动化应用构建平台<br>Findr:Al搜索你所有软件中的内容<br>Recraft:Al帮助创建平面内容和矢量标志||[AIGC Weekly#57](https://waytoagi.feishu.cn/wiki/DS5HwXakBiXBelkdgbtcMRmqn9g)|2024/02/01||2024年1月第四周|扎克伯格在他的threads和Ins上发布了一段视频,宣布Meta将会致力于实现AGI,为了实现这一目标公司正将其两大AI研究团队FAIR和GenAI进行合并,同时将投入超过90亿美元向英伟达采购员超过34000张H100显卡,到24年底Meta的GPU算力将达到60万个H100.<br>今年英伟达总的H100出货量将有15万张,Meta一下就要拿走1/5真的狠。<br>对于通用人工智能究竟是什么,以及何时能实现,连扎克伯格自己也没有明确的答案。尽管如此,他依然全力以赴地研究智能的各个方面,从逻辑推理到直觉判断。Meta正在开发名为Llama 3的大语言模型,目的是提升它在代码生成和逻辑推理方面的能力。<br>重要的是扎克伯格正在推动一种开源的通用人工智能开发方式,这也是大家这么关注他的进展和Llama3的原因。||[AIGC Weekly#56](https://waytoagi.feishu.cn/wiki/LFHYwgRNnizQb2kUxPrcDC3DnWb?table=tblcsRYm5QJiaXeA&view=vewoEOVVhr)|2024/01/23|

Others are asking
additional networks 安装下载
以下是关于 additional networks 安装下载的相关信息: LORA 模型: LORA 可以固定画风、人物、物品、动作姿态等的特征,文件通常有几十上百兆,承载信息量远大于 Embedding,在还原真人物品时细节精度更高。 下载的 LORA 放在根目录的【……\\models\\Lora】文件夹下,使用时点击红色小书,找到 LORA 选项卡加载。 使用 LORA 时要注意作者使用的大模型,一般需配套使用,还可能需要加入特定触发词。 Hypernetworks 模型: 主要针对画风训练,可像 LORA 一样加载。 下载的文件放在根目录的【…\\models\\hypernetworks】文件夹下,使用时点击红色小书,找到 Hypernetworks 选项卡加载。 常用模型下载网站: 模型安装: 大模型(Ckpt):放入 models\\Stablediffusion VAE 模型:一些大模型需要配合 vae 使用,对应的 vae 同样放置在 models\\Stablediffusion 或 models\\VAE 目录,然后在 webui 的设置栏目选择。 Lora/LoHA/LoCon 模型:放入 extensions\\sdwebuiadditionalnetworks\\models\\lora,也可以在 models/Lora 目录 Embedding 模型:放入 embeddings 目录 模型存放位置示例(InstantID): 下载并放在 ComfyUI/models/insightface/models/antelopev2 git 地址:https://github.com/deepinsight/insightface/releases 网盘地址:https://www.123pan.com/s/fOu4Tdb3Vdd.html 提取码:KAKA 下载文件并放在 ComfyUI/models/instantid git 地址:https://huggingface.co/InstantX/InstantID/resolve/main/ipadapter.bin?download=true 网盘地址:https://www.123pan.com/s/fOu4Tdc3Vdd.html 提取码:KAKA 下载并放在 ComfyUI/models\\controlnet huggingface 地址 https://huggingface.co/InstantX/InstantID/resolve/main/ControlNetModel/diffusion_pytorch_model.safetensors?download=true 下载文件 Faceid 并放在 ComfyUI/models\\ipadapter 不同类型的模型后缀名几乎一样,无法通过后缀名区分时,可以通过检测。
2025-01-02
scalinglaw什么意思
Scaling Law(规模定律)指的是在模型预训练中,只要三个关键因素——模型大小、数据量、训练时间(计算量)不断增长,模型性能就能大斜率指数级爆发式提升。足够的规模带来——“涌现”,即自发地产生复杂智能,完成复杂问题的推理、并形成非同分布下的泛化性提升。 2024 年整年,一个争论笼罩着 AI 界——Scaling Law 是正确的,但在现实中,Scaling Law 是不是已经触及天花板。算力需求已达惊人规模,基础设施跟不上发展速度,优质数据接近极限,合成数据训练存在“近亲繁殖”问题可能导致模型能力长期衰退。 在 OpenAI 的相关研究中,“良好且通用的数据表示,良好且通用的数据标注,良好且通用的算法”为检测 Scaling Law 做好了准备。同时,在 Sora 的研究中,也遵循了 Scaling Law,即在足量的数据、优质的标注、灵活的编码下,Scaling Law 在 transformer+diffusion model 的架构上继续成立,其想法很大程度上沿袭了大语言模型的经验。
2024-12-30
哪些AL能完成根据财务报表生成财务分析,
目前有多种 AI 工具和技术可以辅助完成根据财务报表生成财务分析的任务。一些常见的包括专门的财务分析软件,这些软件通常结合了机器学习和自然语言处理技术,能够对财务报表中的数据进行提取、分析和解读,并生成相应的报告和分析结果。此外,一些大型的企业资源规划(ERP)系统也可能具备一定的财务分析功能,利用其内置的算法和模型来处理财务数据。但具体选择哪种 AI 工具,还需要根据您的具体需求、预算和技术能力来决定。
2024-12-30
ALPHAgo 大战李世石
AlphaGo 是由 Google DeepMind 开发的计算机程序。在 2016 年,它成为首个在围棋游戏中击败人类职业棋手的程序,并以四比一的比分战胜了世界顶级围棋选手李世石。 AlphaGo 结合了多种元素,包括价值和策略神经网络。这些网络是卷积网络,将围棋棋盘视为 19×19 输入“图像”。通过使用专业人士的围棋比赛数据训练策略网络,在监督训练阶段完成后,强化学习发挥作用,AlphaGo 与自己对抗以完善棋步策略和评估获胜可能。 2016 年 3 月在首尔,AlphaGo 对战李世石具有划时代意义,这不仅是 AI 对人类的胜利,也展示了其超越简单模式模仿、真正“思考”的开端。与早期游戏 AI 系统不同,AlphaGo 在预训练时模仿人类专家决策,还会在作答前“停下来思考”,通过模拟未来棋局和评估得分选择最优应对方式,推理时间增加其表现提升并最终超过人类。 在游戏人工智能的发展中,AlphaGo 是一个典型案例,它与电子游戏和人工智能的发展密切相关。甚至最近突破性的 AI 技术 ChatGPT 也与游戏 AI 存在一定关联。
2024-12-27
scaling law
以下是关于“scaling law”的相关信息: 在 AI 领域,“scaling law”(规模法则)具有重要意义。以下是一些相关的研究和报告: 在 GPT 相关的研究中,如Tom Henighan 等人的“Scaling laws for autoregressive generative modeling”(2020),对语言模型的规模法则进行了探讨。 在关于 OpenAI 技术栈的研究中,“良好且通用的数据表示,良好且通用的数据标注,良好且通用的算法”为检测“scaling law”做好了准备。例如在 GPT1、2、3 几代的迭代路径,以及 Sora 中,都可以在更小规模的模型和数据上检测算法的效果。同时,公理 3“Emerging properties”也是一条检验公理,用于判断“scaling law”带来的是“质变”而非“量变”。当模型随着“scaling law”的进行,突然能够稳定掌握之前不能掌握的能力,这是所有人能够直观体验到的。 此外,还有一些相关的参考文献,如Ian McKenzie 等人的“Inverse Scaling Prize:First round winners”(2022)等。
2024-12-27
如何写一个al聊天机器人
以下是关于如何写一个 AI 聊天机器人的相关内容: 一、打造聊天机器人 1. 对于订单聊天机器人,需要收集整个订单并总结,再次确认客户是否需要添加其他内容。若涉及送货,需询问地址并收取支付款项,以简短、口语化且友好的方式回应。同时要澄清所有选项、附加项和规格,唯一地从菜单中识别出项目。 2. 可以利用大型语言模型构建自定义聊天机器人,如为餐厅扮演 AI 客户服务代理或 AI 点餐员等角色。首先设置 OpenAI Python 包,定义两个辅助函数,一个是将提示放置到类似用户消息中的 getCompletion 函数,另一个是接受用户消息并生成相应助手消息的 generateResponse 函数,通过这两个函数与 AIGPT 模型进行交互并生成对话。 二、零基础模板化搭建 AI 微信聊天机器人 1. 在复制的 dockercompose.yml 文件中,修改具体配置来串联微信号和已创建好的 AI 机器人。配置参考官方来源:https://docs.linkai.tech/cow/quickstart/config 。 2. 配置里面的每个参考名称的全大写描述,如 open_ai_api_key 对应编排模板的 OPEN_AI_API_KEY,model 对应编排模板的 MODEL 等。 3. 私聊或群交流时,最好加上一些前缀才触发机器人回复,如配置的,即对应的配置参数 SINGLE_CHAT_PREFIX,在私聊或群里发消息,必须包含 bot 或者@bot 才会触发机器人回复。在群组里,对应配置参数是 GROUP_CHAT_PREFIX,机器人只会回复群里包含@bot 的消息。 4. GROUP_NAME_WHITE_LIST 参数用来配置哪些群组的消息需要自动回复。
2024-12-18
前沿AI硬件
以下是关于前沿 AI 硬件的相关信息: 由郎瀚威 Will 发起的 GenAI 硬件榜单: 定义:利用 GenAI 技术(主要是 LLM),与音频生成、翻译、视觉采集并解读相结合,以可穿戴为主逐步渗透的新品类硬件,以 Meta 雷朋眼镜为代表。 本期情况:未收录较大的 GenAI 硬件如 AI PC、AI 手机,以可穿戴、AI 助理相关硬件为起点。 榜单受众:GenAI 硬件创始人、投资人、从业者等。 榜单标的:以北美市场的视角,销量、影响力为主。 榜单初心:随着 Meta 眼镜的成功,GenAI 硬件爆发在即,每月从多角度围观这一现象,旨在给创业者提供参考。 本次更新(9.19): 更新亚马逊销量、独立站流量、新品发布、融资信息,排序标准从媒体综合指数改为 Tiktok 热度。 完善挂件、戒指、眼镜等分类榜数据。 榜单目录:包括 GenAI 硬件北美公开销量榜、GenAI 硬件亚马逊销量榜等共 15 个重要榜单。更多榜单可文末点击“阅读原文”免费访问或直接访问飞书:https://zw73xyquvv.feishu.cn/wiki/IqcqwTDiYiKttNktBg3cg8HgnLh 。数据来源:google、tiktok、twitter、亚马逊。对于榜单内容有疑问想交流的 GenAI 硬件创始人,或者想合作转载内容的公众号博主,请加微信,或者在本文末留言。 今年很火的几款 AI native 硬件: Rewind Pendant:可穿戴设备,能捕捉现实中所说和听到的内容,进行录音转录、数据加密和本地存储,保障安全性和隐私保护。https://www.rewind.ai/pendant Rabbit R1:新型人工智能驱动的移动设备,通过高级语音命令简化应用程序使用,售价 199 美元,配备 360 度摄像头、触摸屏和 4G 连接。Rabbit OS 基于 Large Action Model(LAM 大动作模型),能处理自然语言并转化为可执行任务,与常见应用交互,支持语音命令执行复杂任务,未来用户可教会其执行特定任务。https://www.rabbit.tech/
2024-12-27
AI图生视频前沿
以下是关于 AI 图生视频前沿的相关信息: 在近半年闭源产品趋势方面: 1. 服务头部创作者方面,产品将逐渐增强编辑器能力,强化视频细节可控性,并智能化后期制作任务。 2. 影视后期方向,可将动捕演员表演转化为虚拟角色,提高特效制作效率。 3. 专业领域,创作者能通过草图分镜快速验证效果,但目前效果不够成熟。 4. 随着实时生成能力提升和成本下降,AI 实验性艺术在博物馆、展览等互动应用将增多。 5. 在 C 端大众消费侧,AI 视频在小说、网文阅读、短情景剧等内容消费方向有潜力,人物识别和替换可衍生电商平台虚拟试衣间能力。 6. 模板套用能力若以低成本开放在短视频产品中,可能带来新的爆发周期。 其他动态包括: 1. Krea 用开放的 API 做了自己的 AI 视频功能,支持对任何视频输入提示词进行延长。 2. Runway 发布 ActOne 功能,支持将现实视频的人物表情和动作迁移到生成的视频上,且已全量开放。 3. Ideogram 发布 Ideogram Canvas,可在无限画布上对生成的图片进行编辑。 4. Meta 的图像分割模型 SAM 更新了 2.1,大幅加强了相似物体和小物体的分割和识别效果。 在 2024 年国内外 AI 企业竞争方面: 1. 中国开源项目赢得全球粉丝,成为积极开源贡献者。DeepSeek 在编码任务中表现出色,阿里巴巴的 Qwen2 系列视觉能力令人印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。 2. 国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,并在定制化方面进步显著。今年 3 月推出的 Stable Video 3D 可预测三维轨道。 3. OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等,还使用原始大小和纵横比的视觉数据训练。 4. Google DeepMind 的 Veo 将文本和可选图像提示与嘈杂压缩视频输入结合,创建并解码独特的压缩视频表示。
2024-12-26
ai视频前沿
以下是关于 AI 视频前沿的相关信息: AI 视频学社: 简介:为方便大家测试学习 AI 视频相关知识和内容而建立,可通过参与每周比赛、观看高手直播分享来快速学习,涵盖 AI 视频和影视创作领域最前沿的知识。 目标: 不定期直播,AI 视频方向高手直播分享。 每周固定 1 次 video battle 视频挑战赛,周一发布主题,周日 18 点前交稿,有奖品。 不定期组织线上或者线下活动。 一起学习 AI 视频最新软件和最新知识,学习图生视频、视频生视频等技巧。 软件教程: 每周一赛: 2024 人工智能报告: 2024 年是 AI 图像视频迅速发展的一年,赛道竞争激烈。 国内:中国开源项目赢得全球粉丝,成为积极开源贡献者。几个模型在个别子领域表现出色,如 DeepSeek 在编码任务中受青睐,阿里巴巴的 Qwen2 系列视觉能力印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。 国外:Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,还推出了 Stable Video 3D。OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等。Google DeepMind 的 Veo 将文本和图像提示与视频输入结合生成高分辨率视频。 AI 视频生成产品推荐及实践教学: Runway:年初在互联网爆火,由总部位于旧金山的 AI 创业公司制作,2023 年初推出的 Gen2 代表当前 AI 视频领域前沿模型,能通过文字、图片等生成 4s 左右视频,致力于专业视频剪辑领域的 AI 体验,同时扩展图片 AI 领域能力。目前支持网页、iOS 访问,网页端有 125 积分免费试用额度(可生成约 105s 视频),iOS 有 200 多,两端额度不同步。官方网站:https://runwayml.com/ Gen1 和 Gen2 的区别和使用方法:Gen1 的主要能力有视频生视频、视频风格化、故事版、遮罩等,仅支持视频生视频是与 Gen2 的最大差异。Gen1 使用流程: Gen1 能力介绍:https://research.runwayml.com/gen1 Gen1 参数设置:https://help.runwayml.com/hc/enus/articles/15161225169171 学习视频:https://youtu.be/I4OeYcYf0Sc
2024-12-26
目前最前沿的应用在游戏领域的AI技术点是什么,包括游戏开发过程中的成本降低、效率提升,包括游戏内容生成,包括游戏后期运营推广。介绍技术点的技术逻辑以及技术细节。
目前在游戏领域应用的前沿 AI 技术点主要包括以下几个方面: 1. 利用 AIGC 技术实现游戏产业的生产力革命: 降低开发成本:借助人工智能的内容创作工具,如生成新的游戏内容(地图、角色和场景)、驱动游戏中的非玩家角色(NPC)、改进游戏的图像和声音效果等,能够缩减游戏开发的成本。 缩短制作周期:例如通过程序化内容生成,包括利用人工智能生成文字、图像、音频、视频等来创作游戏剧本、人物、道具、场景、用户界面、配音、音效、配乐、动画和特效等,从而减少游戏开发时间。 提升游戏质量和带来新交互体验:AIGC 技术为游戏带来不同以往的新体验,甚至创造出新的游戏类型以及新的交互方式。 2. 游戏内容辅助生成: 生成文、生成图、生成 3D 以及生成音乐。应用场景包括游戏策划人和制作人、美术设计师等。 对于工业化的游戏公司,基于 Stable Difussion 的生成能够通过 2D 美术素材的辅助生成提高创业效率 50%,降低 20%80%的成本。 文生图:通过提示词加参数就可以形成 2D 的参考图,适配度高。 图生图:原画师或美术可以使用,用一个线稿或原画,在原画基础上加一些 Prompt 和参数,就可以形成一个效果图和二级的素材。 动画辅助渲染:用 Lora 对角色背景、关键帧进行风格渲染,例如将真人视频渲染成二次元风。 3. 游戏的智能运营: 智能 NPC 互动:保持长期记忆,保持人物个性和对话表现形式,同时满足成本平衡。 客服、攻略的问答、代码和脚本的生成。主要针对游戏的产品经理、运营经理和社区的运营经理。 游戏社区运营:如海外的 Discord,国内的 Fanbook,让更多玩家在游戏之外,在社群里面很好地互动,基于游戏的美术素材进行二创、查询攻略和使用智能客服。 这些技术的技术逻辑和技术细节如下: 1. AIGC 技术:基于大语言模型和扩散模型,通过机器学习、强化学习等先进技术进行训练,能够理解和生成各种游戏相关的内容。 2. 游戏内容辅助生成:利用深度学习算法对大量的游戏相关数据进行学习和分析,从而能够根据给定的提示或参数生成相应的游戏内容。 3. 智能运营方面:通过构建智能模型,对玩家的行为和需求进行分析和预测,从而提供个性化的服务和互动。
2024-12-22
目前最前沿的应用在游戏领域的AI技术点是什么,包括游戏开发过程中的成本降低、效率提升,包括游戏内容生成,包括游戏后期运营推广。
目前在游戏领域最前沿的 AI 技术点主要包括以下几个方面: 1. 探索将游戏环境中的成果迁移至现实世界:电子游戏作为人工智能算法的测试场,为人工智能模型的构建与训练提供了理想化的场所。但将游戏中的技术推广到现实世界应用仍面临诸多挑战。 2. 利用 AIGC 技术实现游戏产业的生产力革命: 借助人工智能的内容创作工具,降低开发成本、缩短制作周期、提升游戏质量和完成度,带来新体验,创造新游戏类型和交互方式。 应用于电子游戏开发的多个方面,如生成新的游戏内容(地图、角色和场景)、驱动游戏中的非玩家角色(NPC)、改进游戏的图像和声音效果等。 3. 为通用人工智能的孵化提供帮助:经过多个复杂游戏训练后的“玩游戏”的人工智能体。 4. 借助人工智能完成大型游戏的制作:如《微软模拟飞行》通过与 blackshark.ai 合作,利用人工智能从二维卫星图像生成无限逼真的三维世界,且模型可随时间改进。 5. 生成式人工智能模型在游戏资产中的应用:出现了用于游戏中几乎所有资产的生成式人工智能模型,包括 3D 模型、角色动画、对话和音乐等。 6. 降低游戏制作的内容成本:整合生成式 AI 可大幅降低制作游戏的时间和成本,例如为一张图片生成概念图的时间从 3 周下降到 1 小时。
2024-12-22
目前最前沿的应用在游戏领域的AI技术点是什么
目前在游戏领域最前沿的 AI 技术点包括以下方面: 1. 生成式 AI:这是一种机器学习类别,计算机能根据用户提示生成新内容,在文本和图像方面应用较为成熟,甚至可用于创造具有完整性格的虚拟角色。 2. 智能对手的进化:早期游戏中的虚拟对手只是简单脚本程序,如今借助更快的微处理器和云技术,可构建大型神经网络,实现更复杂的模式识别和表示,使对手具备学习能力。 3. 未来发展方向: 探索将游戏环境中的成果迁移至现实世界,虽然在特定游戏环境中成果显著,但推广到现实世界仍面临诸多挑战。 利用 AIGC 技术实现游戏产业的生产力革命,如生成新的游戏内容、驱动非玩家角色、改进图像和声音效果等。 为通用人工智能的孵化提供帮助,经复杂游戏训练后的人工智能体有望在通用人工智能领域发挥作用。 此外,狭义的游戏人工智能研究致力于创造类人水平的智能体在多种游戏中战胜人类玩家,广义的还包括探索用于设计和开发游戏的人工智能技术,如游戏图像生成、关卡生成等。随着深度学习技术的发展,人工智能不仅用于“玩游戏”,还用于游戏的设计、开发和测试等多个方面。
2024-12-22
Ai最新发展成果
以下是 AI 的一些最新发展成果: 医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究,AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。 AI 提前三年诊断胰腺癌。 两名高中生与医疗技术公司合作,发现了与胶质母细胞瘤相关的新靶基因。 AI 帮助抗衰老,筛查出高效的药物候选物。 使用 AI 寻找阿尔兹海默症的治疗方法。 AI 帮助早期诊断帕金森。 应用形态重构: AI Agent 取得突破,为机器人获得自主行动能力指明新方向。 AI 编程工具的进展预示着人机协作模式的变革。 2024 年关键进展时间线: 2 月,OpenAI 发布视频生成模型 Sora,开创 AI 视频生成新纪元。 3 月,Suno 发布 V3 版本,AI 音乐生成进入生产力可用状态。 4 月,Meta 发布高性能开源大模型 Llama3,降低了 AI 技术的准入门槛。 5 月,GPT4 发布,RayBan 与 Meta 合作的智能眼镜销量突破百万,字节上线即梦 AI。 6 月,快手发布可灵。 9 月,OpenAI 发布 o1 预览版。 10 月,Rosetta 和 AlphaFold 算法的研发者因在蛋白质结构设计和预测中的突破性贡献获得诺贝尔化学奖,约翰·霍普菲尔德和杰弗里·辛顿因人工神经网络和深度学习的开创性贡献获诺贝尔物理学奖,Anthropic 大模型 Claude 3.5 Sonnet 获得“computer use”功能。 12 月,OpenAI 发布 o3 系列模型。 基础通识课: 讨论了 AI 模型的基础、最新进展,包括视频生成模型、相关论文,以及 AI 在诺奖和蛋白质研究领域的应用等。 回顾了人工智能的发展历程,从图灵测试到如今大模型和多模态模型百花齐放。 指出大模型由数据、算法、算力构成,算法有技术架构的迭代,数据质量对生成理想的大模型至关重要。 针对弱智 8 的问题对大模型进行测试,开展让大模型回复问题并找出真人回复的活动,且国内大模型的回答能力有很大改进。 早期大语言模型回复缺乏情感,如今有所改进,后续将体验几个大模型的回复场景。
2025-01-03
请整理最新的 gpt的提示词。
以下是关于 GPT 提示词的相关内容: 1. 15 个月之后创作童谣的提示词: 需求分析:上一次需要输入“创作童谣的场景、角色、故事等”,这次只需输入一个关键词即可创作。 输入:任意关键词。 输出:跟关键词相关的儿童童谣。 测试现有模型的效果:对包括 ChatGPT 4o、ChatGPT o1、Claude、Kimi、豆包、智谱清言 GLM4、Gemini 2.0 Flash Experimental、Gemini 2.0 Flash Thinking Experimental 等模型进行了测试,除 LIana 3.1 405B 的输出未贴出,其他模型的结果可供感受和评价。 2. GPT 优化 Prompt: 存在问题:某些标题使用太绝对和夸张的描述,如“小姐姐的必备”“你值得拥有”“秒变心情大好”。 分析:包括日常口语风格可能带有夸张倾向、情感色彩可能被放大、示例可能影响、对“过度”标准理解差异等。 优化措施:在日常口语风格部分避免使用太绝对的词语;在情感色彩部分避免使用过于强烈的正面情感描述;在 Constraints 部分添加避免使用绝对性词汇;对 Examples 部分进行更严格筛选。 3. AI 快速总结群聊消息的提示词: 直接发送原文 GPT 无法按意图工作,需编写提示词。 单人发言版:基于李继刚老师的“通知消息整理助手”修改了“文字排版大师”的 Prompt。 多人发言版:将提示词和文字原文发送给 GPT,整理输出结果,删掉无关内容,替换双星号。
2025-01-02
最新ai资讯
以下是为您整理的最新 AI 资讯: Recraft AI 作为 AI 平面设计工具,更新了 60 种新的图像风格。用户可利用其生成和编辑插画、海报、产品周边等,每日有免费试用点数,生成的图像可商业使用。地址:https://www.recraft.ai/ 。 AI 公文智能体“学习强国公文助手”在文小言 APP 正式上线,可进行文汇检索、AI 公文书写、AI 公文润色等。使用方式:下载文小言 APP 找寻。 Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位:https://jobs.netflix.com/jobs/278437235 。 Shopify 的 AI 助手 Sidekick 已上线,它能在 Shopify 中执行多种操作,如提取相关数据、操作新功能或创建报告:https://techcrunch.com/2023/07/26/shopifysidekickislikechatgptbutforecommercemerchants/ 。 Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能:https://twitter.com/Artifact_News/status/1684631632374902784?s=20 。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,旨在确保 AI 模型的安全发展:https://openai.com/blog/frontiermodelforum 。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器:https://techcrunch.com/2023/07/25/openaiscuttlesaiwrittentextdetectoroverlowrateofaccuracy/ 。 对于新手学习 AI,建议持续学习和跟进,关注 AI 领域的新闻、博客、论坛和社交媒体,加入相关社群和组织,参加研讨会、工作坊和会议,与其他爱好者和专业人士交流。 您还可以通过以下渠道获取更多 AI 资讯: AI 资讯公众号:超时空视角 小红书/抖音:EverAI B 站:Ever AI 酱(这里会有教程及 AI 工具界面操作) 公众号地址(辛苦点赞):https://mp.weixin.qq.com/s/TBHiM_0w_bwUc20_KVQQ
2025-01-02
我想知道目前最新、效果最好、代码和模型开源的动作捕捉算法,也叫做人体姿态估计,是哪篇文章
目前最新、效果较好且代码和模型开源的人体姿态估计(动作捕捉算法)相关的研究有以下两篇: 1. 【SD】最强手部识别,controlnet 新预处理器 dw openpose 作者:白马少年|公众号:【白马与少年】 发布时间:20230813 20:00 原文网址:https://mp.weixin.qq.com/s/_RiKxWy9MXt4DUJIKH5w 介绍:在 controlnet 中,手部识别一直使用的是 openpose 预处理器,但复杂手势有时无法识别。新的 dw openpose 预处理器能完美解决手部识别问题,将其放入特定目录即可使用。但需说明的是,目前这个 DW Pose 只是更精确的 openpose 预处理器,未对 ControlNet 的 openpose 模型做改动。 2. YOLONAS Pose:一个开源的实时人体姿态估计模型 应用场景:基于骨骼标记为基础,适用于智慧体育等场景,可对训练过程的姿态、数据、状态等进行统计和管理。 技术类型:视频、AI 学习模型 简介:主要功能是识别图片和视频中人的姿势,能快速处理图像并实时返回姿态数据,适应不同场景和设备。 主要特点: 实时性能:旨在提供实时的姿态估计,适用于需要即时反馈的应用。 高精度:利用神经网络架构搜索(NAS)提高姿态估计的准确性。 优化的网络结构:NAS 自动测试不同网络结构,找到最优模型。
2024-12-31
最新的图像生成产品是哪个
以下是一些最新的图像生成产品: Stability AI 最近推出了全新的开源图像生成模型 DeepFloyd IF,基于深度学习技术,能生成高质量、可控且稳定的图像。 DeepFloyd 是最新最先进的开源文本图像模型,语言理解能力强,生成图像真实感高。 在图像生成产品的排行中,4 月访问量较高的有 Adobe firefly、Freepik、Civitai 等;6 月访问量较高的有 undress、Tensor.Art 等。
2024-12-30
openai 发布的sora最新模型中,生成视频的提示词与一般问答提示词有什么区别或者注意事项?
Sora 是 OpenAI 于 2024 年 2 月发布的文本到视频的生成式 AI 模型。 生成视频的提示词与一般问答提示词的区别和注意事项如下: 1. 对于视频生成,神经网络是单射函数,拟合的是文本到视频的映射。由于视频的动态性高,值域大,因此需要丰富且复杂的提示词来扩大定义域,以学好这个函数。 2. 详细的文本提示能迫使神经网络学习文本到视频内容的映射,加强对提示词的理解和服从。 3. 和 DALL·E 3 一样,OpenAI 用内部工具(很可能基于 GPT4v)给视频详尽的描述,提升了模型服从提示词的能力以及视频的质量(包括视频中正确显示文本的能力)。但这会导致在使用时的偏差,即用户的描述相对较短。OpenAI 用 GPT 来扩充用户的描述以改善这个问题,并提高使用体验和视频生成的多样性。 4. 除了文本,Sora 也支持图像或者视频作为提示词,支持 SDEdit,并且可以向前或者向后生成视频,因此可以进行多样的视频编辑和继续创作,比如生成首尾相连重复循环的视频,甚至连接两个截然不同的视频。 以下是一些 Sora 的案例提示词,如:“小土豆国王戴着雄伟的王冠,坐在王座上,监督着他们广阔的土豆王国,里面充满了土豆臣民和土豆城堡。”“咖啡馆的小地图立体模型,装饰着室内植物。木梁在上方纵横交错,冷萃咖啡站里摆满了小瓶子和玻璃杯。”“一张写有‘SORA’的写实云朵图像。”“一群萨摩耶小狗学习成为厨师的电影预告片‘cinematic trailer for a group of samoyed puppies learning to become chefs’”
2024-12-27