直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

有没有关于大模型的实战技术文章

回答

以下是为您找到的关于大模型的实战技术文章:

  1. 《认识大模型 Embedding 技术加实战》
    • 小结:认识了 Embedding 是浮点数向量,向量距离度量相关性,了解其分类及在大模型中的价值,还有从数据集中获取 Embedding 结果并保存为 csv 文件的实战部分。参考了 OpenAI 官网最新文档,包含个人测试问题和代码注释。链接:https://platform.openai.com/docs/introduction
    • 原文链接:https://mp.weixin.qq.com/s/8mDLFFmgKOQC8WK2kkwhaA 原创:皇子|皇子谈技术|2024-03-21 19:54 大模型应用开发技术不需要掌握机器学习和深度学习算法,但要有编程思维和 Python 基础。
  2. 《ChatBot 是怎么炼成的?》
    • 介绍了 LLM 基座大模型下游应用 ChatBot 的研发过程,在介绍 ChatBot 之前,先介绍了 LLM 在辅助编程方面的应用,包括 Codex 和 AlphaCode 两个奠基性工作,Codex 提出了编程数据集和 pass@k 指标,并采用了 2 阶段训练方式,还介绍了 Codex 的局限性和辅助编程问题定义。作者:[aaronxic] 链接:https://ywh1bkansf.feishu.cn/wiki/HRnLw588DiTDLPkSTXCcKit8nbD 发布日期:2023/07/08
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

认识大模型 Embedding 技术加实战

我们认识了Embedding(嵌入)是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小的距离表示高相关性,大的距离表示低相关性。知道了Embedding共有:词、句子、文档、图像等分类。还分析了Embedding在大模型中的价值。最后是Embedding的实战部分:从数据集中获取Embedding结果,并保存为csv文件。最后,本示例中的实战代码,参考的是官方最新文档的内容,加上个人测试阶段的遇到的问题、代码注释等OpenAI官网文档链接:https://platform.openai.com/docs/introduction大模型技术,除了在OpenAI官网能看到的:Embedding、Function Call和Fune Tuning等。进阶到企业级应用开发的大模型技术还会涉及到:利用开源的Embedding模型、向量数据库去做检索增强生成(RAG),以及购买GPU服务器去基于开源大模型搭建企业级大模型项目。

认识大模型 Embedding 技术加实战

原文链接:https://mp.weixin.qq.com/s/8mDLFFmgKOQC8WK2kkwhaA原创:皇子|皇子谈技术|2024-03-21 19:54有朋友说想学习大模型应用开发技术,让我谈一谈。首先大模型应用开发技术不需要我们掌握机器学习和深度学习的算法,但是要有编程思维、python基础,然后跟着下面的步骤走,就能学得明白。下面正式开始认识大模型Embedding的理论知识,加代码实战。看大家反馈,如果觉得难,我有打算接着《[讲清Transformer模型架构](http://mp.weixin.qq.com/s?__biz=MzkyMzYyNjQxOQ==&mid=2247484298&idx=1&sn=d638818dab71ce80a5e9426a0393cfc9&chksm=c1e37d56f694f440291b7cf5f233cfebea0696f76d838d28fb6854f2e40150c4411e9bf2a76b&scene=21#wechat_redirect)》,继续往后写GPT和BERT模型,又或者加入更多的实战,欢迎私信交流。

小A-技术开发/大模型

|标题|备注|作者|链接|发布日期|附件(1)|单选|<br>|-|-|-|-|-|-|-|<br>|ChatBot是怎么炼成的?|本文介绍了LLM基座大模型下游应用ChatBot的研发过程。在介绍ChatBot之前,作者先介绍了LLM在辅助编程方面的应用,主要包括Codex和AlphaCode两个奠基性工作。Codex提出了编程数据集和pass@k指标,并采用了2阶段训练方式。文章还介绍了Codex的局限性和辅助编程问题定义。|[aaronxic](https://www.zhihu.com/people/aaronxic)|[(3)ChatBot是怎么炼成的?](https://ywh1bkansf.feishu.cn/wiki/HRnLw588DiTDLPkSTXCcKit8nbD)|2023/07/08|||<br>|多模态的大一统之路|首先介绍了Vision Transformer的入门知识和相关的应用。包括了[ViT(2020.10)](https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2010.11929),[ViT-22B(2023.02)](https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2302.05442),[Swin Transformer(2021.08)](https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2103.14030),[MAE(2021.11)](https://link.zhihu.com/?

其他人在问
RAG实战教程推荐
以下为您推荐一些 RAG 实战教程: 1. 【AI+知识库】商业化问答场景,让 AI 回复更准确,一篇专为所有“小白”讲透 RAG 的实例教程(上篇): 介绍了常见的错误场景,如回答不准确、报价错误、胡编乱造等,强调了优化 AI 准确回答的重要性,并引出 RAG 概念。 讲解了基础概念,包括优化幻觉问题和提高准确性需要了解从“问题输入”到“得到回复”的过程,并针对每个环节逐个调优。 阐述了检索原理,包括问题解析阶段通过嵌入模型将问题文本转化为向量,知识库检索阶段比较向量选择相关信息片段,信息整合阶段构建融合全面的信息文本,大模型生成回答阶段将整合后的信息转化为向量输入大语言模型生成回答。还通过实例进行了详细说明,如知识库检索部分的向量化、优化问题、向量检索、抽取内容块等,以及大模型对话部分。 2. 开发:LangChain 应用开发指南 不用向量也可以 RAG: 以餐饮生活助手为例展示了基于结构化数据来 RAG 的实战方法,包括给出用户提问和回复的示例,以及餐饮生活助手 RAG 的代码实战。 介绍了实现餐饮生活助手 RAG 的 Langchain 代码实战需要完成的步骤,如定义餐饮数据源,将餐饮数据集转化为 Langchain 可识别和操作的数据源并注册到 Langchain 中;定义 LLM 的代理,通过 Langchain 的代理根据用户问题提取信息、形成查询语句、检索数据源、生成答案并输出给用户。
2025-04-01
RAG 开发实战
以下是关于 RAG 开发实战的详细内容: RAG 是一种结合了检索和生成的技术,能让大模型在生成文本时利用额外的数据源,提高生成质量和准确性。其基本流程为:首先,用户给出输入,如问题或话题,RAG 从数据源中检索相关文本片段(称为上下文);然后,将用户输入和检索到的上下文拼接成完整输入传递给大模型(如 GPT),此输入通常包含提示,指导模型生成期望输出(如答案或摘要);最后,从大模型输出中提取或格式化所需信息返回给用户。 以餐饮生活助手为例进行 RAG 的 Langchain 代码实战,需完成以下步骤: 1. 定义餐饮数据源:将餐饮数据集转化为 Langchain 可识别和操作的数据源(如数据库、文件、API 等),注册到 Langchain 中,并提供统一接口和方法,方便 LLM 代理访问和查询。 2. 定义 LLM 的代理:通过 Langchain 的代理(Agent)实现,代理管理器可让开发者定义不同 LLM 代理及其功能逻辑,并提供统一接口和方法,方便用户与 LLM 代理交互。
2025-03-20
我需要的是学习目录,比如 基础--专项---实战等路径
以下是为您提供的 AI 学习目录: 基础部分: 根据电脑硬件和自身财力选择合适的开始方式,包括本地部署(M 芯片的 Mac 电脑或 2060Ti 及以上显卡的 Windows 电脑)、在线平台(在线出图和云电脑),不建议一开始就配主机。 熟练使用文生图、图生图,具备一定逻辑思考和推理能力。 掌握数学基础(线性代数、概率论、优化理论等)和编程基础(Python、C++等)。 专项部分: 建炉,针对不同炼丹方式提供炼丹工具的安装教程。 数据集预处理、模型训练以及模型调试及优化。 自然语言处理:语言模型、文本分类、机器翻译等。 计算机视觉:图像分类、目标检测、语义分割等。 实战部分: 通过真实业务场景的项目案例,如研报生成、旅游搭子、即拍即搜等积累实战经验。 模型部署:模型优化、模型服务等。 请注意,以上内容仅供参考,您可以根据自身需求和实际情况进行调整和学习。
2025-03-17
AI产品经理实战学习
以下是为您提供的关于 AI 产品经理实战学习的相关内容: 北京分队中从事相关工作或有相关经验的人员包括: 枫 share:产品经理,熟悉 ChatGPT,写过 prompt,使用过 SD、MJ 但有待深入学习,用 PR、剪映剪辑过多个视频和播客音频,正在找 AI 方向的产品岗位,坐标海淀(北五环)。 行远:产品经理,熟悉 prompt,部署过大模型、绘图项目,使用 Midjourney、sd、pika、suno 等 AI 创作工具,期待学习和实战案例应用,坐标朝阳。 管子:数据科学家,熟悉 prompt 创作,midjourney,runway,正在学习 stable diffusion,期待学习、打磨作品,坐标朝阳(望京和国贸)。 猫先生:算法技术出身,2022 年开始持续关注并学习 AIGC 方向,部署过大模型、绘图、视频生成等项目,熟悉 pika、runway、svd、sd、gpt4、comfyui 等工具,坐标海淀。 Andy:技术出身,刚开始学习 AIGC,部署过大模型、SD 等,写过代码调用 API,熟悉使用 ChatGPT、Kimi、coze 等,关注 AI 在教育领域的应用,坐标通州。 AI 产品经理的个人划分(仅供娱乐和参考): 1. 入门级:能通过 WaytoAGI 等开源网站或一些课程了解 AI 的概念,使用 AI 产品并尝试动手实践应用搭建。 2. 研究级:有两个路径,一个是技术研究路径,一个是商业化研究路径。这个阶段对应的画像可能是对某一领域有认知,可以根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用:有一些成功落地应用的案例,如产生商业化价值。 对 AI 产品经理的要求:懂得技术框架,不一定要了解技术细节,而是对技术边界有认知,最好能知道一些优化手段和新技术的发展。AI 产品经理要关注的还是场景、痛点、价值。 此外,阿里云 AI 实训营携手 WaytoAGI 讲师走进 GDC 全球开发者先锋大会,活动包括: 学练议程:2 月 21 日 09:30 12:30 通义灵码 0 基础应用开发,人人都是软件创作者;2 月 21 日 13:30 16:30 为你的 AI 应用装上眼睛;2 月 22 日 08:30 12:00 人工智能平台 PAI:DeepSeek 部署和应用实战。 分享嘉宾:张梦飞(词元映射 CEO,WaytoAGI Agent 核心创作者)、银海(AI 产品经理,WaytoAGI 社区共建者)、瑞雪(通义实验室科学家)、许键(AI 产品经理,WaytoAGI Agent 版主)。 实训福利:打卡有礼(现场分享打卡,领 AI 实训营定制周边)、学练有礼(现场提交作业,领阿里云精美好礼)。 活动地点:上海徐汇西岸艺术中心 B 馆(BW01)。感兴趣的学员可扫码参会。
2025-02-25
AI产品经理实战手册
以下是为您提供的关于 AI 产品经理的相关信息: 1. 2 月 7 日的《DeepSeek 爆火的当下:2025,人人都是顶尖 AI 产品经理实操指南》指出,过去一年“AI 在产品管理中的应用”成为热门话题,“所有产品经理都需要成为 AI 产品经理”的观点在各种场合反复出现,AI 正在重塑工作方式。 2. 《Claude 的 5 层 Prompt 体系:从 AI 用户到 AI 指挥官的进阶之路》中提到,将复杂需求拆解为原子化 Prompt 组件是掌握 5 层 Prompt 体系的关键,并通过跨国科技公司规划下一代智能家居系统的实际案例展示了应用方法,包括 User Requirement、System Prompt、Global Rule 等多个层面,还创建了多种风格用于不同场景。 3. 对于 AI 产品经理的划分,仅供娱乐和参考: 入门级:能通过开源网站或课程了解 AI 概念,使用并动手实践应用搭建。 研究级:有技术研究和商业化研究两个路径,能根据需求场景选择解决方案,或利用工具手搓出 AI 应用验证想法。 落地应用级:有成功落地应用案例并产生商业化价值。同时指出,对 AI 产品经理要求懂得技术框架,对技术边界有认知,产品经理要关注场景、痛点、价值。还列举了一些落地案例。
2025-02-24
飞书多维表格DeepSeek实战
以下是关于飞书多维表格 DeepSeek 实战的相关信息: 共学课程安排: 【今晚 8 点】聊聊你怎么使用 DeepSeek!:共学大类为 AIagent,讲师为全体,飞书会议地址为,共学时间为 2025 年 2 月 6 日。 飞书多维表格 DeepSeek 实战:共学大类为多维表格字段捷径,讲师为王大仙,飞书会议地址为,共学时间为 2025 年 2 月 10 日。 关于 DeepSeek 的介绍: DP 模型的功能包括自然语言理解与分析、编程、绘图等。使用优势是能用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容,但存在思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本的问题。审核方法可以用其他大模型来解读其给出的内容,使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知,使用场景包括阅读、育儿、写作、随意交流等方面,还有案例展示。 Deepseek 文档可在 3 群和 4 群分享获取,也可在 v to a gi 的飞书知识库中搜索获取。介绍了 Deepseek 的模型、收录内容、提示词使用技巧和好玩的案例等。未来活动预告包括明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 Deepseek。 相关社区动态: 2025 年 2 月 10 日,有《》DeepSeek R1 赏析分享会,专为非技术人群设计,介绍了技术亮点、未来展望及对流行谣言的澄清。 2025 年 2 月 10 日,有《》,讲述了 DeepSeek 的崛起原因、V3 模型特点及竞争策略。 2025 年 2 月 10 日,有《》,介绍了飞书多维表格与 DeepSeek R1 结合的使用方法和效果。
2025-02-12
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
对于用cursor来开发,有没有好好用prompt来使cursor变得更加好用
以下是关于如何用 prompt 使 Cursor 变得更好用的相关内容: 在 prompt 方面,Devin 有一个特别有帮助的文档(https://docs.devin.ai/learnaboutdevin/prompting),它会教您什么样的 prompt 在与 Devin 沟通时最有效,比如明确定义成功的标准,如跑通某个测试或访问某个链接能对得上等。将同样的原则应用到 Cursor 中,会发现 Cursor 变得聪明很多,能自主验证任务完成情况并进行迭代。 Cursor 在生成单测方面表现出色。相对 GPT 等工具,Cursor 解决了上下文缺失和难以实现增量更新的问题。它可以向量化整个代码仓库,在生成单测代码时能同时提供目标模块及对应的上下游模块代码,生成结果更精确。例如,使用适当的 Prompt 能返回基于 Vitest 的结果,调整成本较小。 Cursor 支持使用.cursorrules 文件设定项目的系统提示词,针对不同语言可设定不同的 Prompt。@AIChain 花生做了一个 Cursor 插件解决提示语管理问题,可选择不同的.cursorrules 文件,还可从 https://cursor.directory/ 和 https://cursorlist.com/ 寻找提示词。此外,还有一个提示语小技巧,给已有的提示语追加上特定规则,可使模型在搜索资源和思考时默认使用英语,回复转换成中文,或更灵活地根据提问语言进行回复。
2025-04-14
有没有把pdf转成word的ai
以下是一些可以将 PDF 转换成 Word 的 AI 工具和方法: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-04-14
有没有AI面试
有的,目前有一些 AI 面试官的相关产品。例如: 1. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。能帮助企业完成面试,借助人岗匹配模型自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善、到面率比之前提升最高达 30%。 3. InterviewAI:这是一个在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。 不过,使用这些产品时,企业需要考虑到数据安全性和隐私保护的问题。 此外,在 3 月 19 日的 XiaoHu.AI 日报中,提到了一些其他的 AI 相关内容: 1. 克隆一个自己,用 AI 面试:创新的克隆 AI 面试应用。链接:https://x.com/imxiaohu/status/1770011969229390287?s=20 2. SystemAnimatorOnline,全身运动捕捉:基于 AI 的全身运动捕捉方案,仅需网络摄像头。新交互方式,适用于虚拟直播和视频制作。链接:https://github.com/ButzYung/SystemAnimatorOnline… 、https://x.com/imxiaohu/status/1769957973252796634?s=20 3. Apollo 机器人,自主制作果汁:展示与英伟达 Project GROOT 合作,实现任务自主完成。从人类示范中学习,无需回初始位置。链接:https://x.com/imxiaohu/status/1770047098731577481?s=20 4. MindEye2,重建大脑所见图像:仅需 1 小时 fMRI 数据,重建观察者所见图像。能识别多个图像选项中的实际所见。实现不同受试者数据的有效泛化。链接:https://medarcai.github.io/mindeye2/ 、https://arxiv.org/abs/2403.11207 、https://github.com/MedARCAI/MindEyeV2 、https://x.com/imxiaohu/status/1770021233129885989?s=20 5. 英伟达 Blackwell GPU
2025-04-14
有没有优质的系统的coze入门网课?
以下是一些优质的系统的 Coze 入门网课推荐: 另外,还有“一泽 Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力”,这可能是全网最好的 Coze 教程(之一),即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。其核心看点包括通过实际案例逐步演示用 Coze 工作流构建能够稳定按照模板要求生成结构化内容的 AI Agent、开源 AI Agent 的设计到落地的全过程思路、10+项常用的 Coze 工作流的配置细节、常见问题与解决方法等。适合任何玩过 AI 对话产品的一般用户,以及希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。但需注意,本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。
2025-04-14
有没有免费制作数字人的网站?
以下是一些免费制作数字人的网站及使用方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。上传后效果如图所示,My Avatar处显示上传的照片。点开大图后,点击Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的Create vedio。选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击Generate vedio就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法:点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。软件会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成,可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频对齐。
2025-04-11
有关 ai agent 的科普文章
以下是为您提供的关于 AI Agent 的科普内容: AI Agent 是一个融合了多学科精髓的综合实体,包括语言学、心理学、神经学、逻辑学、社会科学和计算机科学等。它不仅有实体形态,还有丰富的概念形态,并具备许多人类特有的属性。 目前,关于 AI Agent 存在一些情况。例如,网络上对其的介绍往往晦涩难懂,让人感觉神秘莫测,其自主性、学习能力、推理能力等核心概念,以及如何规划和执行任务、理解并处理信息等方面,都像是笼罩在一层神秘面纱之下。 另外,以国与国之间的外交为例来解释相关协议。假设每个 AI 智能体(Agent)就是一个小国家,它们各自有自己的语言和规矩。各国大使馆试图互相沟通、做生意、交换情报,但现实中存在诸多问题,如协议各异、要求不同等。 如果您想了解更多关于 AI Agent 的详细内容,可访问: 。
2025-04-15
AI通识科普文章
以下是为您提供的 AI 通识科普相关内容: 对于对 AI 都没太多概念的纯纯小白: 现有常见 AI 工具小白扫盲:(1 小时 32 分开始)。 AI 常见名词、缩写解释: 。 新手学习 AI 的步骤: 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 开始 AI 学习之旅:在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程按照自己的节奏学习,并有机会获得证书。 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议一定要掌握提示词的技巧,它上手容易且很有用。 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 入门经典必读:作者为 。文中提到人工智能的研究正在以指数级别的速度增长,对于初学者来说跟上新发布的内容很难,因此分享了一份用于更深入了解现代 AI 的精选资源列表,称为“AI 典藏”,包括对 Transformer 和 Latent Diffusion 模型的介绍、技术学习资源、构建大型语言模型的实用指南、AI 市场的分析以及里程碑式研究成果的参考列表等。
2025-04-14
自媒体文章创作提示词教学
以下是关于自媒体文章创作提示词教学的相关内容: 一、宝玉日报中的提示词教学 1. 提示词四要素包括指令、上下文、输出格式、角色。明确表达需求,学会结构化 Prompt,能让 AI 效果立竿见影。 2. 相关链接: 二、工具教程:清影中的提示词优化原则 1. 强调关键信息:在提示的不同部分重复或强化关键词有助于提高输出的一致性。 2. 聚焦出现内容:尽量让提示集中在场景中应该出现的内容上。 3. 规避负面效果:在提示词中写明不需要的效果,保障视频生成质量。 写提示词的步骤: 1. 明确场景中的人物和冲突,这是推动场景发展的关键因素。 2. 对场景进行详细描述,包括地点、人物形象、任务动作等细节,使用生动的动词营造动态和戏剧化氛围。 3. 加强镜头语言,常用的镜头运动包括推、拉、摇、移、升、降等,每种镜头运动都有其特定作用和效果。 三、关于律师如何写好提示词用好 AI 1. 第一部分:说清楚本文要解决的问题、问题的背景以及可能导致的损失。 2. 第二部分:以案例引入,案例需改写自【基础材料】的【类案参考】部分,包括案号、案件事实经过、法院裁判结果、关键依据等与文章有关的要点。 3. 第三部分:对案例进行进一步分析,写明需要注意的关键点,分析可改写自【基础材料】的【问答结果及分析】部分,这部分不要给建议。 4. 第四部分:给出具体的操作建议,分为事前应注意事项、事中需要注意留存的证据、事后可以采取的补救措施三个部分,每个部分分别给出三条清晰具体的建议。 5. 第五部分:结语及对于本文作者的宣传。 文章结构要点: 1. 定义身份(边界),整体流程和所需资源描述。 2. 对所需资源及如何使用进行描述。 3. 对最终输出的结果进行描述。 注意事项: 1. 所有结论均应有相对应的案例基础,不能违反法律规定,不能编造。 2. 文字需要简练精准,有足够的信息密度,给出的建议必需具体细致且易于操作。
2025-04-12
文章AI度检测
文章原创度检测通常包括以下两大步骤: 1. 从互联网或文章库中定位相似内容: 将文章细分为小句或段落,便于逐个对照。 从每个细分内容中提炼关键词或词组,在网络或专业数据库中搜寻可能的相似内容。 2. 评估文章与搜索出的内容的相似程度评估原创度。 此外,文中还提到了一种将文章手搓成 Token 炸弹的有趣玩法,包括编码和解码的方法。例如,在特定网站进行操作,将按钮切换到“Decode”可解码,切换到“Encode”可编码,输入隐藏信息并选择表情或字母,然后复制生成的内容。由于 Unicode 的特性,隐藏信息跨平台时不会被格式化,但在微信发送时有 1.5 万个 token 左右的极限值,超过则无法发送。在爬虫和不同系统中也有不同的表现,如在 Windows 系统导出 txt 文件会出现乱码,而在 Mac 系统打开则基本正常。这种 Token 炸弹玩法还可以用于躲避信息审核员、传输信息或当作数字水印。
2025-04-12
文章配图的智能体或者软件
以下是为您整理的关于文章配图的智能体或软件的相关内容: 在《智变时代/全面理解机器智能与生成式 AI 加速的新工业革命》中提到,智能时代,智能应用会从有形界面消失,变成无所不在的助理或智能体,辅助甚至直接完成任务。文中还配有图 2.10:智能代理将改变企业组织架构。 在《XAIR:AI 智能体平台对决:腾讯元器与字节扣子的创新之路》中,个人实操案例部分提到为本篇文章配图的相关情况,但生成结果显示问题描述不够清楚。之后换提示词“那你给我生成搞笑图片吧,让人一看就有继续看下去的动力那种,需要一张公众号封面和一张配图”,得到了相应结果。同样的提示词,元器某应用也有生成。此外,文中还提到在搭建 bot 过程中存在工作流未成功触发导致访谈记录未成功存储入库的问题。
2025-04-11
文章风格提取
以下是关于文章风格提取的相关内容: 该提示词用于抽取不同风格文章的核心要素,抽取到的字段可作为 prompt,结合指定主题进行风格迁移。整体创作思路见文末 PDF。 具体使用方法为:拷贝文章风格提取提示词,输入给任意大模型,随后提供要抽取的文本。 已抽取的一些风格参考包括万维钢风格、史铁生《我与地坛》文风、李娟《我的阿勒泰》文风、许倬云《说中国》文风、鲁迅《狂人日记》文风、王小波《万寿寺》文风、飞书多维表格工作流自动化抽取等。 使用 DeepSeek V3 进行实验时,智能体地址为 https://www.coze.cn/s/VM9pUn9HdmA/ 。初级使用方法是输入公众号文章标题或内容,智能体会自动提取相关信息,默认风格是“炫彩”。高级使用方法需按照要求输入几个要素,如标题、副标题、分享封面、标签、风格等。
2025-04-11