Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

文本匹配

Answer

以下是关于文本匹配的相关信息:

  • 中文数据集:
    • cMedQA2:来源为寻医寻药网站中的提问和回答,做过匿名处理。包含训练集、验证集和测试集,提供了大量的问题和答案,并给出了平均字符数等详细信息,属于医疗问答匹配类别。相关论文地址:https://www.mdpi.com/2076-3417/7/8/767 。
    • ChineseSTS:提供了 12747 对中文相似数据集,作者给出了相似度打分,语料由短句构成,属于短句相似度匹配类别。
  • 向量数据库与文本匹配:传统的文本匹配发展遇到瓶颈,人们采用向量化处理办法。以电影为例,通过多个维度(属性)来框定,如一部电影的悬疑度、科幻元素、冒险感等,每个维度上的坐标用浮点数表示,给出了星球大战、泰坦尼克号、侏罗纪公园等电影的向量示例及解释。
  • 招聘信息:阶跃星辰招聘 NLP 算法工程师,负责对海量文本数据进行建模分析,包括文本语义匹配(bi-/cross-encoder)等任务,要求具有相关专业硕士及以上学历,熟练掌握相关理论和方法。网址:https://www.stepfun.com/
Content generated by AI large model, please carefully verify (powered by aily)

References

中文数据集

|ID|标题|更新日期|数据集提供者|许可|说明|关键字|类别|论文地址|备注||-|-|-|-|-|-|-|-|-|-||12|[cMedQA2](https://github.com/zhangsheng93/cMedQA2)|43412|寻药寻医网和国防科技大学信息系统及管理学院||该数据集来源为寻医寻药网站中的提问和回答,数据集做过匿名处理,提供的是包含训练集中有100,000个问题,188,490个答案,平均每个问题、答案字符数分别为为48、101个;验证集有4,000个问题,有7527个答案,问题和答案的平均字符数分别为49和101个;测试集有4,000个问题,有7552个答案,问题和答案的平均字符数分别为49和100个;数据集总量有108,000个问题,203,569个答案,平均每个问题和答案的字符数分别为49、101个;|医疗问答匹配|问答匹配|[论文](https://www.mdpi.com/2076-3417/7/8/767)|||13|[ChineseSTS](https://github.com/IAdmireu/ChineseSTS)|42999|唐善成,白云悦,马付玉.西安科技大学||该数据集提供了12747对中文相似数据集,在数据集后作者给出了他们相似度的打分,语料由短句构成。|短句相似度匹配|相似度匹配|||

大雨:简单易懂的向量数据库解析:你需要了解的一切

从上面几个示例中,我们可以看出来,传统的文本匹配发展遇到了瓶颈。于是人们找到了向量化的处理办法。简单来说,向量把一个词通过多个维度来框定,这里的维度可以简单理解为属性。比如说,一部电影,它有悬疑度、科幻元素、冒险感、激动程度、浪漫度等。这些属性,我们就称它为维度,在每个维度上的坐标就是它在这个维度上的值,通常是一个浮点数(小数)来表示。1.星球大战:向量:[0.8,0.9,0.7,0.8,0.2,0.1,0.2,0.5,0.4,0.3]解释:高度科幻(0.9),较高冒险感(0.8),较激动(0.7)。2.泰坦尼克号:向量:[0.1,0.1,0.2,0.3,0.9,0.8,0.2,0.7,0.6,0.1]解释:高浪漫度(0.9),较高悲剧感(0.8)。3.侏罗纪公园:向量:[0.7,0.8,0.6,0.8,0.3,0.1,0.7,0.4,0.2,0.5]解释:高冒险感(0.8),较高科幻元素(0.7)。这里的向量我们简单来理解,就是这个电影在不同维度(属性)上的相对强弱。为了方便理解,这里用了10个维度(属性)来描述一部电影。分别是

最近招聘信息-持续更新中

阶跃星辰算法工程师(NLP/搜广推)作为NLP算法工程师,你将负责对海量文本数据进行建模分析,包括文本语义匹配(bi-/cross-encoder)、文本分类等任务。你需要跟踪前沿算法,主动采用新技术、新算法、新思路和新观念,负责NLP算法系统的开发和优化。应聘者需要具有计算机、电子或数学等相关专业的硕士及以上学历,熟练掌握机器学习、深度学习的基础理论和方法[https://www.stepfun.com/](https://www.stepfun.com/)

Others are asking
有哪些可以文本转语音的工具?
以下是一些可以文本转语音的工具: 1. Eleven Labs:https://elevenlabs.io/ 这是一款功能强大且多功能的 AI 语音软件,能生成逼真、高品质的音频,可高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 2. Speechify:https://speechify.com/ 这是一款人工智能驱动的文本转语音工具,可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,能将文本转换为音频文件,用于收听网页、文档、PDF 和有声读物。 3. Azure AI Speech Studio:https://speech.microsoft.com/portal 这是 Microsoft Azure 的服务,提供了支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供了自定义的语音模型,能适应特定领域的术语、背景噪声以及不同的口音。 4. Voicemaker:https://voicemaker.in/ 这是一款 AI 工具,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型,易于使用,适合为视频制作画外音或帮助视障人士。 此外,还有开源的 StyleTTS 2:一个开源的媲美 Elevenlabs 的文本转语音工具,结合文本角色内容+场景音=快速生成有声小说。其工作原理是利用风格扩散和与大型语音语言模型(SLM)的对抗性训练来实现接近人类水平的 TTS 合成。
2025-03-10
文本提炼
以下是对您提供的文本的提炼: 文本补全: 学习如何生成或操作文本。 完成端点可用于多样任务,提供简单强大接口连接模型。输入提示,模型生成补全,受任务复杂性和提示质量影响。 可通过 Playground 探索,API 输出非确定性,设置温度可调整。 本指南涵盖提示设计最佳实践,了解代码工作可访问代码指南。 Claude2 中文精读: 可执行多种文本处理任务,如摘要、编辑重写、情感识别、信息提取和删除、翻译等。 示例包括提取电子邮件地址、删除个人身份信息等。 提示工程关键原则: 原则 1 是编写清晰具体的指令,包括使用分隔符清楚限定输入不同部分,分隔符可以是多种明显标点符号,能避免提示注入。 策略 2 是要求结构化输出,如 HTML 或 JSON 格式,便于解析模型输出。
2025-03-10
我需要输入文本就可以收获网页的工具
以下是一些输入文本就可以收获网页的工具和相关信息: 对于处理各种格式的文档输入,包括网页,可使用以下方式: 借助网页爬虫工具(如 Scrapy、BeautifulSoup、Selenium)抓取网页中的文本和表格数据。通过解析 HTML 的 DOM 结构,提取目标数据。(平台暂无工具) 对于图片,可以借助 OCR 工具进行文本提取,(开放平台工具:)。 以下是一些 AI 网页原型图生成工具: 即时设计:https://js.design/ 一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 V0.dev:https://v0.dev/ Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 Wix: Wix 是一款用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 Dora:https://www.dora.run/ 使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-10
文本撰写
以下是关于文本撰写的相关内容: 论文写作的 AI 产品: 在论文写作领域,AI 技术应用发展迅速,提供多方面辅助,包括文献搜索、内容生成、语言润色、数据分析等。常用的工具和平台有: 1. 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,助于管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化的软件,帮助进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 使用这些工具时,要结合自身写作风格和需求选择合适的辅助工具。 情侣之间甜蜜时光记录小助手 GPT 辅助制作: 需求分析中的构思部分,文案编写使用的方法论与昨天相同。利用 Python 执行以下操作: 1. 拼接图片:在生成的图片下面添加一个背景为纯白色、高度为 512px 的图片。 2. 文本定位: 文本在新创建的空白区域内水平和垂直居中。计算文本行的累积高度以及行间距,确定文本起始垂直位置(y 坐标)。 对于水平居中,计算每行宽度,使文本中心与图像中心对齐。确保每行“代码”之间的行间距为 15px。 文本使用上传的字体,若未上传字体,提醒用户上传中文字体,字体大小设置为 55px。 为用户提供最后生成图片的下载链接。 为 Generate video(beta)编写有效的文本提示: 1. 镜头类型描述:明确摄像机视角及移动方式,例如“一个缓慢放大的特写镜头”。 2. 角色描述:包括角色身份、外貌、穿着、情绪等,例如“一只有着亮白色皮毛的大型北极熊,看起来沉思着”。 3. 动作:描述角色在场景中的行为,例如“北极熊正在轻柔而自信地走向它之前在冰上打开的洞,以便在冰面下觅食”。 4. 位置:说明角色所在地点、天气和地形,例如“该位置贫瘠且白雪皑皑;灰色的云朵在远处缓慢移动”。 5. 美学:描述镜头类型、氛围和景深等,例如“电影,35 毫米胶片,高度详细,浅景深,散景”。
2025-03-09
COMfyui的文本联结节点怎么添加text3、text4
要在 ComfyUI 中添加 text3 和 text4 ,可以参考以下步骤: 1. 新建采样器:右键搜索找到 SDXL Sampler 点击即可。 2. 点击从 SDXL Sampler 采样器中的 Base_model 拖拽出选择 Load Checkpoint 节点,改名为 SDXL,并复制一个改名为 Refiner 连接到 SDXL Sampler 采样器中的 Refiner_model 。 3. 点击从 SDXL Sampler 采样器中的 Base_positive 拖拽出选择 Clip Text Encode 节点,改名为 Prompt ,复制一个并改名为 Negaive Prompt 。 4. 将 Text 改为输入 Convert text to input ,并复制出来 4 个,左边将 2 个连接 SDXL 的 Clip ,两个连接 Refiner ,右边依次连接 Base_Positive 、Base_Negaive 、Refiner_Positive 、Refiner_Negaive 。 5. 从节点中拉出一个通用节点并连接 text 。 6. 在文本节点上单击右键,选择【转换文本为输入】,此时,文本节点上就多了一个文本的连接点。 7. 加入一个新节点,右键点击 【新建节点】 【实用工具】 【Primitive 元节点】。 8. 将元节点与文本节点相连接,这时元节点就变成了正向提示词的输入框。同理,可以将负向提示词框也用元节点代替。 9. 再复制出一套正负提示词节点,一套给 base 模型,一套给 refiner 模型。然后,base 模型的那一套输出给第一个采样器节点,refiner 模型的那一套输出给第二个采样器节点。
2025-03-07
语音转文本,能识别不同人声,并将文本进行总结汇总,行程纪要或思维导图等
以下是为您提供的相关信息: ElevenLabs 发布了全球最精准的语音转文字模型 Scribe,它支持 99 种语言,语音转录准确率超越 Gemini 2.0 和 OpenAI Whisper v3,可识别 32 个不同说话者,并标记笑声、鼓掌等非语言元素,提供单词级时间戳,方便字幕同步和音频编辑,输出结构化 JSON,便于开发者集成。相关链接: 另外,为您推荐以下在线 TTS 工具: 1. Eleven Labs:https://elevenlabs.io/ ,ElevenLabs Prime Voice AI 是一款功能强大且多功能的 AI 语音软件,使创作者和出版商能够生成逼真、高品质的音频。人工智能模型能够高保真地呈现人类语调和语调变化,并能够根据上下文调整表达方式。 2. Speechify:https://speechify.com/ ,Speechify 是一款人工智能驱动的文本转语音工具,使用户能够将文本转换为音频文件。它可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,可用于收听网页、文档、PDF 和有声读物。 3. Azure AI Speech Studio:https://speech.microsoft.com/portal ,Microsoft Azure Speech Studio 是一套服务,它赋予应用程序能力,让它们能够“听懂、理解并与客户进行对话”。该服务提供了支持 100 多种语言和方言的语音转文本和文本转语音功能。此外,它还提供了自定义的语音模型,这些模型能够适应特定领域的术语、背景噪声以及不同的口音。 4. Voicemaker:https://voicemaker.in/ ,AI 工具可将文本转换为各种区域语言的语音,并允许您创建自定义语音模型。Voicemaker 易于使用,非常适合为视频制作画外音或帮助视障人士。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-07
我需要一个AI给我匹配口型
以下为一些可以为您匹配口型的 AI 工具及相关信息: 1. 即梦 AI: 对口型功能是其“视频生成”中的二次编辑功能,现支持中文、英文配音。主要针对写实/偏真实风格化人物的口型及配音生成。 操作流程:可上传包含完整人物面容的图片,进行视频生成,待视频生成完成后,点击预览视频下的“对口型”(嘴唇)按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。 技巧:上传写实/近写实的人物单人图片,目前不支持多人物图片对口型;输入 prompt,选择参数,点击生成视频,尽量确保人物无形变等扭曲效果;确保人物生成的情绪与希望匹配的口型内容匹配;在生成的视频下方,点击【对口型】;输入或上传需要配音的内容,注意视频生成时长和配音试听时长尽量对齐,点击生成;先对口型,再超分补帧。 目前支持语言:中文(全部音色),英文(推荐“超拟真”内的音色)。 2. HenGen AI:近期公布了 AI 切换视频内语言的能力,并且能够将 Avatar 口型与视频相匹配。 3. PixVerse V3: Lipsync 可以为视频配音配口型,生成视频最长可达 30s,目前只支持对 PixVerse 生成的视频进行口型适配。 优点:支持多种语言(英语、汉语、法语、日语等等皆可适配)。 操作流程:选择一张带有人脸的图片上传,写好提示词,点击生成视频。为保证最佳生成效果,建议使用单人图片。点击生成的视频,在生成的视频下方找到“Lipsync”并点击。之后,您可以输入文案,从右边的预设声音中选择合适的声音,或者点击“Upload Audio”上传一段音频,最后点击“create”生成视频。 注意:生成视频的长度取决于您文案或音频的长度,最长为 30s。例如,5s 视频+3s 音频=3s 语音视频,5s 视频+30s 音频=30s 语音视频。
2025-03-08
大模型输出和节点输出配置不匹配怎么解决
当大模型输出和节点输出配置不匹配时,您可以参考以下要点来解决: 1. 输入与输出的变量名称可自定义,按照自身习惯设定,以便识别字段含义。 2. 输入方面,因为取得的是开始节点中用户输入的{{BOT_USER_INPUT}},所以可直接选择引用。 3. 在提示词区域,由于需要 LLM 根据输入信息处理,所以需要两个双花括号,写明使用的输入项参数名,如{{input}}。 4. 输出方面,有几项子内容需要生成,就设置几项: 为了让大模型理解最终输出的形式要求,需要在用户提示词最后,添加输出格式段落,描述每个变量名称、输出内容、输出格式。 务必注意,变量名称、对应的输出内容、输出格式一定要前后完全一致,否则会输出失败,这一点很容易踩坑。 另外,虽然可以用大模型来实现变量类型的转换,比如选择“豆包·工具调用”,在大模型的高级设置中尽量把随机性调到最低,使其更严格遵循提示词。匹配好输入输出的名称与类型,提示词中注意用{{}}引用输入变量。但大模型节点效果不稳定,运行速度相对较慢,还可能带来额外花费。尤其当输出类型为 String 时,大模型容易画蛇添足地加上一些说明性文字,即使优化提示词去限制,也不一定每次都能限制住。一旦出现偏差,哪怕只是多一个字符,下游节点就可能无法正常运行,且对此调整手段有限。所以如果没有“代码恐惧症”,建议使用代码节点来实现。
2025-02-26
哪款AI能自动根据文字匹配视频片段
以下是一些能够根据文字匹配视频片段的 AI 工具: 1. Synthesia、HeyGen AI、DID 等产品,可用于制作低成本的营销视频、企业宣传视频等,如 HenGen AI 还具备切换视频内语言以及将 Avatar 口型与视频相匹配的能力。 2. Invideo AI 能够在数十秒内将 Prompt 转换为视频,支持通过编辑器进行后期更改,其原理是 AI 生成脚本并匹配视频素材。免费账户无法去除视频上的水印。 3. 此外,在制作 AI 视频短片时,还会用到如生成音乐的 Suno、配音的 ondoku 等工具,后期合成主要使用剪映。
2025-02-09
哪款AI能自动根据文字匹配视频
以下是一些能够根据文字匹配视频的 AI 产品: 1. Synthesia、HeyGen AI、DID:可用于制作低成本的营销视频、企业宣传视频、培训课程,HenGen AI 还具备切换视频内语言以及将 Avatar 口型与视频相匹配的能力。 2. 诗云马良平台:早在 21 年就推出了给视频中模特换脸、切换语言的能力,方便电商营销商家进行产品的本地化推广。 3. 海螺 AI:其主体参考功能可以通过识别用户上传照片中的面部信息,生成拥有对应面部信息的主体形象,并根据文字 Prompt 生成该主体形象的视频画面。 4. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 5. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频,这是由 Stability AI 开源的 video model。 6. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 7. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 8. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看: 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-09
我的工作需要根据元数据表在本地查询大量数据,并把匹配的数据参数复制到元数据表,有没有智能体可以做这个工作
智能体可以帮助您完成根据元数据表在本地查询大量数据,并把匹配的数据参数复制到元数据表的工作。 智能体可以根据其复杂性和功能分为以下几种类型: 1. 简单反应型智能体:根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。例如温控器,它根据温度传感器的输入直接打开或关闭加热器。 2. 基于模型的智能体:维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。比如自动驾驶汽车,它不仅感知当前环境,还维护和更新周围环境的模型。 3. 目标导向型智能体:除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。例如机器人导航系统,它有明确的目的地,并计划路线以避免障碍。 4. 效用型智能体:不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。比如金融交易智能体,根据不同市场条件选择最优的交易策略。 5. 学习型智能体:能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。 在实际应用中,多智能体 AI 搜索引擎的方案如下: 1. 第一步,快速搜索补充参考信息:根据用户的任务,使用搜索工具补充更多的信息,例如使用工具 API WebSearchPro。 2. 第二步,用模型规划和分解子任务:使用大模型把用户问题拆分成若干子搜索任务,并转换为 JSON 格式。 3. 第三步,用搜索智能体完成子任务:AI 搜索智能体具备联网搜索的能力,还能够自主分析并进行多轮搜索任务。 4. 第四步,总结子任务生成思维导图:智能体能调用各种插件,如思维导图、流程图、PPT 工具等。 此外,生物医药小助手智能体是由 1 个工作流和 6 个数据库实现的。工作流相对简单,而数据库包括公众号文章、执业药师教材、执业医师讲义、药监局新药审评报告、中国医药企业融资动态、药物对外授权动态、全球药物销售额等。在医疗领域,为保证回答的准确性,提示词约定回答只能来自于知识库。其商业化场景包括医药企业研发立项、科研机构临床转化评估、投资机构评估标的公司等。
2025-02-07
我需要一个工具,用于把我的中文视频转为英文视频,并且口型能匹配
以下为您推荐两个可将中文视频转为英文视频且口型能匹配的工具及相关信息: 1. 即梦 AI: 对口型是其视频生成中的二次编辑功能,现支持中文、英文配音。 主要针对写实/偏真实风格化人物的口型及配音生成,为用户创作提供更多视听信息传达能力。 操作流程:可上传包含完整人物面容的图片,进行视频生成,待完成后点击预览视频下的“对口型”(嘴唇)按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。目前支持语言包括中文(全部音色)、英文(推荐“超拟真”内的音色)。 技巧:上传写实/近写实的人物单人图片,不支持多人物图片对口型;输入 prompt,选择参数,点击生成视频,尽量确保人物无形变等扭曲效果;确保人物生成的情绪与希望匹配的口型内容匹配;在生成的视频下方,点击【对口型】;输入或上传需要配音的内容,注意视频生成时长和配音试听时长尽量对齐,点击生成;先对口型,再超分补帧。 2. HenGen AI:近期公布了 AI 切换视频内语言的能力,并且能够将 Avatar 口型与视频相匹配。 如果您想要制作低成本的营销视频、企业宣传视频、培训课程,还可以使用 Synthesia、HeyGen AI、DID 等产品,用 Avatar 代替真人出镜。又如出海企业需要给产品(商品)推广、介绍使用体验,早在 21 年,诗云马良平台就推出了给视频中模特换脸、切换语言的能力,方便电商营销商家进行产品的本地化推广。
2025-01-15