Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

帮我描述一段让AI生成未来绿色城市的描述词,图片要是OC渲染、超高品质,8K渲染

Answer

以下是一段让 AI 生成未来绿色城市的描述词,图片采用 OC 渲染、超高品质、8K 渲染:

未来绿色城市,一片生机勃勃的景象。城市中摩天大楼与葱郁的森林相互交融,建筑表面覆盖着绿色的植被,仿佛是从大地中自然生长而出。街道宽敞整洁,由可再生材料铺就,太阳能路灯照亮着道路。空中花园遍布城市的各个角落,五彩斑斓的花朵争奇斗艳。清澈的河流穿城而过,河面上倒映着蓝天白云和两岸的绿树。城市的交通系统高效便捷,无人驾驶的电动汽车在智能轨道上有序行驶。公园中,人们在清新的空气中休闲娱乐,孩子们在绿色的草地上欢笑奔跑。整个城市被一层柔和的光芒笼罩,展现出和谐、美丽与可持续发展的魅力。

Content generated by AI large model, please carefully verify (powered by aily)

References

Midjourney 商业实战案例

1.中国武术电影片关键词:Amazing epic chinese ancient theme,chinese ink style,a young man is preparing to climb the stonesteps ladder,martial arts style,dynamic,expressiveclean lines,cinematic,stunning,realistic lighting andshading,vivid,vibrant,8k,octane render,unrealengine,very detailed,concept art,realistic –ar 16:9令人惊叹的史诗中国古代主题,中国墨水风格,一个年轻人正在准备爬石阶楼梯,武术风格,动态,富有表现力的干净的线条,电影,令人惊叹,现实的灯光和阴影,生动,充满活力,8k,辛坦渲染,不真实的引擎,非常详细,概念艺术,现实(young man is preparing to climb the stonesteps ladder,)其他的关键词不变,改变这句话创作出不同的场景Midjourney生成的图片:中国武术电影:这质感,我只能说无敌了….2.长安城夜景关键词:Chang’an City,Ancient times,BigsceneSea of clouds,an expansive view of,highangle view Soft moonlight,Twinklingstars,cinematic lighting,8k,Virtua engine,detailed,Digital illustration –ar 16:9长安城,古代,大场景云海,广阔的视野,高角度视图柔和的月光,闪烁的星星,电影照明,8k,Virtua引擎,详细,数字插图-ar 16:9Midjourney生成的图片:长安,长治久安:3.中国古代女孩关键词:

白马:6000字超详细复盘!《AI你·南京》AIGC城市宣传MV全流程制作解析

接下来是对南京12个大区的名字设计,本来这也是属于分镜的一部分,不过由于在制作上这一块确实也花费了相当多的时间,所以单独分出来讲解。这一部分用到的主要工具是Stable diffusion,因为它有很强的控制能力,可以根据我们给出的文字轮廓来进行符合画面风格的设计。这里我们先准备好所有要做的字体的平面图像,这个平面图会决定我们最终的构图。我一般会喜欢用黑底白字的图片,因为在controlnet中的depth模型会把白色识别为前景,有助于我们文字的突出。我们可以将图片放入controlnet当中来,我通常会用到canny来控制线条,depth控制景深关系,segmentation控制融合度,IP-Adapter控制画面风格。当然这些控制不需要同时使用,而是通过你对图像的一个构思来进行取舍,同时通过权重来影响控制程度。前期准备完成之后,就要开始构思每一幅的画面,南京的每一个区都各有特色,玄武区湖光山色相映成趣、秦淮区桨声灯影流水潺潺、建邺区高楼林立气势雄伟、鼓楼区紫峰阅江光影悠悠、栖霞区枫满山峦叶红似锦、雨花台区烈士陵园庄严肃穆、江宁区湖熟稻田金浪滚滚、浦口区珍珠涌泉清澈秀美、六合区“石中皇后”雨花斑斓、溧水区无想山水翠峦叠嶂、高淳区老街深巷青砖灰瓦、江北新区科创基地智领未来。结合这些不同的特征,我们需要选择不同的大模型,对画面做不同的描述词,然后选择搭配不同的lora进行微调。

Others are asking
我是一个AI小白,我使用AI的主要目的是使用这些工具,简化我工作中费时费力的事情,比如:表格的制作,筛选数据;图片的抠图,渲染,产品的口播介绍;日常工厂管理文件的编写及执行步骤;工作手册及岗位绩效的编写;作业指导书的编写
以下是为您整合的相关内容: 对于 AI 小白来说,使用 AI 工具简化工作中的费时费力之事是可行的。 在接触 AI 工具时,对于超出自己理解范围的事情,最简单有效的方法就是尝试。学习新事物,实践比听闻更重要。 比如在 AI 视频制作方面,人物设定与剧本是关键部分,包括主体、动作、场景等要素;分镜处理也较为重要,要考虑用几个镜头表述内容;生成环节如同抽卡,可多尝试,最后进行粗检和后期处理,如 AI 配音剪辑、加过渡滤镜等。小白制作 AI 视频要做好脚本即提示词,有耐心抽卡,并不断提升撰写提示词的能力。撰写提示词时要了解主体、动作、场景,避免使用专有名词和网络名词,给 AI 清晰描述。工具选用方面,没有绝对好的工具,只有适合的,如小白可使用剪映,主力机是 MacBook Pro 可使用 final cut。还可向 ChatGPT 询问获取灵感。 另外,在“AI 布道”活动中发现,AI 工具虽强大能做很多事,但也在其与普通人之间形成了一道墙。AI 是未来必然的方向,其科普还有很长的路要走,但尽可能简单地试用它,能让普通人更快受益。无论是什么身份、什么年龄段的人,都可以尝试使用 AI 工具。 如果您想要跟相关作者交朋友、一起在 AI 路上探寻,欢迎戳这里:
2025-01-30
哪款ai可以用于渲染模型
以下是一些可以用于渲染模型的 AI 工具和相关信息: 在游戏领域,用于纹理生成的有 BariumAI(https://barium.ai/)、Ponzu(https://www.ponzu.gg/)和 ArmorLab(https://armorlab.org/)。 在动画方面,涉足从视频中捕捉动画等领域的公司包括 Kinetix(https://www.kinetix.tech/)、DeepMotion(https://www.deepmotion.com/)、RADiCAL(https://getrad.co/)、Move Ai(https://www.move.ai/)和 Plask(https://plask.ai/)。 此外,在软件架构设计中,以下工具可用于绘制逻辑视图、功能视图、部署视图等: Lucidchart:流行的在线绘图工具,支持多种图表创建,包括相关视图,用户可通过拖放界面轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 draw.io(现称 diagrams.net):免费在线图表软件,支持多种类型图表创建。 PlantUML:文本到 UML 转换工具,可通过描述性文本自动生成相关视图。 Gliffy:基于云的绘图工具,提供创建各种架构图的功能。 Archi:免费开源工具,支持逻辑视图创建。 Rational Rose:IBM 的 UML 工具,支持多种视图创建。
2025-01-18
AI 做产品渲染图的工具和企业内落地使用的流程和方案是什么
以下是关于 AI 做产品渲染图的工具和企业内落地使用的流程和方案的相关内容: 工具: 等工具可帮助品牌创建引人注目的产品照片。 可制作用于电子邮件或社交媒体的营销材料。 可以编写经过 SEO 优化的产品描述。 企业内落地使用流程和方案: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,处理大量数据,快速识别关键信息,如受欢迎的产品、价格区间、销量等。 2. 关键词优化:借助 AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:使用 AI 设计工具,根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:运用 AI 文案工具撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:通过 AI 图像识别技术选择或生成高质量的产品图片,更好地展示产品特点。 6. 价格策略:利用 AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 7. 客户反馈分析:借助 AI 分析客户评价和反馈,了解客户需求,优化产品和服务。 8. 个性化推荐:依靠 AI 根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 9. 聊天机器人:采用 AI 驱动的聊天机器人提供 24/7 的客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:使用 AI 分析不同营销活动的效果,了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:依靠 AI 帮助预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:利用 AI 分析不同的支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:借助 AI 在社交媒体上找到目标客户群体,通过精准营销提高品牌知名度。 14. 直播和视频营销:运用 AI 分析观众行为,优化直播和视频内容,提高观众参与度和转化率。
2025-01-17
为一张3层建筑渲染里面效果,请为我提供相关的提示词
以下是为您提供的 3 层建筑渲染效果的相关提示词: 视角:LowAngle(仰视)、3d isometric blueprint(3D 等轴测蓝图)、3D isometric model(3D 等轴测模型) 介质:abstract expressionist art style(抽象表现主义艺术风格) 镜头:superresolution microscopy(超分辨率显微镜) 灯光:ambient lighting(环境照明)、overhead lighting(头顶照明) 颜色:white(白色)、darkbrown(深棕色) 描述:classical realism(古典现实主义) 艺术家:Kazimir Malevich(卡齐米尔·马列维奇) 电影:2001 A Space Odyssey(2001 太空漫游)、Fantasia(幻想曲) 游戏:Age of Empires(帝国时代)、EarthBound(地球之旅) 画面精度:high detail(高细节)、hyper quality(高品质)、high resolution(高分辨率)、FHD,1080P,2K,4K18K 全高清.1080P,2K,4K,8K、8k smooth 8 流畅 渲染效果:Unreal Engine(虚幻引擎)、octane render(渲染器)、Maxon Cinema 4D 渲染器、architectural visualisation(建筑渲染)、Corona Render(室内渲染)、Quixel Megascans Render(真实感)、VRay V 射线、Behance、C4D、3D、blender、surreal photography(超现实摄影)、realistic 3D(真实 3D)、zbrush
2025-01-05
我想找一个关于建筑三维模型渲染的ai网站
以下为一些关于建筑三维模型渲染的 AI 网站: 1. 3dfy.ai:这是一家专注于将稀疏数据转化为逼真三维世界的公司。其领导团队由计算成像领域资深专家组成,拥有近四十年综合专业知识。适用于数字内容创作者、艺术家、游戏开发者、动画制作人、教育和培训行业专业人士、医疗行业以及建筑和工程领域等。 2. HDAidMaster:云端工具,在建筑设计、室内设计和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 3. Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有探索。 4. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入相关标准和规范。 5. Fast AI 人工智能审图平台:形成全自动智能审图流程,实现数据汇总与管理。 但需注意,每个工具都有其特定应用场景和功能,建议您根据自身具体需求选择合适的工具。
2024-12-24
用Coze创建AI,能够通过文字生成图片或者视频或者动画或者渲染效果
以下是使用 Coze 创建 AI 的相关信息: 1. 注册 Coze 账号: 访问 Coze 官网,快速注册,开启智能之旅。 Coze 中文名扣子,字节跳动出品。 中文版:https://www.coze.cn/(支持大模型:kimi、云雀)——本次教程使用中文版 Coze。 英文版:https://coze.com/(支持大模型:chatgpt4)。 产品定位:新一代 AI 原生应用开发服务平台,Nextgeneration AI chatbot building platform。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,然后起一个响亮的名字。 工作空间选“个人空间”即可。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”那里用文字描述想要的图标,图标生成满意后,再把“Bot 名称”改为简洁版名称。 3. 制定任务的关键方法: 在开始设计和开发任何 AI Agent 之前,最关键的第一步是明确定义期望 AI 最终输出的结果。这包括详细描述期望获得的输出内容,如输出是文本、图像、音频还是其他形式的数据,输出的具体格式和结构是什么,确定输出内容的质量标准。 预估任务的可行性。 确定任务的执行形式。以 LearnAndRecord 的一篇文章为例,拆解其结构,基于此进行微调优化。值得注意的是,Coze 支持 Markdown 格式输出 AI 生成的内容,Markdown 作为轻量级文本标记语言,能够有效展示文本、图片、URL 链接和表格等多种内容形式。参照精读结构,评估任务的可行性,生成结果包括文字、图片(思维导图)、音频(原文音频)三类输出格式,前两者可直接用 Markdown 输出/嵌入,音频则需通过 URL 链接跳转外部网页收听。最后结合使用习惯,期望在输入一篇英文原文时,AI Agent 能够按模板要求,直接输出精读结果。
2024-11-09
怎么描述能让gpt写出可靠的代码
要让 GPT 写出可靠的代码,可以参考以下方法: 1. 当需要进行复杂计算时,不要完全依赖 GPT 模型自身,而是指导模型编写并运行代码。 2. 特别地,指示模型将要运行的代码放入指定格式,例如使用三个反引号(backticks)。 3. 对于程序开发人员,可利用 GPT 生成代码,例如在求 1000 以内的所有质数时,先让 GPT 编写代码,然后开启新对话输入代码,再让模型充当代码执行器运行代码。 4. 编写代码时,GPT4 写复杂代码的能力更强。 5. 代码执行的另一个好用例是调用外部 API,可通过向模型提供说明如何使用 API 的文档和/或代码示例来指导模型。 6. 但需注意,执行模型生成的代码本身并不安全,任何试图执行此操作的应用程序都应采取预防措施,特别是需要一个沙盒代码执行环境来限制不受信任的代码可能造成的危害。
2025-01-22
可以基于文本描述生成对应的视频
以下是一些可以基于文本描述生成对应的视频的工具: 1. Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内):https://etna.7volcanoes.com/ 。是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps,支持中文和时空理解。 3. Adobe Firefly 中的“生成视频”(测试版):https://www.adobe.com/products/firefly/features/aivideogenerator.html 。将您的书面描述转换为视频剪辑。使用文本提示定义内容、情感和设置(包括摄像机角度),以指导摄像机移动并创建传达所需情绪和信息的视频。您还可以合并图像,为视频生成提供视觉提示。 4. ChatGPT + 剪映:ChatGPT 可以生成视频小说脚本,剪映可根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架,快速实现从文字到画面的转化。 5. PixVerse AI:https://pixverse.ai/ ,在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 6. Pictory:https://pictory.ai/ ,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户提供文本描述,Pictory 将帮助生成相应的视频内容。 7. VEED.IO:https://www.veed.io/ ,提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 8. Runway:https://runwayml.com/ ,这是一个 AI 视频创作工具,能够将文本转化为风格化的视频内容,适用于多种应用场景。 9. 艺映 AI:https://www.artink.art/ ,专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-14
根据文字描述生成产品原型设计
以下是关于如何用 Midjourney 生成 B 端产品页面的详细介绍: 文本描述: 文本描述是 Midjourney 中最重要的出图逻辑,在输入框中输入“/image+文本描述”来生成图像。 若要生成 B 端界面,需清楚 B 端产品的可用关键词。例如输入“「SaaS dashboard」”可得深色 B 端界面效果。若想要简约浅色风格,可加入“白色背景”描述,如“「SaaS dashboard,UI,white background」”。还可尝试其他颜色,如“「SaaS dashboard,UI,purplr,black,white background,frontal」”。 Midjourney 会默认给出 4 张图像,图像下有两行按钮。第一行的 U 是放大图像提升细节,数字对应图像(U1,U2,U3,U4);第二行的 V 是在基础上发生变化,数字对应图像(V1,V2,V3,V4)。 文本描述操作便捷,但对于新手可能存在两个问题:一是难以准确描述所需关键词提示;二是输入很多关键词提示但生成图像与预想效果不一致,调整关键词的字序或增减字可能对结果产生很大影响,导致产生废稿。 图片描述: Midjourney 中的图片描述可理解为以图生图。将找到的设计参考图上传到 Midjourney 中得到专属链接,再使用“参考图链接+文本描述”的方式生成图像。 例如想得到带有交互流程的 UI 界面图,先上传素材图,在 Midjourney 中复制参考图链接再加上文字提示,如“「参考图链接+node UI」”。若想要纯正面、扁平效果的设计流程图,可调整为“「参考图链接+flat UI,node UI,frontal」”;若想要手绘风格、黑白风格的交互设计图,可加入“「参考图链接+node UI,drawing style,frontal,black and white,flat UI,2D,no shadow」”。 若想得到特定比例的图,在文字描述中加入特定参数,如 9:16 比例的设计图提示为“「参考图链接+node UI,black and whitear 9:16」”,16:9 比例的图提示为“「参考图链接+node UI,ar 16:9」”。 Midjourney 不同于设计软件,能快速得到有创造力的图像,为设计提供灵感。除生成整张设计图,还可利用 AI 输出多种风格的设计组件,如扁平组件系统,关键词为“「UI kit,flat design,outline,ar 16:9」”,还有古驰风格按钮。
2025-01-06
我想要做一个ai工具,针对电子元器件行业,我来提供专业术语翻译的知识库和固定描述语句翻译方法,希望上传中文PDF后,可以下载一个翻译好的PDF,0编程基础应该怎么做呢
对于您这种没有编程基础但想要制作针对电子元器件行业的 AI 工具来实现中文 PDF 上传并下载翻译好的 PDF 的需求,以下是一些建议: 首先,您需要学习一些基本的 AI 概念和技术知识,了解自然语言处理(NLP)的基本原理。 其次,可以考虑使用现有的无代码或低代码 AI 开发平台。这些平台通常具有可视化的界面和易于操作的工具,能够帮助您在不编写代码的情况下构建简单的 AI 应用。 然后,针对您的专业术语翻译需求,需要对电子元器件行业的术语进行系统整理和分类,建立一个清晰的术语库。 同时,确定固定描述语句的翻译规则和方法,并将其转化为可在 AI 工具中应用的逻辑。 在实施过程中,要不断测试和优化您的工具,以确保翻译的准确性和质量。 总之,虽然没有编程基础会增加一定的难度,但通过合理利用现有资源和持续学习,您是有可能实现这个目标的。
2025-01-04
我想要做一个ai工具,针对电子元器件行业,我来提供专业术语翻译的知识库和固定描述语句翻译方法,希望上传中文PDF后,可以下载一个翻译好的PDF
目前针对您想要针对电子元器件行业制作一个能上传中文 PDF 并下载翻译好的 PDF 的 AI 工具的需求,暂时没有相关的现成内容和方法。但您可以考虑以下步骤来实现这一目标: 1. 数据准备:收集和整理电子元器件行业的专业术语、固定描述语句以及对应的翻译,构建一个丰富准确的知识库。 2. 选择合适的技术:例如自然语言处理技术和机器翻译算法,以实现对中文 PDF 的翻译。 3. 开发工具界面:设计一个用户友好的界面,方便用户上传中文 PDF 和下载翻译后的 PDF。 4. 测试和优化:对工具进行充分的测试,根据测试结果不断优化翻译的准确性和工具的性能。 这是一个较为复杂的项目,需要一定的技术和资源投入,但如果成功实现,将为电子元器件行业带来很大的便利。
2025-01-04
你是一位政策数据分析师,现在我手里有微博爬取并进行预处理的评论文本数据,想要做文本分析(不停留在描述性分析上面,往情感分析那块探索)我可以采取什么样的方式
对于您手中经过预处理的微博评论文本数据,若要进行情感分析而非仅仅停留在描述性分析层面,以下是一些可行的方式: 1. 运用机器学习算法,如朴素贝叶斯、支持向量机等,训练情感分类模型。 2. 借助深度学习模型,例如卷积神经网络(CNN)、循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环单元(GRU),来进行情感分析。 3. 利用预训练的语言模型,如 BERT、ELMO 等,并在其基础上进行微调,以适应您的情感分析任务。 4. 引入词向量技术,将文本转换为向量表示,然后通过聚类或分类算法进行情感分析。 5. 结合词典和规则的方法,构建情感词典,根据词汇的情感倾向来判断文本的情感。 您可以根据数据特点和自身技术能力选择合适的方法。
2024-12-29
ocr
关于 OCR 的相关信息如下: GPT 的 OCR 识别问题及解决方案: 问题:开启代码执行功能时,GPT 会尝试用代码完成 OCR,导致无法正确识别图片文字。 解决方案: 如果是自定义 GPT,关闭 Code Interpreter。 无法关闭时,提问时明确说明“不要执行代码,请用自身多模态能力识别文字”。 直接使用 ChatGPT,而非 GPT。参考链接: 开源的 Zerox OCR 工具: 支持将 PDF、DOCX 转换为 Markdown。 可并发处理,能选择特定页面及模型选项。详细介绍参考:
2025-01-17
video-ocean制作的视频没有声音怎么解决
很抱歉,目前知识库中没有关于“videoocean 制作的视频没有声音的解决办法”的相关内容。但一般来说,视频没有声音可能有以下几种原因和解决方法: 1. 检查视频播放器的音量设置,确保音量未被静音或调至过低。 2. 查看视频文件本身的音频轨道是否存在问题,您可以尝试使用其他播放器打开该视频。 3. 检查您的设备音频输出设置,例如扬声器或耳机是否正常工作,以及其音量设置是否恰当。 4. 确认视频在制作过程中是否正确添加了音频,如果没有添加音频,可能需要重新制作并添加音频。
2024-12-26
ocr大模型的原理
OCR 大模型的原理如下: 1. 生成式:大模型根据已有的输入为基础,不断计算生成下一个字词(token),逐字完成回答。例如,一开始给定提示词,大模型结合自身存储的知识进行计算推理,算出下一个单词的概率并输出,新的输出与过去的输入一起成为新的输入来计算下一个词,直到计算出的概率最大时结束输出。 2. 预训练:大模型“脑袋”里存储的知识都是预先学习好的,这个预先学习并把对知识的理解存储记忆在“脑袋”里的过程称为预训练。预训练需要花费大量时间和算力资源,且在没有其他外部帮助的情况下,大模型所知道的知识信息可能不完备和滞后。 3. 规模效应:参数规模的增加使得大模型实现了量变到质变的突破,最终“涌现”出惊人的“智能”。就像人类自身,无论是物种进化还是个体学习成长,都有类似“涌现”的结构。
2024-12-26
ocr
关于 OCR 的相关信息如下: GPT 的 OCR 识别问题及解决方案: 问题:开启代码执行功能时,GPT 会尝试用代码完成 OCR,导致无法正确识别图片文字。 解决方案: 如果是自定义 GPT,关闭 Code Interpreter。 无法关闭时,提问时明确说明“不要执行代码,请用自身多模态能力识别文字”。 直接使用 ChatGPT,而非 GPT。参考链接: 开源的 Zerox OCR 工具: 支持 PDF、DOCX 转换为 Markdown。 可并发处理,能选择特定页面及模型选项。详细介绍参考:
2024-12-26
用大模型将扫描版PDF进行OCR的工具
以下是一些关于用大模型将扫描版 PDF 进行 OCR 的工具的相关信息: kimi 目前不支持扫描版本的 PDF,需要纯文字才能识别。 大模型招投标文件关键数据提取方案中的输入模块设计,支持多种格式的文档输入,包括 PDF 等。对于图片,可以借助开放平台工具中的 OCR 工具进行文本提取。 在 0 基础跨界 AI 编程共学零基础手搓 AI 拍立得银海的相关内容中,提到了将 OCR 添加到工作流程中,输入为一张图片,具备图像理解和识别图像文本信息两个能力,之后以这两个能力生成的内容为输入使用大模型生成文案标题和文案。
2024-12-11
AI for social science 有哪些重要的资源
以下是一些关于 AI for social science 的重要资源: 1. 《人工智能权利法案蓝图》:其中提到了公民权利、公民自由和隐私方面的内容,包括言论自由、投票自由以及免受歧视、过度惩罚、非法监视和侵犯隐私等,还涉及机会均等和获取关键资源或服务等方面。 2. AGI 万字长文(下)| 2024,分叉与洪流:如果从“AGI 已经出现”的阴谋论出发,AGI 所需要的基本资源无法回避,在能源领域,如可控核聚变技术,在 AI 的协助下有了一定进展。 3. 4.5.2016 EN:通过耦合注册表中的信息,研究者能够在诸如心血管疾病、癌症和抑郁症等广泛的医疗状况方面获得极有价值的新知识。在社会科学领域,基于注册表的研究使研究者能够获得关于失业、教育等一系列社会状况与其他生活状况的长期相关性的重要知识。通过注册表获得的研究结果提供了坚实、高质量的知识,可为基于知识的政策的制定和实施提供基础,提高许多人的生活质量,并提高社会服务的效率。
2024-12-10
怎么学习AI提示词??
以下是关于学习 AI 提示词的建议: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅:在「」中,您可以找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,您可以根据兴趣选择特定模块,比如一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试:理论学习后,实践是巩固知识的关键。尝试使用各种产品做出作品,在知识库中也有很多实践后的作品和文章分享。 5. 体验 AI 产品:与现有的 AI 产品(如 ChatGPT、Kimi Chat、智谱、文心一言等)进行互动,了解其工作原理和交互方式。 6. 学习提示词的构建技巧: 理解提示词的作用,它向模型提供上下文和指示,影响模型输出质量。 明确任务目标,用简洁准确的语言描述,给予足够背景信息和示例,使用清晰指令,对特殊要求明确指示,如输出格式、字数限制等。 7. 参考优秀案例:研究和学习已有的优秀提示词案例,在领域社区、Github 等资源中可找到大量案例。 8. 实践、迭代、优化:多与语言模型互动,根据输出提高提示词质量,尝试各种变体,比较分析输出差异,持续优化提示词构建。 9. 活用提示工程工具:目前已有一些提示工程工具可供使用,如 Anthropic 的 Constitutional AI。 10. 跟上前沿研究:提示工程是前沿研究领域之一,持续关注最新研究成果和方法论。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结,终可掌握窍门。
2025-01-31
AI的发展历史
AI 的发展历史可以追溯到二十世纪中叶,大致经历了以下几个阶段: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论等。心理学家麦卡洛克和数学家皮特斯在 1943 年提出了机器的神经元模型,为后续的神经网络奠定了基础。1950 年,图灵最早提出了图灵测试,作为判别机器是否具备智能的标准。1956 年,马文·明斯基和约翰·麦凯西等人共同发起召开了著名的达特茅斯会议,“人工智能”一词被正式提出,并作为一门学科被确立下来。 2. 知识驱动时期(1970s 1980s):这一时期专家系统、知识表示、自动推理较为流行。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等得到发展。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等技术兴起。当前的前沿技术点包括大模型(如 GPT、PaLM 等)、多模态 AI(视觉 语言模型、多模态融合)、自监督学习(自监督预训练、对比学习、掩码语言模型等)、小样本学习(元学习、一次学习、提示学习等)、可解释 AI(模型可解释性、因果推理、符号推理等)、机器人学(强化学习、运动规划、人机交互等)、量子 AI(量子机器学习、量子神经网络等)、AI 芯片和硬件加速等。 然而,AI 的发展并非一帆风顺,20 世纪 70 年代曾出现“人工智能寒冬”,因为当时符号推理等方法在实现应用场景大规模拓展时面临诸多困难。但随着计算资源变得便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能,在过去十年中,“人工智能”一词常被用作“神经网络”的同义词。
2025-01-31
我是一名会计从业者,可以怎样利用AI赚钱
作为一名会计从业者,您可以通过以下方式利用 AI 赚钱: 1. 利用生成式 AI 改进金融服务团队的内部流程,简化财务团队的日常工作流程。例如,帮助编写 Excel、SQL 和 BI 工具中的公式和查询,实现分析的自动化;发现模式,并从更广泛、更复杂的数据集中为预测建议输入,为公司决策提供依据。 2. 借助生成式 AI 自动创建文本、图表、图形等内容,并根据不同的示例调整报告,无需手动将数据和分析整合到外部和内部报告中。 3. 利用生成式 AI 综合、总结税法和潜在的扣除项,并就其提出可能的答案。 4. 利用生成式 AI 自动生成和调整合同、采购订单和发票以及提醒。 此外,您还可以研究 Prompt 提示词,例如像雪梅 May 那样,尝试不同的方法,让 AI 识别会计分类,训练出一个在会计专业领域能提高效率的 AI。
2025-01-31
总结一下当前AI发展现状以及指导非开发者一类的普通用户如何使用及进阶使相关工具
当前 AI 发展现状: 涵盖了不同领域的应用和发展,如电子小说行业等。 包括了智能体的 API 调用、bot 串联和网页内容推送等方面。 对于非开发者一类的普通用户使用及进阶相关工具的指导: 可以先从国内模型工具入手,这些工具不花钱。 学习从提示词开始,与模型对话时要把话说清,强调提示词在与各类模型对话中的重要性及结构化提示词的优势。 对于技术爱好者:从小项目开始,如搭建简单博客或自动化脚本;探索 AI 编程工具,如 GitHub Copilot 或 Cursor;参与 AI 社区交流经验;构建 AI 驱动的项目。 对于内容创作者:利用 AI 辅助头脑风暴;建立 AI 写作流程,从生成大纲开始;进行多语言内容探索;利用 AI 工具优化 SEO。 若想深入学习美学概念和操作可报野菩萨课程。国内模型指令遵循能力较弱时,可使用 launch BD 尝试解决。
2025-01-31
怎么制作一个AI agent?
制作一个 AI Agent 通常有以下几种方式和步骤: 方式: 1. Prompttuning:通过 Prompt 来构建大脑模块,但一般适合拟人化不是很重的情况,其缺点是使用的 Prompt 越长,消耗的 Token 越多,推理成本较高。 2. Finetuning:针对“有趣的灵魂”,通过微调一个定向模型来实现,能将信息直接“记忆”在 AI 的“大脑模块”中,提高信息提取效率,减少处理数据量,优化性能和成本。 3. Prompttuning + Finetuning:对于复杂情况,一般是两种方式结合。 步骤(以工作流驱动的 Agent 为例): 1. 规划: 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。
2025-01-31
ai发展现状
目前 AI 的发展现状呈现出以下特点: 1. 持续学习和跟进是关键:AI 是快速发展的领域,新成果和技术不断涌现。要通过关注新闻、博客、论坛和社交媒体,加入社群和组织,参加研讨会等方式保持对最新发展的了解。 2. 《2024 年度 AI 十大趋势报告》发布:从技术、产品、行业三个维度勾勒 AI 现状和未来走势,基于长期理解和积淀,持续跟踪领域创新、洗牌和动态,并结合与众多机构的交流。 3. 2024 年人工智能现状: 更多资金投入:预计明年会有团队花费超 10 亿美元训练单个大型模型,生成式 AI 热潮持续且更“奢华”。 计算压力挑战:政府和大型科技公司承受计算需求压力,逼近电网极限。 AI 介入选举:虽预期影响尚未成真,但不能掉以轻心。 总之,人工智能领域充满惊喜、伦理挑战和大量资金,各方势力竞相角逐,像一场激动人心的 UFC 比赛。
2025-01-31