Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

现在国内语言生成式AI有多少个在做的,比如说百度的文心一言和阿里的通义

Answer

目前国内在做语言生成式 AI 的有不少,例如百度的文心一言、阿里的通义千问、讯飞的讯飞星火、智谱华章的智谱清言、字节跳动的豆包、腾讯的元宝、昆仑万维的天工 AI 等。

此外,还有一些在特定时间上线的大模型,如 8 月正式上线的包括北京的百度(文心一言)、抖音(云雀大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、百川智能(百川大模型),上海的商汤(日日新大模型)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)。

需要注意的是,不同的大模型具有各自的特点和功能,在使用和应用场景上可能存在差异。

Content generated by AI large model, please carefully verify (powered by aily)

References

2024AIGC法律风险研究报告(更新版).pdf

在引入AIGC的概念之前,本报告将先解释另一相关的热门词条“GenAI”,全称Generative AI,即生成式AI。GenAI是一种基于深度学习技术(deep learning algorithm),利用机器学习(machine learning)算法从已有数据中学习并生成新的数据或内容的AI应用。其工作原理是通过大规模的数据集训练深度神经网络模型,学习各种数据的规律和特征,实现对输入数据的分析、理解和生成。GenAI为游戏、娱乐和产品设计等应用提供了新颖且有创意的解决方案,如自动写作、虚拟现实、音乐创作等,甚至协助科学研究开辟了新的可能性。目前典型的GenAI包括OpenAI推出的语言模型ChatGPT、GPT-4、图像模型DALL-E以及百度推出的文心一言、阿里云推出的通义千问等。虽然生成式AI是一种非常强大的技术,能够应用于诸多专业领域;但其在数据处理过程中存在多重潜在合规风险,如未经授权收集信息、提供虚假信息、侵害个人隐私等。AIGC(全称AI-Generated Content)指利用GenAI创建的内容,如图像、视频、音频、文本和三维模型。具体来讲,AIGC工具使用机器学习算法,通常以自然语言处理为基础,分析大型文本数据集,并学习如何生成风格和语气相似的新内容。

张翼然:用AI为教师减负(3H).pdf

大语言模型的选择:主要看训练该语言用的语料集最开始,Google发布的Transformer结构算法,是⽤来语⾔翻译的。为了实现更好的翻译,特别是像同声传译这样⾼要求的任务,模型需要理解⼤量的术语和概念。通过预训练,模型可以在⼴泛的语料库中学习到这些知识,从⽽提⾼翻译的准确性和流畅度。2023年⼤语⾔模型参数⼤⼩对⽐AI领头羊们,你追我赶截⽌ 2024年6⽉ 20⽇确实,参数量⼤,回答知识性问题更好,但这道题,国产看起来也不错大模型母公司插件案例/封装提示词多模态上传文档搜索特色文心一言百度√ √指令中心√√√知识问答,古诗词通义千问阿里× √百宝袋×√√翻译、电商、法律、推理、数学讯飞星火科大讯飞√ √指令集√√×中小学教育学习、翻译智谱清言智谱华章√ √智能体√√×推理、编程、智能体、对话豆包字节跳动× √智能体√×√语音对话、知识问答、智能体元宝腾讯× √智能体√√√中文语境理解、深度阅读、游戏天工AI昆仑万维× √AI对话××√音乐生成、搜索总结Kimi月之暗面×x×√√

8月正式上线的国内大模型

5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中,广东省2家和其他省市1家也将陆续开放据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品

Others are asking
豆包,kimi,迅飞星火,通义,文心一言哪个好
以下是对这些大模型的简要介绍: GPT4Turbo:OpenAI 于 2023 年 11 月 7 日发布的 GPT4 的升级版本。 通义千问 2.0:阿里巴巴官方公开发布的 API 版本。 文心一言 4.0:百度官方的产品,有 API 版本和网页版。 云雀大模型(豆包):字节跳动官方网页版产品。 讯飞星火:科大讯飞发布的模型。 然而,要说哪个好并不能简单地一概而论,这取决于您的具体需求和使用场景。每个大模型都有其特点和优势,例如在语言理解、生成能力、特定领域的表现等方面可能存在差异。您可以根据自己的需求对它们进行试用和比较,以确定哪个更适合您。
2024-12-12
文心一言的开发公司是谁,功能特点,优势性和局限性请帮我简要概括
文心一言是由百度开发的全新一代知识增强大语言模型。 功能特点: 在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一。 在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。 各项能力表现均衡且大部分能力水平较高。 能力栈广泛,可应用场景较多,重点推荐在查询搜索知识应用、任务拆解规划 Agent、文案写作以及代码编写及纠错等方面的应用,在逻辑推理方面表现不俗,可关注在科学研究、教育、工业方面的落地能力。 优势: 能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 局限性: 从某些测试和感觉来看,其能力水平可能在 GPT3 的阶段,输出内容的可靠性与 ChatGPT 相比还有差距。
2024-11-22
国内都有哪些类似于文心一言类的AIGC应用?
国内类似于文心一言的 AIGC 应用有: 语言文字类:百度的文心一言、阿里云的通义千问等。 语音声音类:Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits。 图片美术类:早期有 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。
2024-11-14
gpt-4和文心一言
GPT4 是由 OpenAI 开发的先进且广泛使用的大型语言模型,在多种任务上表现卓越,如文本生成、理解、翻译及专业和创意写作等,通过大量数据学习,能处理复杂问题和理解上下文。 文心一言是百度开发的语言模型,文心一言 4.0 有网页版和 API 版本。在 2023 年,百度的“文心 4.0”是国内能力较好的模型之一。 除了 GPT4 和文心一言,还有其他重要的大型语言模型,如 Anthropic 公司的 Claude 3、谷歌的 Gemini、阿里巴巴的通义大模型等。在 2023 年度中文大模型基准测评报告中,对众多模型进行了评测和列举。2023 年中美在 AGI 技术上仍有差距,国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 有差距。国内大厂在冲击 AGI 方面虽有资源,但实际效果尚不明确,且受多种因素影响。
2024-11-12
文心一言和智普清言哪个更好用
文心一言和智谱清言在不同方面各有特点。 在对结构化 prompt 的响应方面: 智谱清言能够按照 prompt 指示回答,理解意图较好,输出格式基本符合要求,内容相对具体,体验感较好。 文心一言在某些任务中可能没有完全执行提示词要求,需要二次提示和引导。 在复杂提示词理解和执行的测评中: 智谱清言表现亮眼,对提示词结构的执行较完整,生成内容丰富,格式美观,但案例部分未完全按要求列举。 文心一言在这轮表现中相对较差。 综合来看,两者的表现取决于具体的使用场景和需求。如果需要更准确和完整地执行提示词,智谱清言可能更具优势;但如果对特定领域的理论性输出有需求,文心一言也可能有一定的价值。
2024-11-03
通义千问和文心一言有什么不一样
通义千问和文心一言的不同点主要体现在以下几个方面: 1. 开发团队:文心一言由百度出品,通义千问由阿里云开发。 2. 功能特点: 文心一言定位为智能伙伴,能写文案、想点子,陪用户聊天、答疑解惑。 通义千问能够与人交互、回答问题及协作创作。 3. 在一些具体应用场景中的表现: 在律师答辩状 prompt 评测中,文心一言 3.5 输入起诉状后,直接给出起诉状范本,未理解 prompt 输出答辩状,提示后主体少、不专业、错误多,输出应诉方案能按 prompt 结构,内容简洁可作框架。 通义千问在律师答辩状 prompt 评测中,欢迎语直接,输入起诉状后两个答辩人正确,能按 prompt 结构输出但专业性稍差,未引用法律条文,提示输出应诉方案能按 prompt 结构,整体内容及格无亮点。
2024-10-20
如何掌握生成式AI
以下是关于掌握生成式 AI 的一些建议: 课程学习: 可以学习台湾大学李宏毅教授的生成式 AI 课程,该课程主要介绍了生成式 AI 的基本概念、发展历程、技术架构和应用场景等内容,共分为 12 讲,每讲约 2 小时。 通过学习本课程,能够掌握生成式 AI 的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式 AI 的发展现状和未来趋势。 学习内容: 了解什么是生成式 AI,包括其定义、分类,以及与判别式 AI 的区别和应用领域。 学习生成式模型的基本结构、训练方法、评估指标,以及常见模型的优缺点。 掌握生成式对话的基本概念、应用场景、系统架构和关键技术,以及基于生成式模型的对话生成方法。 熟悉预训练语言模型的发展历程、关键技术、优缺点及其在生成式 AI 中的应用。 知晓生成式 AI 面临的挑战和解决方法,以及未来发展趋势和研究方向。 学习资源: 教材:《生成式 AI 导论 2024》,李宏毅。 参考书籍:《深度学习》,伊恩·古德费洛等。 在线课程:李宏毅的生成式 AI 课程。 开源项目:OpenAI GPT3、字节跳动的云雀等。 学习方法: 了解 AI 基本概念:首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 开始 AI 学习之旅:在「」中,你将找到一系列为初学者设计的课程。这些课程将引导你了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,你可以按照自己的节奏学习,并有机会获得证书。 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),可以根据自己的兴趣选择特定的模块进行深入学习。建议一定要掌握提示词的技巧,它上手容易且很有用。 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。在知识库提供了很多大家实践后的作品、文章分享。 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,可以获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。
2024-12-18
生成式AI
生成式 AI 是一种能够生成新内容的人工智能技术,其生成的内容可以是多模态的,包括文本(如文章、报告、诗歌等)、图像(如绘画、设计图、合成照片等)、音频(如音乐、语音、环境声音等)、视频(如电影剪辑、教程、仿真等)。 生成式 AI 和 AIGC 的关系:Generative AI 是“生成式人工智能”的正式称呼,AIGC 指的是由人工智能生成的内容的创作方式,实际上是 Generative AI 的应用结果。 ChatGPT 方面,从 OpenAI 的官网可知,2022 年宣发时称其为一种模型,官网帮助页面称其为一种服务,目前我们所熟知的 ChatGPT 逐渐演变成了一种可以兼容多种 GPT 模型的聊天应用(服务),且依赖 GPT 系列模型来运转。 在艺术形态方面,以 Midjourney 等工具为代表,通过背后的人工智能模型,用户根据提供的文本描述可生成高度相关和创造性的图像。这种通过文本命令获得图像的方式叫做 Prompting,是一种全新形态的人机交互。其核心机制涉及数据(包括获取世界上万事万物的图像存档、创建特定数据集等)、映射(使用算法识别和提取图片中的关键视觉特征)和扩散(利用学习到的数据和视觉特征创造新的视觉表达形式)。 生成式 AI 可以应用于广泛的场景,例如文档摘要、信息提取、代码生成、营销活动创建、虚拟协助、呼叫中心机器人等。 其工作方式包括训练阶段(从大量现有内容中学习,得到基础模型)和应用阶段(基础模型可生成内容并解决一般性问题,还可使用特定领域新数据集进一步训练以解决特定问题)。 Google Cloud 提供了相关工具,如 Vertex AI(端到端机器学习开发平台)、Generative AI Studio(允许快速制作原型和自定义生成式 AI 模型)、Model Garden(提供 MLOps 工具,用于自动化机器学习管道)。
2024-12-18
免费的生成式 人工智能
以下是为您提供的关于免费的生成式人工智能的相关信息: 免费试用和折扣: 从 12 月 16 日起向奥德赛计划注册用户开放,已筹集超过 75 万美元的免费试用机会,助力开启人工智能电影制作之旅。 图像与视频生成平台: Civitai:是开源生成式人工智能的家园,使命是使工具和资源普及化。提供模型托管、图像/视频生成和模型训练服务,已发展成拥有 650 万月活跃成员的社区。 KLING AI:下一代一站式人工智能创作平台,拥有强大的人工智能图像和视频生成能力,通过提示和图像激发创造力,具有先进的文本理解能力、精细的细节处理和多种风格。提供积分试用套餐和高级功能抢先体验。 Viggle:允许用户通过 3D 视频基础模型 JST 指定角色的动作。创作者、品牌和电影制作人可轻松替换角色、复制动作并将想法变为现实。前 5000 名注册用户可享受 1 个月的 Viggle 专业计划。 Hailuo Video by MiniMax:强大的人工智能驱动的视频生成引擎。从将简单文本转换为生动、专业品质的视频,到将静态图像转换为动态视觉故事。3 天内为用户提供 1000 积分。 Hedra:开创性的视频基础模型公司,正在构建能够实现控制、情感和创造性智能的全栈创作工作室。前 5000 名注册用户可享受 1 个月的 Hedra 基本计划。 生成式人工智能的相关知识: 生成式人工智能是可以产生各种类型内容的人工智能,包括文本、图像、音频和合成数据。 它需要在流程的开始和结束时进行人工参与,人类需向生成模型输入提示才能让其创建内容。 生成式人工智能输出自然语言、图像或音频,而非生成式人工智能输出数字或类别。 生成式人工智能模型使用统计模型预测预期的响应,并根据训练数据的基础结构生成新的内容。 生成式人工智能的力量来自于使用了 Transformers 技术,但也可能产生幻觉。 学习资源: 视频学习地址:https://youtu.be/G2fqAlgmoPo 中文版本推荐:和超正经学术君
2024-12-17
AI大模型和生成式AI是什么关系
AI 大模型和生成式 AI 有着密切的关系。 生成式 AI 是一种能够生成文本、图片、音频、视频等内容形式的技术。生成式 AI 生成的内容被称为 AIGC。 大语言模型(LLM)属于 AI 大模型的一种。对于生成式 AI 来说,其中生成图像的扩散模型不属于大语言模型。对于大语言模型,生成只是其众多处理任务中的一个,例如谷歌的 BERT 模型,可用于语义理解(如上下文理解、情感分析、文本分类),但不太擅长文本生成。 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制来处理序列数据,比 RNN 更适合处理文本的长距离依赖性。 AI 领域还包括人工智能(AI)、机器学习(包括监督学习、无监督学习、强化学习)、深度学习(参照人脑有神经网络和神经元)等相关技术名词。监督学习使用有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。无监督学习的数据没有标签,算法自主发现规律,经典任务如聚类。强化学习从反馈里学习,以最大化奖励或最小化损失,类似训小狗。神经网络可用于监督学习、无监督学习、强化学习。
2024-12-11
如何通过AGI,生成有一定操控能力的风格化、动漫风生成式短视频,如何做,几个步骤
以下是生成有一定操控能力的风格化、动漫风生成式短视频的步骤: 1. 项目规划:确定短视频的主题和目标观众,制定详细的制作计划。 2. 剧本创作:编写故事脚本,设计角色和场景以及创意。可参考相关剧本创作资料,如:https://waytoagi.feishu.cn/wiki/G11fwW8bmiVLe6kYLgYc2iGin6e ;捏剧本 Bot(捏剧本离谱村专用 https://www.coze.cn/store/bot/7367669913697239052?panel=1&bid=6cs144r404016 。 3. 分镜头脚本:根据脚本制作分镜头脚本,确定每个镜头的画面和动作。 4. 资源准备:准备动画制作所需的素材,包括背景、角色和音效。 5. 画面图片制作:利用 AI 出图工具,比如通过 ChatGPT、MJ、SD 等工具快速生成高质量的图片。 6. 视频制作:利用 AI 工具制作动画,通过 RUNWAY、Luma、Dreamina 等平台快速生成高质量的动画。 7. 后期剪辑:添加音效、配音和字幕,进行最终的剪辑和合成。 8. 发布和推广:将完成的动画短片发布到各大平台,并进行推广和宣传。 此外,在实际制作中,还可以参考一些成功案例,如山西文旅宣传片的制作,运用 Defense 及 SD 制作黄河长城等 AI 艺术字;为陕西文旅做的 40 秒黑神话悟空风格 AI 短片,用 SD 结合 Control Lite 处理钟楼等。郑州 AI 文旅片工作流总体分为分镜脚本、单帧图片制作、图片细节修复与生成视频、视频风格化处理、剪辑合成五个步骤。
2024-12-09
如何通过AGI,生成有一定操控能力的风格化、动漫风生成式短视频
目前关于通过 AGI 生成有一定操控能力的风格化、动漫风生成式短视频,以下是一些相关信息: 2024 年内,有一定操控能力的生成式短视频中,风格化、动漫风最先成熟,真人稍晚。 同时,在 2024 年还会有其他相关进展,如 AI 音频能力长足进展,带感情的 AI 配音基本成熟;“全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货;游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式;AI 男/女朋友聊天基本成熟,记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈;实时生成的内容开始在社交媒体内容、广告中出现;AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验;AI 的商业模式开始有明确用例,如数据合成、工程平台、模型安全等;可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功;中国 AI 达到或超过 GPT4 水平,美国出现 GPT5,世界上开始现“主权 AI”;华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚);AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧;AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年,AI 3D 技术、物理规则成熟,正常人无法区别 AI 生成还是实景拍摄;全真 AI 虚拟人成熟,包含感情的 AI NPC 成熟,开放世界游戏成熟,游戏中几乎无法区别真人和 NPC;AR/VR 技术大规模商用;接近 AGI 的技术出现;人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行;AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源;具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破;“人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉;AI 引发的社会问题开始加重,结构性失业开始出现;AGI 对于地缘政治的影响开始显露。
2024-12-09
ai平面设计工具
以下是一些常见的 AI 平面设计工具: 1. 对于建筑设计师审核规划平面图,有以下工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster,软件 UI 和设计成果颜值高。 Maket.ai:主要面向住宅行业,在户型和室内软装设计方面有探索,能根据输入自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,可在住宅设计早期引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,能将建筑全寿命周期内的信息集成。 2. 用于画 CAD 图的 AI 工具包括: CADtools 12:Adobe Illustrator 插件,添加 92 个绘图和编辑工具。 Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 nTopology:基于 AI 可创建复杂 CAD 模型。 ParaMatters CogniCAD:根据设计目标和约束条件自动生成 3D 模型。 一些主流 CAD 软件如 Autodesk 系列、SolidWorks 等提供的基于 AI 的生成设计工具。 3. 星流一站式 AI 设计工具的入门模式中,右侧生成器有以下参考功能: 图像控制功能,如空间关系、线稿、人物长相、姿势等,精准控制生成图像的内容和风格。 只能使用以下四种参考功能: 全部图片参考功能,包括原图、景深、线稿轮廓、姿势、Lineart 线稿、Scribble 线稿、光影、Segmant 构图分割等。 原图、SoftEdge 线稿、配色参考、配色打乱、法线贴图、MLSD 线稿等。 需要注意的是,每个工具都有其特定的应用场景和功能,建议您根据自己的具体需求来选择合适的工具。同时,这些内容由 AI 大模型生成,请仔细甄别。
2024-12-24
怎么从零开始学习ai
以下是从零开始学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-12-24
学习设计专业,未来在Ai时代,如何提升价值,找到工作
在 AI 时代,学习设计专业的您可以通过以下几个方面提升价值并找到工作: 1. 设计专业方面: AI 重新定义了设计师的竞争力边界,您需要具备持续的学习习惯,并将所学快速转化为实践能力。 看似降低了设计门槛,但实则对需求理解、问题分析、审美判断、创意亮点提出了更高要求。 高阶设计师要更显性化设计思考与专业优势,提升设计质量。 2. 工具能力方面: 对现有 AI 工具进行严格评估和选型,确保其能提供标准化输出和一致性体验,提升设计质量和速度,减少设计差异。 建设参数文档库,而非基于个人喜好的自然语言。 基于业务场景特征,训练专属 AI 模型、集成相应 AI 能力形成新工具,形成更有效的设计资产。 3. 工作流程方面: 将 AI 深入到日常设计流程,形成新的工作方式与流程。 基于不同的 AI 能力特性,差异化对待不同业务形态和需求,使设计流程更加精细化。 找到更合理的人&机结合方式,持续探索优化。 4. 设计团队方面: 团队必须制定并执行明确的 AI 融合策略,保证所需硬件设备的支持。 营造积极主动的创新环境,增强对市场动态的快速适应能力,确保团队整体的未来发力方向。 总之,随着技术不断进步,AI 在视觉设计领域将扮演更重要角色,为设计师和用户创造更多可能性。现在开始学习相关知识和技能,您就可以保持领先优势。
2024-12-24
怎么用AI作画
以下是关于如何用 AI 作画的相关内容: 一、可用的 AI 绘图工具 1. Creately 简介:在线绘图和协作平台,利用 AI 功能简化图表创建过程,适合绘制流程图、组织图、思维导图等。 功能:智能绘图功能,可自动连接和排列图形;丰富的模板库和预定义形状;实时协作功能,适合团队使用。 官网:https://creately.com/ 2. Whimsical 简介:专注于用户体验和快速绘图的工具,适合创建线框图、流程图、思维导图等。 功能:直观的用户界面,易于上手;支持拖放操作,快速绘制和修改图表;提供多种协作功能,适合团队工作。 官网:https://whimsical.com/ 3. Miro 简介:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制,如思维导图、用户流程图等。 功能:无缝协作,支持远程团队实时编辑;丰富的图表模板和工具;支持与其他项目管理工具(如 Jira、Trello)集成。 官网:https://miro.com/ 二、使用 AI 绘制示意图的步骤 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求,添加并编辑图形和文字。利用 AI 自动布局功能优化图表布局。 5. 协作和分享:若需要团队协作,可邀请团队成员一起编辑。完成后导出并分享图表。 三、AI 绘画的关键词指南 公式:主题(加下面的)+环境(背景,周围)+气氛(烈日下,雾蒙蒙,恐怖的,风暴席卷的)+灯光(顶光,雾气光,漫反射的,强对比的)+色彩(低饱和度,颜色鲜艳的,花里胡哨的,强反射的主色调,某种颜色是是 accent color)+构图(黄金分割,三分法的,电影镜头,广角,鸟瞰图)+风格参考(超清细节的,照片级别的,写实的,抽象的,2D/3D,4k8k,数字雕刻,概念艺术,水墨,水彩,海报,某个软件,某个游戏,艺术家,艺术平台) 比如:去找自己喜欢的艺术家风格,放到风格参考的关键词里面;去找自己喜欢的灯光风格,放到灯光的关键词里面;去找自己喜欢的颜色和调色板风格,放到色彩的关键词里。 四、AI 辅助在独立游戏开发中的“踩坑”经验——《玩具帝国》 在游戏开发中使用 AI 绘画时遇到了一些问题: 1. 风格受限:全在画二次元,没有适合游戏的风格,需自己炼丹。 2. 缺乏叙事性:画出来的画多是美少女看镜头,没法当 icon 用。 3. 已有素材有限:训练集中素材单一,图生图不可行,泛化性差。 解决方法和经验: 1. 尝试不同的模型和训练方式,如 Embedding、CKPT、Lora 等,最终找到合适的方法。 2. 为引导 AI 画出前景后景区分明显的画,专门画了一组引导图,分别是只保留前景、只保留背景、全图共三张图,在 Caption 里打组。 3. 对训练集中人物朝向固定的问题做镜像处理。 4. 由于训练集缺乏建筑、风景、完整图像,先进行一次时间较短的训练,并用得到的模型生成与目标画风类似的建筑、风景图像,再将这些图片放回训练集。
2024-12-24
AI的含义是什么
AI 是一种让计算机或机器能够像人类一样思考和学习的技术。对于不具备理工科背景的人来说,可以将其视为一个黑箱,即只需要知道它是能够理解自然语言并输出自然语言、似人而非人的存在即可。AI 既是人类智慧的结晶,又是对自身认知极限的探索,它跨越存在与非存在的边界,虽不存在于物理世界,却时刻影响着现实。在与 AI 相处时,需要通过清晰的语言文字指令来压缩其自由度,明确告知其任务、边界、目标、实现路径和所需知识。在小学课堂上,为了让三年级的孩子理解,会用他们能听懂的语言来解释,先倾听孩子们的想法,再引出相关概念。
2024-12-24
可以用AI生产公众号文章吗?哪一类公众号比较好起号?
AI 可以用于生产公众号文章。以下是利用 AI 生产文章的相关要点: 1. 撰写文章: 关键在于提供清晰且具有指导性的提示词(prompt)。好的提示词能帮助 AI 更准确理解需求,生成符合预期的内容。 若已有基本提示词,AI 可生成基础文章;若想提升质量,可提供更详细、具创意的提示词,设定文章语气、风格和重点。 例如:“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。” AI 生成的文章可能需要进行微调,以符合预期和公众号风格。不到十分钟就能完成文章内容产出。 2. 添加多媒体元素: 为文章增添视觉魅力,精心挑选相关的图片、视频或图表,丰富内容,提升吸引力和专业度。 可利用 Perplexity.AI 的 Search Images 功能寻找合适素材,注意避免使用带水印、画质不清晰或分辨率低的图片。 图片出处主要在 twitter 和官方网站,若遇英文内容难以理解,可借助谷歌浏览器一键翻译功能或其他浏览器插件。 至于哪一类公众号比较好起号,这取决于多种因素,如您的兴趣、专业知识、目标受众等。一般来说,以下几类公众号相对容易起号: 1. 生活分享类:涵盖美食、旅行、健身等,贴近大众生活,容易引起共鸣。 2. 知识科普类:针对特定领域,如历史、科学、技术等,满足人们的求知欲。 3. 情感励志类:提供心灵慰藉和激励,触动读者内心。 但无论选择哪一类,关键是要提供有价值、独特且优质的内容。
2024-12-24
通义听悟
通义听悟是阿里云推出的一款基于大模型的工作学习 AI 助手。它主要针对音视频内容,具备以下功能: 实时记录交流内容并同步翻译。 批量转写音视频文件并区分发言人。 智能提炼全文概要、章节速览和发言总结。 提取视频中的 PPT 并总结摘要。 自动提取关键词和待办事项。 编辑整理笔记并导出分享。 通义听悟依托大模型技术,能帮助用户更高效地记录、整理和分析音视频内容,提高工作和学习效率。它于 2023 年 6 月 1 日开始公测,并在 2023 年 11 月的云栖大会上正式上线。
2024-11-14
通义千问和智谱清言对比
以下是通义千问和智谱清言的对比情况: 在对结构化 prompt 的测试中: 输入同样的 prompt 后,智谱清言的改写效果不错,能够理解 prompt,输出内容感觉良好,且认识到结构化 prompt 的重要性以及需要不断迭代优化。 通义千问的输入效果不错,能够一次输出,但输出的内容要差一些,需要提高。 在 Stepback prompting 评测中: 智谱清言的综合评分为 3 分,表现中规中矩。 通义千问的综合评分为 3.125 分,表现还算不错,只要内容上再提高一些,体验感和专业性会更好。 在小七姐的小样本测评中: 对于复杂提示词理解和执行的第一轮任务中,智谱清言首次回应初始化执行正常,但在生成内容时推理错误,且未回应特定问题,对于提示词中要求的逐步推理过程,可能因模型对已知问题答案生成的优先级高于用户设定的生成逻辑而未按步骤执行。 未提及通义千问在该轮任务中的具体表现。
2024-11-05
通义千问开源大模型种类
通义千问开源了多种大模型,其中 Qwen 2 模型性能超越目前所有开源模型和国内闭源模型。以下是相关信息: 性能突破:在中国大模型领域,开源模型显示出超越最强闭源模型的势头,从性能到生态都具备了媲美美国 Llama3 的能力。开源模型用实力证明其正在变得越来越强。 开源历程:2023 年 8 月,阿里云成为国内首个宣布开源自研模型的科技企业,推出通义千问第一代开源模型 Qwen;2024 年 2 月,1.5 代开源模型 Qwen1.5 发布;不到 4 个月后,Qwen2 开源。不到一年时间,通义先后开源数十款不同尺寸的模型,包括大语言模型、多模态模型、混合专家模型、代码大模型。 性能特点:Qwen 2 包括 5 种尺寸的预训练和指令调整模型,如 Qwen20.5B、Qwen21.5B、Qwen27B、Qwen257BA14B 和 Qwen272B。除英语和中文外,还接受过另外 27 种语言的数据训练,在大量基准评估中表现出最先进的性能,代码和数学性能显著提高,全面超越 llama3,增大了上下文长度支持。相比 Qwen1.5,Qwen2 实现了整体性能的代际飞跃。在国际权威测评中,Qwen272B 获十几项世界冠军,超过美国的 Llama3。 体验和下载:Qwen2 系列已上线魔搭社区 ModelScope 和阿里云百炼平台,开发者可在魔搭社区体验、下载模型,或通过阿里云百炼平台调用模型 API。同时,Qwen272binstruct 模型已经上线中国大语言模型评测竞技场 Compass Arena,所有人都可以登录体验 Qwen2 的性能,或者选择 Qwen2 模型与其他大模型进行对比测评。测评地址为。Compass Arena 是由上海人工智能实验室和魔搭社区联合推出的大模型测评平台,集齐了国内主流的 20 多款大模型。 您还可以通过玉宝搞的 LLM 在线评估(https://www.llmrank.cn/)查看国内各个闭源大模型的 HUMANEVAL 测评得分,并与 QWEN2 对比。
2024-11-04
智谱清言和通义哪个更强大
在不同的测评维度中,智谱清言和通义千问各有优势。 在多轮开放式问题基准 SuperCLUEOPEN 的胜率方面,智谱清言和通义千问 2.0 的胜率均超过 25%。 在工具使用能力的测评中,GPT4 Turbo 取得满分,国内大模型中智谱清言表现不俗,取得 83.78 的高分,排名国内模型第一,通义千问 2.0 也有超过 70 分的表现。 在对结构化 prompt 的测试中,通义千问能够一次输出,但输出内容有待提高;智谱清言在经过改写 prompt 等操作后也有不错的表现。 总体而言,难以简单地判定智谱清言和通义千问哪个更强大,其表现会因具体的测评维度和任务而有所不同。
2024-11-03
通义千问是怎么训练的?
通义千问是阿里推出的一款超大规模预训练语言模型,其训练过程包括以下方面: 1. 大规模预训练:基于先进的深度学习技术进行研发。 2. 精细微调:提升智能水平,使其表现更接近人类,进一步提升代码、数学、推理、指令遵循、多语言理解等能力,并学会对齐人类价值观,变得更有帮助、诚实和安全。 探索多种自动方法获取高质量、可靠、有创造力的指令和偏好数据,如针对数学的拒绝采样、针对代码和指令遵循的代码执行反馈、针对创意写作的回译、针对角色扮演的 scalable oversight 等。 结合有监督微调、反馈模型训练以及在线 DPO 等方法,并采用在线模型合并的方法减少对齐税。 不久后,通义千问团队将推出 Qwen2 的技术报告。Qwen 系列模型在全球爆火,近一个月内总下载量翻倍,已突破 1600 万次。海内外开源社区已经出现了超过 1500 款基于 Qwen 二次开发的模型和应用。
2024-10-24