Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

腾讯 Hunyuan

Answer

腾讯混元是腾讯推出的一系列模型,包括腾讯混元视频生成模型。以下是关于腾讯混元的一些重要信息:

  • 上个月 5 号,宣布开源大语言模型混元 Large 和 3D 大模型 Hunyuan3D-1.0。
  • 近期开源了超大混元视频生成模型 HunyuanVideo,具备 130 亿参数,表现出色。该模型支持文生视频生成,未来将支持图生视频,特点包括超强的真实质感、很强的语义理解、可以切换镜头。
  • 开源地址:https://github.com/Tencent/HunyuanVideo 。普通用户也可以去腾讯元宝 APP,进入 AI 应用查看,可能需要申请资格,但腾讯处理速度较快。
  • 2024 年 12 月 4 日有相关报道。
  • 1 月 24 日,腾讯宣布推出 Hunyuan3D-1.0 ,地址为 https://github.com/Tencent/Hunyuan-Large 。
Content generated by AI large model, please carefully verify (powered by aily)

References

混元:腾讯视频模型

腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。今天,人又在腾讯混元发布会的现场。上个月5号,他们宣布开源大语言模型混元Large和3D大模型Hunyuan3D-1.0。仅仅一个月时间,他们又从深圳奔赴北京,邀请了一些老朋友,又开了一次私密的闭门会。而这一次的项目,就是被N多人期待了很久的,腾讯混元视频生成模型。同样,现场宣布,直接,开源。腾讯也活成了,马斯克心中,那个OpenAI的模样。聊聊这个腾讯混元的AI视频模型,我已经先行测试了一周,跑了几百个case。先说结论:偏科战神,强的部分强到没边,弱的地方也急需优化,但是瑕不掩瑜,综合来看,闭源模型中排在T1附近,开源AI视频中,无可争议的T0。开源地址:https://github.com/Tencent/HunyuanVideo普通用户也可以去腾讯元宝APP,进入AI应用,就能看到这个AI视频了。可能普通用户需要资格申请,但是以腾讯的速度,应该非常快,看了群友的反馈,有的申请了不到一会就拿到了体验资格。我先放几个我跑的Case,再来细说。很有意思,很特别的模型。如果让我来总结混元的3个特点,那就是:超强的真实质感,很强的语义理解,可以切换镜头。一个一个来说。

2024 年历史更新(归档)

《[腾讯杀疯了!开源超大混元视频生成模型](https://mp.weixin.qq.com/s/vOU5_xEfdJpR72p2U3aoww)》腾讯近期开源了超大混元视频生成模型HunyuanVideo,具备130亿参数,表现出色。该模型支持文生视频生成,未来将支持图生视频。其特点包括出色的美学表现、运动幅度和稳定性,特别在中国风格内容上表现优异。模型创新使用多模态大语言模型进行文本编码,并采用双流到单流的混合设计。《[斯坦福对话Perplexity CEO:不做PPT,不拼模型,这家AI公司凭什么值90亿?](https://mp.weixin.qq.com/s/cFeFINJJU-E2QLYDi1Phmg)》在斯坦福大学的对话中,Perplexity首席执行官Aravind Srinivas分享了他对人工智能的愿景,强调知识获取的重要性和普及。他提到Perplexity作为一个“答案引擎”,旨在通过提供引用来提升信息的可信度,让用户更轻松地获取知识。来自知识重视文化的背景影响了他在建立团队和产品理念上的思考,Perplexity致力于帮助人们持续学习和理解世界。

1月24日 社区动态速览

[heading2]最新模型发布[content]腾讯宣布推出Hunyuan3D-1.0 https://github.com/Tencent/Hunyuan-Large阶跃星辰Step-1o重大升级https://yuewen.cn豆包全量上线超拟人的「实时语音」https://www.doubao.com/

Others are asking
腾讯agent开发
AppAgent 是由腾讯开发的一种基于大型语言模型(LLM)的多模态 Agent 框架。 其主要特点和功能包括: 多模态代理:能够处理和理解多种类型的信息(如文本、图像、触控操作等)。 直观交互:通过模仿人类的直观动作(如点击和滑动屏幕)来与手机应用程序交互,能够在手机上执行各种任务,例如在社交媒体上发帖、帮用户撰写和发送邮件、使用地图、在线购物,甚至进行复杂的图像编辑等。 对于之后模仿数据的反利用也有不错的应用场景,例如互联网或 AI 或涉及到原型+UE 的工作都可以在基于模仿数据的基础上进行反推,进而让设计出的产品原型和 UE 交互更优解。 AppAgent 在 50 个任务上进行了广泛测试,涵盖了 10 种不同的应用程序。该项目由腾讯和德州大学达拉斯分校的研究团开发。 相关链接: 官方网站:https://appagentofficial.github.io 相关报道:https://x.com/xiaohuggg/status/1738083914193965528?s=20
2025-02-14
腾讯元器智能体
智能体是随着 ChatGPT 与 AI 概念爆火而出现的新名词,如“智能体 Agent”“bot”和“GPTs”等。简单理解,智能体就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。AI 大模型是技术,面向用户提供服务的是产品,因此很多公司关注 AI 应用层的产品机会。 在做智能体创业的公司有不少,C 端案例中,比如在社交方向,用户注册后先捏一个自己的智能体,然后让其与他人的智能体聊天,两个智能体聊到一起后再真人介入。B 端案例中,如果字节扣子和腾讯元器是面向普通人的低代码平台,类似 APP 时代的个人开发者,还有机会帮助 B 端商家搭建智能体。 国内有很多智能体开发平台,如字节的扣子 Coze、Dify.AI 等。个人常用的是扣子,本篇主要对比字节扣子和腾讯元器。 在 2025 年 1 月的国内月活榜中,腾讯元器排名 A101+1,分类为智能体,网址是 yuanqi.tencent.com,活跃用户为 5 万人,环比变化为0.1748,所属公司为腾讯。
2025-02-14
腾讯系ai生成视频的平台
腾讯系生成视频的平台主要有以下两个: 1. 腾讯 Hunyuan:这是一个 130 亿参数的开源视频模型。具有高质量视频生成能力,动作连贯自然,镜头切换灵活。具备强大语义跟随能力,适配新一代语言模型作为文本编码器,采用类似 Sora 的 DiT 架构,显著提升影视级动态表现力。其官网为:https://aivideo.hunyuan.tencent.com ,代码:https://github.com/Tencent/HunyuanVideo 2. 腾讯智影:具有数字人播报功能。 此外,通过 ChatGPT 生成文案,将文案复制到支持 AI 文字转视频的工具内,也可实现短视频自动生成。比如手机版剪映的图文成片功能。区别于专业剪辑软件复杂的操作页面,这类 AI 视频制作工具让大众生产视频更轻松上手。
2025-02-10
腾讯智影的功能
腾讯智影具有以下功能: 1. 数字人播报功能:可实现通过文字生成数字人的播报内容。 2. 短视频自动生成:通过 ChatGPT 生成文案,将文案复制到工具内实现短视频自动生成。当系统匹配的素材不符合要求时可手动替换。与专业剪辑软件相比,操作更简便,让大众生产视频更轻松。 此外,在 AI 领域还有其他相关产品和应用,如: 1. 彩云天气 APP:利用 AI 技术提供准确的天气预报预警,保障生命财产安全。 2. 腾讯觅影:对医疗影像进行分析,辅助医生诊断。 3. 钉钉会议管理功能:利用 AI 技术管理会议流程,提高会议效率。 4. 微拍堂书法作品拍卖频道:利用 AI 技术对书法作品进行鉴定和评估,为书法爱好者提供作品销售渠道。 在制作 PPT 方面,好用的 AI 工具包括: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。 2. 美图 AI PPT:通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。 3. Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,包括自动布局、图像选择和文本优化等。 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。
2025-01-10
有没有能分析拆解腾讯视频的AI工具?
目前有使用 Gemini 1.5 Pro 来分析和拆解腾讯视频的工具。以下是一些相关信息: 大家可以放自己的案例,本文档可编辑。 郑跃葵:拿个库布里克的电影来分析,连大师手法都学会了。 大峰 AI 绘画:太酷啦又多了一个 AI 视频创作助手。 Jones:b 站大学复习有救了。 对!:拉片太方便了。 Shock:而且可以干掉人工标注了,安徽那边数据标注众包要失业了。 清慎:1. 影视二创长剪短,一键生成小帅、小美、大壮、丧彪的故事;2. 警察叔叔查监控,一句话找出监控中的可疑现象;3. 替代 Opus 等长剪短工具。 测试者阿强:好用,准确度很高,把前几天用 AI 做的功夫熊猫之离谱村版丢进去分析,效果很好。拆解作品。 测试者张余和 Ling、洋洋也有拆解结果,Gemini 1.5 Pro 给出了全文。 您可以尝试使用 Gemini 1.5 Pro 来满足您对腾讯视频的分析拆解需求。
2024-12-11
腾讯混元大模型网址
腾讯混元大模型的开源地址为:https://github.com/Tencent/HunyuanVideo 。普通用户也可以去腾讯元宝 APP,进入 AI 应用查看该模型,可能需要申请资格,但腾讯处理速度较快。此外,模型下载地址为:https://huggingface.co/tencent/TencentHunyuanLarge ,详细介绍可参考:https://xiaohu.ai/p/15254 ,技术报告:https://arxiv.org/pdf/2411.02265 。
2024-12-09