Chat with Wiki - 200万字大模型

Answer

以下是关于大模型的相关信息：

4 月 6 日的 XiaoHu.AI 日报中提到：支持文本+图像+视频输入，采用 early fusion 技术整合多模态数据。Scout 支持 1000 万上下文，适合处理超长文本和复杂推理任务；Maverick 有 100 万上下文，长记忆优势适配多场景替代 RAG；Behemoth 是 2 万亿参数级别的大模型在训，已超越 GPT-4.5 在 STEM 表现。相关详细介绍及评测的链接为：https://x.com/imxiaohu/status/1908708194312229083 、https://www.xiaohu.ai/c/xiaohu-ai/meta-llama-4-1000 。Luma Ray2 推出 20 多种专业相机运动功能，文本即可操控专业级镜头运动，如 Dolly Zoom、Orbit、Crane 等，所有镜头支持自由组合，实现复杂动态视觉效果，可调节运动角度、速度和方向，适合广告片和电影级创作。相关功能详细介绍的链接为：https://x.com/imxiaohu/status/1908714140400791555 、https://www.xiaohu.ai/c/xiaohu-ai/luma-ray2-20 。
在质朴发言：大模型未来发展：RAG vs 长文本，谁更胜一筹？｜Z 沙龙第 8 期中提到：随着大模型上下文窗口长度不断增加，各个厂商对于文本生成模型呈现出“军备竞赛”的态势。目前，主流的文本生成模型是聊天模型，比如 GPT、Claude 3 等，也有少部分 Base 模型，例如 Yi-34 开源模型。两位技术研究人员分享了他们对于大模型的看法：用户使用最多的是 GPT，但对外开放的版本性能较差，用户交互端无法传输大文件，只能通过 API 接口上传。月之暗面的 Kimi 模型大海捞针测试分数很高，但实际使用效果没有达到理想状态。百川 192K 的闭源模型，对于 6 万字的长文本，其表现的推理能力和回答效果很优秀。各种长文本的跑分数据，最高的是 Claude 3 模型。

Content generated by AI large model, please carefully verify (powered by aily)

References

支持文本+图像+视频输入，采用early fusion技术整合多模态数据Scout：支持1000万上下文，适合处理超长文本和复杂推理任务Maverick：100万上下文，长记忆优势适配多场景替代RAGBehemoth：2万亿参数级别的大模型在训，已超越GPT-4.5在STEM表现?[https://x.com/imxiaohu/status/1908708194312229083](https://x.com/imxiaohu/status/1908708194312229083)详细介绍及评测：?[https://www.xiaohu.ai/c/xiaohu-ai/meta-llama-4-1000](https://www.xiaohu.ai/c/xiaohu-ai/meta-llama-4-1000)4⃣️?Luma Ray2推出20+专业相机运动功能：文本即可操控专业级镜头运动，如Dolly Zoom、Orbit、Crane等所有镜头支持自由组合，实现复杂动态视觉效果可调节运动角度、速度和方向，适合广告片和电影级创作?[https://x.com/imxiaohu/status/1908714140400791555](https://x.com/imxiaohu/status/1908714140400791555)功能详细介绍：?[https://www.xiaohu.ai/c/xiaohu-ai/luma-ray2-20](https://www.xiaohu.ai/c/xiaohu-ai/luma-ray2-20)

XiaoHu.AI日报

质朴发言：大模型未来发展：RAG vs 长文本，谁更胜一筹？｜Z 沙龙第 8 期

随着大模型上下文窗口长度不断增加，各个厂商对于文本生成模型呈现出“军备竞赛”的态势。目前，主流的文本生成模型是聊天模型，比如GPT、Claude 3等，也有少部分Base模型，例如Yi-34开源模型。两位技术研究人员分享了他们对于大模型的看法：用户使用最多的是GPT，但对外开放的版本性能较差，用户交互端无法传输大文件，只能通过API接口上传。月之暗面的Kimi模型大海捞针测试分数很高，但实际使用效果没有达到理想状态。百川192K的闭源模型，对于6万字的长文本，其表现的推理能力和回答效果很优秀。各种长文本的跑分数据，最高的是Claude 3模型。