以下是关于大模型的相关信息:
支持文本+图像+视频输入,采用early fusion技术整合多模态数据Scout:支持1000万上下文,适合处理超长文本和复杂推理任务Maverick:100万上下文,长记忆优势适配多场景替代RAGBehemoth:2万亿参数级别的大模型在训,已超越GPT-4.5在STEM表现?[https://x.com/imxiaohu/status/1908708194312229083](https://x.com/imxiaohu/status/1908708194312229083)详细介绍及评测:?[https://www.xiaohu.ai/c/xiaohu-ai/meta-llama-4-1000](https://www.xiaohu.ai/c/xiaohu-ai/meta-llama-4-1000)4⃣️?Luma Ray2推出20+专业相机运动功能:文本即可操控专业级镜头运动,如Dolly Zoom、Orbit、Crane等所有镜头支持自由组合,实现复杂动态视觉效果可调节运动角度、速度和方向,适合广告片和电影级创作?[https://x.com/imxiaohu/status/1908714140400791555](https://x.com/imxiaohu/status/1908714140400791555)功能详细介绍:?[https://www.xiaohu.ai/c/xiaohu-ai/luma-ray2-20](https://www.xiaohu.ai/c/xiaohu-ai/luma-ray2-20)
支持文本+图像+视频输入,采用early fusion技术整合多模态数据Scout:支持1000万上下文,适合处理超长文本和复杂推理任务Maverick:100万上下文,长记忆优势适配多场景替代RAGBehemoth:2万亿参数级别的大模型在训,已超越GPT-4.5在STEM表现?[https://x.com/imxiaohu/status/1908708194312229083](https://x.com/imxiaohu/status/1908708194312229083)详细介绍及评测:?[https://www.xiaohu.ai/c/xiaohu-ai/meta-llama-4-1000](https://www.xiaohu.ai/c/xiaohu-ai/meta-llama-4-1000)4⃣️?Luma Ray2推出20+专业相机运动功能:文本即可操控专业级镜头运动,如Dolly Zoom、Orbit、Crane等所有镜头支持自由组合,实现复杂动态视觉效果可调节运动角度、速度和方向,适合广告片和电影级创作?[https://x.com/imxiaohu/status/1908714140400791555](https://x.com/imxiaohu/status/1908714140400791555)功能详细介绍:?[https://www.xiaohu.ai/c/xiaohu-ai/luma-ray2-20](https://www.xiaohu.ai/c/xiaohu-ai/luma-ray2-20)
随着大模型上下文窗口长度不断增加,各个厂商对于文本生成模型呈现出“军备竞赛”的态势。目前,主流的文本生成模型是聊天模型,比如GPT、Claude 3等,也有少部分Base模型,例如Yi-34开源模型。两位技术研究人员分享了他们对于大模型的看法:用户使用最多的是GPT,但对外开放的版本性能较差,用户交互端无法传输大文件,只能通过API接口上传。月之暗面的Kimi模型大海捞针测试分数很高,但实际使用效果没有达到理想状态。百川192K的闭源模型,对于6万字的长文本,其表现的推理能力和回答效果很优秀。各种长文本的跑分数据,最高的是Claude 3模型。