无问芯穹致力于提供卓越的AGI算力解决方案,以大模型能效优化工具包为核心,向下联动多家国产芯片公司,向上通过智算云服务、智算一体机多种方式服务大模型算法企业,协同算力、算法、生态推动行业大模型的高效落地,构建AGI时代的大模型基础设施。
以无穹大模型能效优化工具包为基础,整合国产芯片算力, 构建统一算力底座,提供包括NVIDIA、AMD、海光、天数等多种加速算力云服务,屏蔽硬件差异,开箱即用。
面向大模型私有化部署场景,整合计算加速卡、自研IP、优化工具包、行业大模型,构建大模型一体机,最大化优化大模型落地ROI。
创始团队成员来自清华大学电子系及头部互联网/AI企业,拥有丰富的产业经验和成功的创业经历,技术积累与学术沉淀丰富,已经在人工智能系统优化领域发表高水平学术论文200余篇。
相关成果包括:(1)GPU高效算子库超越英伟达商用库,在中端工艺GPU上实现比商用软件在高端工艺GPU更优的性能;(2)支撑大模型的高效稀疏推理加速架构,提升稀疏神经网络、图神经网络等计算速度1-3个量级。团队已经实现大语言模型在英伟达GPU上延时降低50%,未来将进一步结合底层算子优化、稀疏加速、硬件特性感知、高效互联等能力,将整机加速比提升到10倍。