什么是 MindIE__
昇腾推理引擎,是基于昇腾硬件的运行加速、调试调优、快速迁移部署的高性能AI推理引擎,分层开放满足各类需求,统一接口使能极简开发,沉淀能力构筑极致性能
倍级性能
使用MindIE,模型推理吞吐数倍提升,时延大幅降低,推理成本大幅下降
极简部署
MindIE支持单机、多机、大规模专家并行等极简的推理部署
降低负载
通过高效内存管理,KVCache压缩等多种优化技术,降低大量负载
开放兼容
支持MindIE Service服务化,以及vLLM、OpenAI、Triton等多种接口
MindIE助力昇腾易部署、高性能推理
MindIE视图生成
通过MindIE SD进行高性能视图生成推理和可视化
MindIE文本生成
通过MindIE LLM进行文本生成推理,服务化端到端推理全流程加速
第三方引擎推理
昇腾平台支持开源和客户自研推理引擎如vLLM等,并为其提供推理加速
业务系统
推理服务
MindIE Service 昇腾推理服务
推理模型套件
MindIE SD
MindIE LLM
加速套件
MindIE Turbo 昇腾通用加速套件 可选
第三方加速引擎
(vLLM I …)
MindIE SD
MindIE SD是视图生成加速套件,提供了一系列的软件加速方案,提高视图生成性能。
了解关键场景的核心技术

服务化集成部署
提供全面易用的服务化能力,提供自研方案和开源方案,方便业务集成部署。
开放的MindIE服务化部署MindIE服务化开放支持多种第三方API ,如Triton、OpenAI,TGI,vLLM等,支持调用、会话管理、请求调度等
vLLM开源生态全面支持通过vLLM Ascend开源项目,vLLM开源全面支持昇腾,核心特性全面支持
客户案例

南方航空
南方航空使用昇腾MindIE部署深度求索DeepSeek大模型,深入探索人工智能算力底座在航班运行、物流运输、旅客服务、经营管理等场景的创新实践路径

深圳龙岗
使用MindIE接入部署DeepSeek助力政务和市民平台,方便政务处理和市民事务咨询等

东南大学
基于MindIE实现DeepSeek本地化部署,接入校园信息服务门户、数智东南app,为全校师生提供本地化服务,可同时支持800人在线问答,日均1亿+tokens
获取开发资源
快速上手
在线的开箱5步视频,帮助你轻易上手MindIE的使用之路
进阶学习
提供丰富的在线的课程,带你进一步学习MindIE的相关知识,成为专家
开发文档
查看MindIE产品技术文档,了解更多详细技术细节
开源项目
了解MindIE与开源社区的合作项目,其中包括昇腾vLLM适配层开源项目vLLM Ascend等,点击查看开源项目内容
故障案例
提供海量的问题分析思路和解决办法