TensorRT 官方样例学习笔记（二）核心 API 详解：从 sampleOnnxMNIST 构建推理引擎

TensorRT 官方样例学习笔记系列
TensorRT 官方样例学习笔记（一）环境搭建与项目结构解析
TensorRT 官方样例学习笔记（二）核心 API 详解：从 sampleOnnxMNIST 构建推理引擎
TensorRT 官方样例学习笔记（三）ONNX 解析器：sampleOnnxMNIST 与模型导入
TensorRT 官方样例学习笔记（四）动态 Shape 模式：sampleDynamicReshape 深度解析
TensorRT 官方样例学习笔记（五）低精度推理：sampleINT8 量化与校准实战
TensorRT 官方样例学习笔记（六）自定义插件开发：samplePlugin 算子扩展
TensorRT 官方样例学习笔记（七）Transformer 优化：sampleBERT 与多头注意力机制

前言：在 AI 辅助下，我们如何高效学习 TensorRT 源码？

在打通上篇的环境配置后，从本篇起我们将正式步入 TensorRT 源码的世界。后续的笔记中，笔者会根据特性的侧重点，灵活选用 TensorRT v8.6.1 或 TensorRT v10.14 版本中的官方代码进行剖析，摒弃流水账，仅对重点内容进行分析。

本文重点分析 TensorRT v10.14 版本中的 sampleOnnxMNIST 样例。虽然它是一个非常基础的样例，但它涵盖了 TensorRT 的核心工作流，包括模型解析、网络构建、引擎序列化、推理执行等关键步骤。通过对这个样例的深入剖析，我们可以对 TensorRT 的整体工作流程有一个清晰的认识。

得益于目前 AI 工具对源码查阅及调试的强大辅助，想要将这些样例跑起来已经非常容易，相关的编译与调试流程在此不作赘述。此外，正因为有了 AI 的辅助，本系列笔记将力争做到“简洁凝练、观其大略”。我们会优先建立对核心框架的宏观认知，把精力集中在涉及的数理分析和部分底层机制。

在 AI 辅助编程逐渐普及的背景下，开发者的角色正在从“代码实现者”转向“系统设计者”。当 AI 可以高效生成代码细节时，学习的重点也应随之转移：从关注 API 使用与实现技巧，转向从架构师视角出发，理解技术框架的设计逻辑、数据流转与性能权衡。