GCC编译器优化技术详解,包括RVO(返回值优化)、NRVO(命名返回值优化)等编译优化策略,以及相关C++代码示例和性能优化技巧。
Read more »

卷积神经网络实现详解,包括Conv2D、Conv3D、Depthwise Conv的算法实现、im2col优化、GEMM计算、数据打包等核心技术和C++代码示例。
Read more »

C++异步编程技术详解,包括std::async和std::future的使用方法、launch策略、future状态管理、promise和packaged_task等高级异步编程技巧。
Read more »

C++11可变模板参数技术详解,包括参数包定义、递归函数展开、逗号表达式展开等核心概念和实现方法,帮助理解现代C++模板元编程技术。
Read more »

深度学习模型转换和部署技术,包括PaddlePaddle、NCNN、TNN等框架的使用方法,以及x2paddle、paddle2onnx等模型转换工具的使用指南。
Read more »

日常技术笔记集合,包含GPU代码资源、深度学习部署工具、GitHub使用技巧以及Arm Mali GPU架构详解。重点介绍了Mali GPU的Tripipe设计、内存系统和性能特征。
Read more »

PaddlePaddle推理引擎深度解析,包括EngineBase基类设计、NaiveExecutor执行逻辑、Operator运行机制等核心代码实现和执行流程分析。
Read more »

开发环境配置和优化技巧记录,包括ccache和distcc编译加速、CMake集成ccache、卷积计算参数、CentOS EPEL源配置等实用技术。
Read more »

Linux常用命令集合,包括shell脚本中的字符串替换、文件搜索等实用命令,帮助提高日常开发效率。
Read more »
0%