如何在VSCode中“优雅”地配置CMake —— 以PaddlePaddle为例

通过本文,你将了解如何在 VSCode 中配置 CMake 项目,包括但不限于语法高亮、代码跳转、CMake 配置、构建、测试。 环境说明 本文使用 WSL Ubuntu 22.04 作为演示环境,VS...

发表于11月15日 · 更新于11月17日 · 共1949字

MIT 6.824 Distributed Systems Spring 2023 第三讲学习笔记

存储系统概述 存储系统在分布式系统中相当重要:如果能够建立一个可靠的存储系统,可以讲其它应用构建为无状态的,而在存储系统中持久存储状态,这能够...

发表于11月13日 · 更新于11月17日 · 共1733字

MIT 6.5940 EfficientML 第四讲学习笔记

本讲延续上一讲继续介绍了两种确定剪枝比例的算法:灵敏度分析和强化学习。此外还介绍了为稀疏网络提供支持的硬件加速器,包括 EIE、NVIDIA Tensor...

发表于11月11日 · 更新于11月12日 · 共2293字

MIT 6.824 Distributed Systems Spring 2023 第二讲学习笔记

MIT 6.824 Distributed Systems 第二讲学习笔记,包括 Go 语言和并发编程的简单介绍,以及对 RPC 和故障情况下的 RPC 语义的说明。 Lecture 2: RPC and Threads 为什么选择 Go 语言 对于线程和 RPC 的良好支持...

发表于11月10日 · 更新于11月10日 · 共842字

MIT 6.5940 EfficientML 第三讲学习笔记

MIT 6.5940 EfficientML 第三讲学习笔记,主要介绍剪枝的定义、效果和粗细程度,并详细介绍了多种剪枝标准。 Lecture 3: Pruning and sparsity 剪枝和稀疏性 剪枝的动机 在上一讲提到,内存操作的...

发表于11月9日 · 更新于11月10日 · 共1622字

MIT 6.5940 EfficientML 第二讲学习笔记

如无另外说明,本文图片截取自 EfficientML 课程幻灯片。 Lecture 2: Basics of neural networks 神经网络基础 神经网络 基本术语 如下图所示,我们使用术语 Synapses(突触?)、权重、...

发表于11月5日 · 更新于11月10日 · 共952字

运算符优先级解析算法之优先级爬升法——算法原理与实现

在 LLVM 的官方入门教程 My First Language Frontend with LLVM Tutorial 的第二章构造 AST 时涉及到了对运算符优先级解析的内容,使用的算法为 优先级爬升法。尽管教程开篇称“不需要编译原理前...

发表于10月29日 · 更新于10月30日 · 共2196字

Programming Massively Parallel Processors A Hands-on Approach 4th Edition 学习笔记 Part 2

若无另外声明,本文图片均截取自原书。 Chapter 07: Convolution 卷积 本章主要介绍 2D 卷积实现,从朴素版本开始,分别使用常量内存、分块共享内存和 cache 技术依次进行优化。 7.1...

发表于10月10日 · 更新于10月24日 · 共10662字

2d 卷积梯度推导与实现

符号说明 $$ \begin{align*} X &: 卷积输入,\text{shape} 为[b,h,w,c_{in}]\\ W &: 卷积核,\text{shape}为[a,a,c_{i...

发表于9月11日 · 更新于9月14日 · 共2018字

常用软件换源和代理配置方法

本文记录了 Windows 和 Linux 平台上常用软件和开发工具的代理配置方法,镜像源优先使用中科大源,代理默认本地代理,端口号为 7890。 Windows Winget winget 使用中科大镜像 1,...

发表于8月31日 · 更新于9月3日 · 共396字