MIT 6.5940 EfficientML Lab 2 实验笔记

本文为 EfficientML Lab 2 实验笔记,包含 K-Means 量化、K-Means QAT、线性量化等内容,难度不大,内容丰富。 Part 1: K-Means Quantization Qustion 1 第一个问题是实现 K-means 量化的核心算法,其...

发表于2月25日 · 更新于2月25日 · 共1474字

MIT 6.5940 EfficientML 第六讲学习笔记

本文介绍了训练后量化(PTQ)和量化感知训练(QAT)技术,PTQ 通过 Per-Tensor/Channel/Vector 等不同粒度划分量化参数,结合动态范围裁剪(校准集统计或 KL 散度优化)和...

发表于2月17日 · 更新于2月21日 · 共1929字

百度飞桨「启航计划」小结——CINN后端Pass改造

在过去八周时间里,我参加了由飞桨开源社区组织的 飞桨启航计划集训营(第四期),认领并完成 【开源任务】CINN编译器后端Pass改造 系列任务。趁...

发表于1月8日 · 更新于1月8日 · 共3199字

MIT 6.5940 EfficientML Lab 1 实验笔记

实验准备 Python 环境 需要用到如下 Python 环境: PyTorch GPU 版本 jupyter notebook tqdm matplotlib torchprofile 数据集准备 Lab 1 中用到了 CIFAR-10 数据集,可以使用 https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz 直接下载,并将整个 cifar-10-batched-py 文件夹解压到 data/cifar10 文件夹内。 Part...

发表于11月27日 · 更新于2月12日 · 共2209字

MIT 6.5940 EfficientML 第五讲学习笔记

本讲开始介绍量化技术,首先介绍各种数据表示格式,然后介绍了两种量化技术:K-means和线性量化,最后提到了模型压缩的流水线。 数值数据类型 课...

发表于11月18日 · 更新于2月17日 · 共1672字

如何在VSCode中“优雅”地配置CMake —— 以PaddlePaddle为例

通过本文,你将了解如何在 VSCode 中配置 CMake 项目,包括但不限于语法高亮、代码跳转、CMake 配置、构建、测试。 环境说明 本文使用 WSL Ubuntu 22.04 作为演示环境,VS...

发表于11月15日 · 更新于11月17日 · 共1949字

MIT 6.824 Distributed Systems Spring 2023 第三讲学习笔记

MIT 6.824 Distributed Systems 第三讲学习笔记,简单介绍了存储系统和一致性,主要介绍了 GFS 中的文件读写流程。 存储系统概述 存储系统在分布式系统中相当重要:如果能够建立一...

发表于11月13日 · 更新于11月17日 · 共1778字

MIT 6.5940 EfficientML 第四讲学习笔记

本讲延续上一讲继续介绍了两种确定剪枝比例的算法:灵敏度分析和强化学习。此外还介绍了为稀疏网络提供支持的硬件加速器,包括 EIE、NVIDIA Tensor...

发表于11月11日 · 更新于11月12日 · 共2293字

MIT 6.824 Distributed Systems Spring 2023 第二讲学习笔记

MIT 6.824 Distributed Systems 第二讲学习笔记,包括 Go 语言和并发编程的简单介绍,以及对 RPC 和故障情况下的 RPC 语义的说明。 Lecture 2: RPC and Threads 为什么选择 Go 语言 对于线程和 RPC 的良好支持...

发表于11月10日 · 更新于11月10日 · 共842字

MIT 6.5940 EfficientML 第三讲学习笔记

MIT 6.5940 EfficientML 第三讲学习笔记,主要介绍剪枝的定义、效果和粗细程度,并详细介绍了多种剪枝标准。 Lecture 3: Pruning and sparsity 剪枝和稀疏性 剪枝的动机 在上一讲提到,内存操作的...

发表于11月9日 · 更新于11月10日 · 共1622字