在VSCode中对CUDA和Python代码进行联合调试

在 cmu10414 hw3 的最后实现矩阵乘法的算子的时候靠肉眼和 printf 实在是调不通,研究了一下怎么在 VSCode 中联合调试 CUDA 和 Python 代码,特此记录。 项目准备 原项目中将 CUDA 代码编译为...

发表于8月24日 · 更新于8月24日 · 共1588字

Programming Massively Parallel Processors A Hands-on Approach 4th Edition 学习笔记 Part 1

本文为Programming Massively Parallel Processors A Hands-on Approach 4th Edition(中文名:大规模并行处理器编程实战)第一部分学习笔记,包括全书前六章。 全书第一部分主...

发表于8月12日 · 更新于10月10日 · 共12248字

LogSumExp梯度推导

前言 在 CMU 10-414/714 Deep Learning System 第二个 homework 有一个小任务要对数值稳定形式的 LogSumExp 的梯度进行推导,查阅了不少资料 1,琢磨好半天才搞懂,特此记录。 推导过程 符号说明 推导过...

发表于7月20日 · 更新于7月24日 · 共667字

使用ssh远程连接wsl2

概述 wsl2 使得 Windows 用户可以很方便地访问 Linux 环境,微软也在 vscode 中提供了相应的插件支持。但 wsl2 一般都是通过本地访问的,微软似乎没有直接提供远程访问 wsl2 的方式。...

发表于7月17日 · 更新于9月2日 · 共1705字

CMU 10-414 Assignments 实验笔记

前言 本文记录了完成《CMU 10-414/714 Deep Learning System》配套 Assignments 的过程和对应笔记。共有 6 个 hw,循序渐进地从头实现了一个深度学习框架,并利用搭建 DL 中厂常...

发表于6月6日 · 更新于9月15日 · 共27730字

在Hugo中使用KATEX渲染数学公式

前言 在博文中插入公式是个挺常见的需求,不知道为啥 Hugo 对于公式渲染没有原生支持😞。网络上能找到两种解决方案:KATEX 和 MathJax,据说前者...

发表于6月5日 · 更新于6月5日 · 共1114字

《CMU 10-414 deep learning system》学习笔记

写在最前面 从 2024-04-28 到 2024-09-08,历时四个多月,总算把 DLSys 学完了。这门课的一些收获: 自动微分理论知识和在实践过程中衍生的包括计算图等知识 系...

发表于5月28日 · 更新于9月14日 · 共30125字

Effective Cpp 第三版学习笔记

前言 本文是我在学习 Scott Meyers 的著作《Effective C++》第三版的笔记,鉴于豆瓣对于本书中文翻译褒贬不一,我直接看的英文原著。PDF 链接:Bo...

发表于4月17日 · 更新于9月9日 · 共29458字

安装并切换指定gcc或者g++版本

知其然 注意: 该方式将从 PPA 下载 gcc/g++,国内访问很慢,建议参考 《为apt配置代理》 这篇文章,配置好 apt 的代理。 以安装 g++ 13 版本(不支持指定小...

发表于4月1日 · 更新于4月12日 · 共1024字

为apt配置代理

一般来说,apt 通过换源即可获得不错的体验,但有的时候不得不加入一些没被镜像的国外源例如 PPA,因此不得不琢磨怎么在 apt 中配置代理。 apt 不会从环...

发表于4月1日 · 更新于4月12日 · 共146字