Posts by Year

2024

机器学习项目中的配置文件管理

6 minute read

相信接触过机器学习项目,尤其是从零开始搭建一个代码库的同学们,通常会遇到一个问题:如何管理配置文件。在炼丹过程中,我们会对许多参数进行调整,例如学习率、模型结构、优化器参数等等。这些参数的调整不仅会影响到模型的性能,也会影响到代码的可读性和可维护性。如果直接将这些参数硬编码在代码中,那么每次调整参数都需要修改代码...

Back to top ↑

2023

如何使用 VS Code 调试 Slurm 计算节点

2 minute read

SLURM (Simple Linux Utility for Resource Management) 是一款开源的高度可扩展的资源管理和任务调度系统,被广泛应用于 HPC 集群中。SLURM 管理的集群一般由若干管理(登陆)节点和若干计算节点组成。通常,我们在管理节点上提交任务后,调度系统会自动将任务分配到空...

如何优雅地通过远程设备写代码

4 minute read

最近一两年因为疫情的影响,Work from Home 成为了大家的新常态。然而,工作代码和数据通常都存在公司/学校的机器上,这就导致了一个问题:如何在家里访问公司/学校的机器呢?最简单粗暴的方法自然是用 TeamViewer, AnyDesk, 向日葵这类软件来控制机器,并直接在远程桌面上进行开发。但是,一方面...

Back to top ↑