相关文章
DeepSpeed 使用 LoRA 训练后文件结构详解
DeepSpeed 使用 LoRA 训练后文件结构详解
在大语言模型(LLM)的训练过程中,DeepSpeed 提供了强大的分布式训练能力,而 LoRA(Low-Rank Adaptation)通过参数高效微调技术显著减少了资源占用。完成训练后&…
建站知识
2024/12/31 15:51:31
MIT实验笔记冲刺3:页表操作(理论部分)
目录 分页硬件
内核地址空间
代码:创建地址空间
物理内存分配
代码:物理内存分配器
进程地址空间
代码:sbrk
代码:exec
实际的操作系统 这个实验将重点放到了我们的页表上,实际上,页表在我们上一个…
建站知识
2024/12/31 19:44:41
米尔电子 瑞米派 烧写米尔官方ubuntu系统镜像
链接https://down.myir-tech.com/RemiPi/
硬件接口如下 确认拨码开关: 连接电源和串口
按照绿色 白色 黑色连接串口线,打开串口后上电 烧写:
1.烧写bootloader至emmc
将拨码开关拨动至下载模式(0010): 连接串口至J…
建站知识
2024/12/31 22:23:32
穷举vs暴搜vs深搜vs回溯vs剪枝系列一>组合
题目: 解析: 代码: private List<List<Integer>> ret;private List<Integer> path;private int n,k;public List<List<Integer>> combine(int _n, int _k) {n _n;k _k;path new ArrayList<>();ret…
建站知识
2024/12/31 4:44:22
Bash Shell知识合集
1. chmod命令
创建一个bash shell脚本 hello.sh
~script $ touch hello.sh脚本创建完成后并不能直接执行,我们要用chmod命令授予它可执行的权限:
~script $ chmod 755 hello.sh授权后的脚本可以直接执行:
~script $ ./hello.sh2.指定运行…
建站知识
2024/12/31 17:19:17
numpy的repeat和pytorch的repeat区别
在项目中发现这两个同名的函数的效果不一样,下面简单介绍:
numpy的repeat
a np.array([1,2,3])
print(a, a) ## 结果为123
b a.repeat(3)
print(b) ## 结果为111222333pytorch的repeat和repeat_interleave
labels np.array([1,2,3])
labels t…
建站知识
2024/12/29 8:14:56