相关文章
SFT数据处理部分的思考
SFT数据及处理的业内共识
1.prompt的质量和多样性远重要于数据量级,微调一个 30 b 量级的base model只需要 10 w 量级的数据即可 参考:《LIMA:Less Is More for Alignment》 2.合成数据很重要!一般需要通过…
建站知识
2025/3/19 14:49:28
游戏引擎学习第158天
回顾和今天的计划
我们在这里会实时编码一个完整的游戏,没有使用引擎或库,一切都由我们自己做所有的编程工作,游戏中的每一部分,无论需要做什么,我们都亲自实现,并展示如何完成这些任务。今天,…
建站知识
2025/3/19 13:58:29
C 语言进【进阶篇】之动态内存管理:从底层机制到实战优化
目录 🚀前言🌟动态内存分配的必要性🤔动态内存分配函数深度剖析💯malloc函数:内存申请的主力军💯free函数:释放内存的“清道夫”💯calloc函数:初始化内存的利器…
建站知识
2025/3/19 14:49:29
校平机:金属板材的“隐形整形师”
在金属加工车间里,激光切割后的板材常带着波浪般的起伏,这些看似细微的变形却能让焊接、喷涂等后续工序功亏一篑。而一台看似笨重的设备——校平机,总能在关键时刻化腐朽为神奇,用辊轮与压力的精密配合,让倔强的金属板…
建站知识
2025/3/16 10:44:07
自定义tiptap插件
本文为开发开源项目的真实开发经历,感兴趣的可以来给我的项目点个star,谢谢啦~ 具体博文介绍: 开源|Documind协同文档(接入deepseek-r1、支持实时聊天)Documind 🚀 一个支持实时聊天和接入 - 掘…
建站知识
2025/3/16 10:43:06
大模型token和字符串的关系
一 主要区别 token 是使用分词器拆分后的最小单位,不同的分词方式会导致同样的字符具有不同的token数量。如你好,可以拆分为【你、好】两个token, 【你好】一个token。 同一个文本的 Token 数量可能远少于字符数(英文)…
建站知识
2025/3/16 10:42:04