打赏

相关文章

SFT数据处理部分的思考

SFT数据及处理的业内共识 1.prompt的质量和多样性远重要于数据量级,微调一个 30 b 量级的base model只需要 10 w 量级的数据即可 参考:《LIMA:Less Is More for Alignment》 2.合成数据很重要!一般需要通过…

游戏引擎学习第158天

回顾和今天的计划 我们在这里会实时编码一个完整的游戏,没有使用引擎或库,一切都由我们自己做所有的编程工作,游戏中的每一部分,无论需要做什么,我们都亲自实现,并展示如何完成这些任务。今天,…

校平机:金属板材的“隐形整形师”

在金属加工车间里,激光切割后的板材常带着波浪般的起伏,这些看似细微的变形却能让焊接、喷涂等后续工序功亏一篑。而一台看似笨重的设备——校平机,总能在关键时刻化腐朽为神奇,用辊轮与压力的精密配合,让倔强的金属板…

自定义tiptap插件

本文为开发开源项目的真实开发经历,感兴趣的可以来给我的项目点个star,谢谢啦~ 具体博文介绍: 开源|Documind协同文档(接入deepseek-r1、支持实时聊天)Documind 🚀 一个支持实时聊天和接入 - 掘…

大模型token和字符串的关系

一 主要区别 token 是使用分词器拆分后的最小单位,不同的分词方式会导致同样的字符具有不同的token数量。如你好,可以拆分为【你、好】两个token, 【你好】一个token。 同一个文本的 Token 数量可能远少于字符数(英文&#xff09…

【模拟算法】

目录 替换所有的问号 提莫攻击 Z 字形变换 外观数列 数青蛙(较难) 模拟算法:比葫芦画瓢。思路较简单,考察代码能力。 1. 模拟算法流程,一定要在演草纸上过一遍流程 2. 把流程转化为代码 替换所有的问号 1576. 替…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部