相关文章
【llm post-training】从Loss Function设计上看LLM SFT和RL的区别和联系
大型语言模型(LLM)的崛起深刻地改变了自然语言处理领域。为了让这些模型更好地服务于人类,两个关键的微调技术应运而生:监督微调 (Supervised Fine-tuning, SFT) 和 强化学习 (Reinforcement Learning, RL)。 虽然两者都旨在提升L…
建站知识
2025/2/20 13:37:15
< OS 有关 > Ubuntu 24 SSH 服务器更换端口 in jp/us VPSs
原因: 两台 VPS 的 ssh 端口一直被密码重试, us 这台已经封了 632, jp 这台两周前清过一次 sqlite3 数据,现在赞到 1008
Fail2Ban 是使用 sqlite3 来记录,数据量大后,硬盘的 I/O 会飙升,我有写过一个 app…
建站知识
2025/2/20 13:36:13
【优先级队列】任务分配
任务分配问题,有n个任务,每个任务有个达到时间。将这些任务分配给m个处理器,进行处理。每个处理器的处理时间不一样。处理器的任务列表有最大任务数限制。 分配任务的策略是:当前待分配的任务的处理时刻最小。如果处理时刻相同&am…
建站知识
2025/2/20 13:35:11
深入探讨 Vue 3 响应式 API:为什么 ref/reactive 需要类型匹配?
一、Vue 3 响应式系统基础
在 Vue 3 的 Composition API 中,ref 和 reactive 是构建响应式数据的核心工具。它们的定位差异源于 JavaScript 语言特性:
ref 设计初衷:处理基础类型(primitive types)的响应式包装react…
建站知识
2025/2/20 13:34:09
Linux下centos系统中使用docker容器中的ollama下载deepseek速度太慢解决办法
以下是使用shell脚本实现的一个示例,该脚本会尝试下载一个名为"deepseek-r1:32b"的模型。通过每隔60秒中断一次下载操作,从何恢复下载速度。亲测有效,其中需要将模型改为你自己要下载的模型
#!/bin/bashwhile true; do# 检查模型是否已下载完…
建站知识
2025/2/25 0:56:15
DeepSeek与ChatGPT:会取代搜索引擎和人工客服的人工智能革命
云边有个稻草人-CSDN博客 在众多创新技术中,DeepSeek和ChatGPT无疑是最为引人注目的。它们通过强大的搜索和对话生成能力,能够改变我们与计算机交互的方式,帮助我们高效地获取信息,增强智能服务。本文将深入探讨这两项技术如何结合…
建站知识
2025/2/20 13:32:06