相关文章
ollama docker设置模型常驻显存
参考: https://github.com/ollama/ollama/issues/5272 https://deepseek.csdn.net/67cfd7c93b685529b708fdee.html
通过-e传入环境变量,ollama运行: docker run -d --gpusall -e OLLAMA_KEEP_ALIVE-1 -v ollama:/root/.ollama -p 11434:114…
建站知识
2025/3/26 1:28:03
英伟达:LLM两阶段KV缓存压缩
📖标题:RocketKV: Accelerating Long-Context LLM Inference via Two-Stage KV Cache Compression 🌐来源:arXiv, 2502.14051
🌟摘要
🔸基于Transformer的大型语言模型在解码阶段严重依赖于KV缓存来有效地…
建站知识
2025/3/26 6:33:45
Rust Tokio 和 Node.js 异步的相似之处
Rust Tokio 和 Node.js 异步的相似之处
Tokio 和 Node.js 都是基于异步编程模型的框架,旨在提高 I/O 密集型应用的性能。它们都利用了事件驱动和非阻塞 I/O 来实现高效的并发处理。以下是它们的一些相似之处:
事件驱动:两者都使用事件循环来…
建站知识
2025/3/25 18:29:29
高频SQL 50 题(持续更新)
SQL的编写与运用
0. 写在前面
最近学习了数据库系统概论,其中涉及到了关于SQL语句的编写,感觉理论知识不足以让我掌握相关的编写方式,因此选择刷力扣上的题目进行复习巩固。
时间不是很多,可能不会经常更新,有时间写…
建站知识
2025/3/25 20:07:14
k8s 配置两个deployment主机级别互斥部署
在 Kubernetes 中,要实现两个 Deployment 的 Pod 在主机级别互斥部署,可以使用 podAntiAffinity 配置。通过设置 podAntiAffinity,可以确保两个 Deployment 的 Pod 不会被调度到同一节点上。
实现步骤
定义 Deployment:
为每个…
建站知识
2025/3/25 5:07:41
Linux 安全与存储管理指南
1. SELinux 如何保护资源?
SELinux(安全增强型 Linux) 是系统的“超级保安”,通过以下方式保护资源: 强制访问控制(MAC):为每个进程、文件、端口等分配唯一“标签”(上下…
建站知识
2025/3/25 9:57:57
使用码云搭建CocoaPods远程私有库
一、创建远程私有索引库 用来存放私有框架的详细描述信息.podspec文件 1. 创建私有库
假设码云上创建的私有库为repo-spec
2. 查看本地已存在的索引库
pod repo list 3. 将远程私有索引库添加到本地
pod repo add [https://gitee.com/jingluoguo/repo-spec.git](https://gi…
建站知识
2025/3/24 7:04:08
卷积神经网络 - 汇聚层
卷积神经网络一般由卷积层、汇聚层和全连接层构成,本文我们来学习汇聚层。
汇聚层(Pooling Layer)也叫子采样层(Subsampling Layer),其作用是进 行特征选择,降低特征数量,从而减少参数数量。
卷积层虽然可以显著减少网络中连接的…
建站知识
2025/3/25 5:37:30