相关文章
DeepSeek技术架构解析:MLA多头潜在注意力
一、前言
我们上一篇已经讲了 DeepSeek技术架构解析:MoE混合专家模型
这一篇我们来说一说DeepSeek的创新之一:MLA多头潜在注意力。
MLA主要通过优化KV-cache来减少显存占用,从而提升推理性能。我们知道这个结论之前,老周带大家…
建站知识
2025/5/1 7:03:01
Clion刷题攻略-配置Cmake
使用Clion刷题,在一个项目中创建多个main函数,每一个文件对应一道题目,将Clion作为题目管理系统使用,并且cpp文件允许使用中文名,exe文件统一输出到runtime目录,防止污染根目录,CmakeLists文件如…
建站知识
2025/5/1 1:10:41
通用目标检测技术选型分析报告--截止2025年4月
前言
本文撰写了一份关于通用目标检测(General Object Detection)的技术选型分析报告,覆盖2000至2025年技术演进历程,重点纳入YOLO-World、RT-DETR、Grounding DINO等2024-2025年的最新模型。
报告将包括技术定义、行业现状、技…
建站知识
2025/5/1 2:04:00
数据结构之约瑟夫环的问题
约瑟夫环(Josephus problem)是一个经典的数学问题,其大意是:N 个人围成一圈,每次数到第 M 个人被淘汰,直到最后剩下一个人。该问题在计算机科学、密码学等领域有广泛应用,例如进程调度、游戏规则…
建站知识
2025/5/1 5:44:35
Docker学习--容器操作相关命令--docker top 命令
docker top 命令的作用: 用于显示指定容器中的正在运行的进程。类似于 Linux 中的 top 或 ps 命令,它帮助用户查看容器内的进程信息,便于监控和调试容器内的活动。
语法: docker top [参数选项] CONTAINER(要操作的容…
建站知识
2025/5/1 6:27:58
贪心算法(14)(java)无重叠区间
题目:给定一个区间的集合 intervals ,其中 intervals[i] [starti, endi] 。返回 需要移除区间的最小数量,使剩余区间互不重叠 。
注意 只在一点上接触的区间是 不重叠的。例如 [1, 2] 和 [2, 3] 是不重叠的。 示例 1:
输入: intervals [[…
建站知识
2025/5/1 6:26:31
猜密码 - 华为OD机试真题(A卷、JavaScript)
题目描述
小杨申请了一个保密柜,但是他忘记了密码。只记得密码都是数字,而且所有数字都是不重复的。
请你根据他记住的数字范围和密码的最小数字数量,帮他算下有哪些可能的组合,规则如下:
输出的组合都是从可选的数…
建站知识
2025/5/1 6:29:12
哈夫曼编码(Huffman Code)← 百度 AI
【算法代码】 此代码由百度 AI 生成,仅供学习参考。
#include <bits/stdc.h>
using namespace std;// 哈夫曼树节点结构体
struct HuffmanNode {char data; // 字符int freq; // 频率HuffmanNode *left; // 左子节点HuffmanNode *right;…
建站知识
2025/5/1 6:07:39