相关文章
LLMs 损失函数篇
LLMs 损失函数篇 一、介绍一下 KL 散度
KL(Kullback-Leibler)散度衡量了两个概率分布之间的差异。公式为: D K L ( P ∥ Q ) ∑ P ( x ) log P ( x ) Q ( x ) D_{KL}(P \| Q) \sum P(x) \log \frac{P(x)}{Q(x)} DKL(P∥Q)∑P(x)logQ…
建站知识
2024/11/17 10:34:23
【golang-技巧】-线上死锁问题排查-by pprof
1.背景
由于目前项目使用 cgo golang 本地不能debug, 发生死锁问题,程序运行和期待不一致,通过日志排查可以大概率找到 阻塞范围,但是不能找到具体问题在哪里,同时服务器 通过k8s daemonset 部署没有更好的方式暴露端口 获取ppr…
建站知识
2024/11/17 10:33:21
【Linux】Github 仓库克隆速度慢/无法克隆的一种解决方法,利用 Gitee 克隆 Github 仓库
Github 经常由于 DNS 域名污染以及其他因素克隆不顺利。
一种办法是修改 hosts
sudo gedit /etc/hosts加上一行
XXX.XXX.XXX.XXX github.comXXX 位置的 IP 可以通过网站查询
IP/服务器github.com的信息-站长工具
这种方法比较适合本身可以克隆,但是速度很慢的…
建站知识
2024/11/17 10:32:21
【NOIP提高组】计算系数
【NOIP提高组】计算系数 C语言实现C实现Java实现Python实现 💐The Begin💐点点关注,收藏不迷路💐 给定一个多项式 (ax by)^k ,请求出多项式展开后 x^n y^m 项的系数。
输入
共一行,包含 5 个整数&#x…
建站知识
2024/11/17 10:31:20
TCP Analysis Flags 之 TCP Dup ACK
前言
默认情况下,Wireshark 的 TCP 解析器会跟踪每个 TCP 会话的状态,并在检测到问题或潜在问题时提供额外的信息。在第一次打开捕获文件时,会对每个 TCP 数据包进行一次分析,数据包按照它们在数据包列表中出现的顺序进行处理。可…
建站知识
2024/11/17 10:29:18
docker:docker: Get https://registry-1.docker.io/v2/: net/http: request canceled
无数次的拉镜像让人崩溃:
rootnode11:~/ragflow/docker# more rag.sh
#export HTTP_PROXYhttp://192.168.207.127:7890
#export HTTPS_PROXYhttp://192.168.207.127:7890
#export NO_PROXYlocalhost,127.0.0.1,.aliyun.com
docker compose -f docker-compose-gpu-C…
建站知识
2024/11/17 10:28:17
GRE做题笔记(零散的个人经验)
locomotive机车By 1813, the Luddite resistance had all but vanished. all but表示“几乎完全”的程度,或者表示排除piston活塞attributed to 归因于how a sportsperson accounted for their own experience of stress 运动员如何解释自己的压力经历 ,…
建站知识
2024/11/17 10:27:15