相关文章
强化学习数学基础学习(三)
前言
这次是蒙特卡洛方法
正文
蒙特卡洛方法(Monte Carlo,MC)
在强化学习(Reinforcement Learning, RL)中,蒙特卡洛方法是一类基于采样的学习方法,主要用于解决那些状态空间或动作空间过大,以至于无法使…
建站知识
2024/11/25 13:10:21
从0开始深度学习(17)——数值稳定性和模型初始化
在每次训练之前,都会对模型的参数进行初始化,初始化方案的选择在神经网络学习中起着举足轻重的作用, 它对保持数值稳定性至关重要。 我们选择哪个函数以及如何初始化参数可以决定优化算法收敛的速度有多快。 糟糕选择可能会导致我们在训练时遇…
建站知识
2024/11/24 2:21:24
Linux下的常见指令以及权限
一.常见的指令
1.ls指令
语法:ls[选项][目录或文件]
功能:对于目录,该命令列出该目录下的所有子目录与文件,对于文件,将列出文件名以及其他信息。
常用选项:
1.-a 列出目录下的所有文件,包…
建站知识
2024/11/24 2:21:24
Windows 和 Linux 下常用命令(待更新)
Windows PowerShell 命令
1. 获取命令帮助信息
Get-Help [命令]2. 解决 Windows 平台下由于 “你需要权限才能执行此操作” 导致的文件夹删除失败
rm [需要删除的文件或文件夹] -Recurse -ForceLinux 命令
1. grep 使用正则表达式匹配字符串
grep -o -P [PATTERNS] [FILES…
建站知识
2024/11/25 13:12:03
Jmeter实际应用
环境准备
JDK1.8Jmeter 5.6.3 下载地址Jmeter 插件 下载地址 放到lib/ext下
常用命令
# 启动
sh jmeter# 集群模式下启动节点,不启动用不了集群
sh jmeter-server#生成ssl需要的证书, 这里会要求输入个密码,是要在jmeter中用的
keytool -import -ali…
建站知识
2024/11/24 2:38:23
探索面向对象的高级特性与设计模式(2/5)
目录
1. 面向对象的原则(SOLID)
示例代码:单一职责原则
2. 泛型的高级用法与类型擦除
示例代码:边界限定的泛型
3. 接口与抽象类的区别
示例代码:接口与抽象类
4. 设计模式的应用与实现
4.1 工厂模式ÿ…
建站知识
2024/11/24 2:38:27
【计网】UDP Echo Server与Client实战:从零开始构建简单通信回显程序
目录
前言:
1.实现udpserver类
1.1.创建udp socket 套接字 --- 必须要做的
socket()讲解
代码实现:编辑
代码讲解:
1.2.填充sockaddr_in结构
代码实现:
代码解析:
1.3.bind sockfd和…
建站知识
2024/11/24 2:38:24
DEVOPS: 容器与虚拟化与云原生
概述
传统虚拟机,利用 hypervisor,模拟出独立的硬件和系统,在此之上创建应用虚拟机是一个主机模拟出多个主机虚拟机需要先拥有独立的系统docker 是把应用及配套环境独立打包成一个单位docker 是在主机系统中建立多个应用及配套环境docker 是…
建站知识
2024/11/24 2:38:24