强化学习-马尔科夫决策过程(MDP)
强化学习-马尔科夫决策过程(MDP) 1、强化学习介绍 强化学习任务通常使用马尔科夫决策过程(Markov Decision Process,简称MDP)来描述,具体而言:机器处在一个环境中,每个状态为机器对当前环境的感知;机器只能通过动作来影响环境,当机器执行一个动作后,会使得环境按某种概率转移到另一个状态;同时,环境会根据潜在的奖励函数反馈给机器一个奖赏。综合而言,强化学习主要包含四个要素:状态、动作、转移概率以及奖赏函数。 根据上图,agent(智能体)在进行某个任务时,首先与environment进行交互,产生新的状态state,同时环境给出奖励reward,如此循环下去,agent和environment不断交互产生更多新的数据。强化学习算法就是通过一系列动作策略与环境交互,产生新的数据,再利用新的数据去修改自身的动作策略,经过数次迭代后,agent就会学习到完成任务所需要的动作策略。 2、马尔科夫决策过程(Markov...
eNSP使用
eNSP使用 1. 基本概念 1.VRP概念:通用路由平台,华为公司数据通信产品的通用网络操作系统平台,拥有一致的网络界面、用户界面和管理界面。 2.VRP作用:通过命令行对设备下发各种命令实现对设备的配置和日常维护操作。 3.命令行接口(CLI):用户登录到路由器后出现命令行提示符,是用户与路由器进行交互的常用工具。 什么是WAN口: 广域网接口,连接猫或光猫、入户光纤宽带等外部网络; 什么事LAN口: 本地网接口,连接台式电脑、笔记本,电视机、交换机等内部网络,将一根网线一端连接任意一个LAN口,一端连接自己家里需要联网的设备; 为什么需要VLAN 早期以太网是一种基于CSMA/CD(Carrier Sense Multiple Access/Collision...
Deeplearning4j深度学习框架使用
Deeplearning4j深度学习框架使用
对数函数相关内容
对数函数相关内容 基本知识: loga(1)=0;log_a(1) = 0;loga(1)=0; loga(a)=1;log_a(a)=1;loga(a)=1; logab∗logba=1;log_ab*log_ba =1;logab∗logba=1; 对数运算法则 1、两个正数的积的对数,等于同一底数的这两个数的对数的和,即: loga(mn)=logam+loganlog_a(mn)=log_am+log_anloga(mn)=logam+logan 2、两个正数商的对数,等于同一底数的被除数的对数减去除数对数的差,即: loga(mn)=logam−loganlog_a({m\over n})=log_am-log_anloga(nm)=logam−logan 3、一个正数幂的对数,等于幂的底数的对数乘以幂的指数,即: logamn=nlogamlog_am^n =...
快读快输模板
快读快输 Java快输模板: 123456789101112131415static class Reader{ static BufferedReader reader = new BufferedReader(new InputStreamReader(System.in)); static StringTokenizer tokenizer = new StringTokenizer(""); public static String next() throws IOException { while(!tokenizer.hasMoreTokens()) { tokenizer = new StringTokenizer(reader.readLine()); } return tokenizer.nextToken(); } public static int nextInt() throws NumberFormatException, IOException { return...
链式向前星
链式向前星 说明: 如果说邻接表是不好写但效率好,邻接矩阵是好写但效率低的话,前向星就是一个相对中庸的数据结构。前向星固然好写,但效率并不高。而在优化为链式前向星后,效率也得到了较大的提升。虽然说,世界上对链式前向星的使用并不是很广泛,但在不愿意写复杂的邻接表的情况下,链式前向星也是一个很优秀的数据结构。 我们先展示代码再做具体讲解,链式向前星的结构模板代码如下: 123456789struct Edge{ //表示边 int w;int to; int next;}edge[10005]; int cnt=0; //用以控制并统计边的数量 int head[10005]; ...
Git相关操作
理解工作区和暂存区的区别? 工作区:就是你在电脑上看到的目录,比如目录下testgit里的文件(.git隐藏目录版本库除外)。或者以后需要再新建的目录文件等等都属于工作区范畴。 版本库(Repository):工作区有一个隐藏目录.git,这个不属于工作区,这是版本库。其中版本库里面存了很多东西,其中最重要的就是stage(暂存区),还有Git为我们自动创建了第一个分支master,以及指向master的一个指针HEAD。 使用Git提交文件到版本库有两步: 第一步:是使用 git add 把文件添加进去,实际上就是把文件添加到暂存区。 第二步:使用git commit提交更改,实际上就是把暂存区的所有内容提交到当前分支上。 常用指令 设置git用户名和邮箱标识 1git config --global user.name "用户名" 1git config --global user.email "你所想绑定的邮箱" 查看当前git用户信息 12git config user.name #查看用户名称 git config user.email...
Native-image技术与应用
Native-image技术与应用 1. 背景相关 作为一个程序员,总是会在工作的时候开发一些方便自己工作的程序,但是作为一个Java程序员,给自己或者朋友开发的办公小程序总是使用一个Jar包并不是一个很好的体验,主要是: 启动不方便 需要Java环境 有时候打出来的Jar比较大,不便于分享传输 但是现在有了GraalVM,让这些都不是问题了,直接生成可执行程序,丢哪哪就能用 2. GraalVM GraalVM是一款高性能的虚拟机,它能够直接将Java程序编译成本地可执行文件,可以在不安装JVM的情况下运行程序。当然了它的特性远不止这些,比如支持多语言,更低的内存占用等等,但这些并不是这篇博客所涉及的,有兴趣可以去他们的官网里了解一下。 3.安装GraalVM JDK 下载界面:https://github.com/graalvm/graalvm-ce-builds/releases/tag/vm-22.3.1 这里用到的是Java...
实验室培训指南
...
差分
...











