形式语义05 Semantics

less than 1 minute read

Published: November 07, 2021

\newcommand\norm[1]{\left\lVert#1\right\rVert} \newcommand\abs[1]{\left\lvert#1\right\rvert}

Formal Semantic

一般分三种

Operational Semantic，操作语义
Denotational Semantic，指称语义
Axiomatic Semantic，公理语义

主要记一下操作语义

Operational Semantic

对命令式语言而言，一个程序的运行状态可以用状态$\times$当前语句地址二元组确定，那么就可以用 $\left<c,\sigma\right>$ 描述一个执行状况，表示接下来要执行 $c$，目前的状态为 $\sigma$

状态一般指的是 $\text{Value}^\text{Var}$ 的函数，这里规定 $\text{Var}$ 表示变量的集合，$\text{Value}$ 表示值（常量）的集合。注意这里的集合内都是符号，与语义无关。例如我们说$23456$是一个值，但它的具体含义是什么在这里并不关心。具体给值的符号赋予含义的操作，一般由另外的函数进行，例如说 $\text{Meaning}:\text{Value}\mapsto \mathbb N$ 就是一个给所有Integer Tokens赋予具体整数含义的映射

操作语义一般分为大步语义（$\Downarrow$Big-Step）和小步语义（$\rightarrow$Small-Step），分别用于不同目的的研究。一般操作语义要依靠语法结构进行，即它是Syntax Directed的。因此有时候也叫做SOS（Structural Operational Semantics）

通常讲语义会基于一个具体的语言给一些例子，建议直接找PLDI和POPL的形式语义论文看

Evaluation

\begin{aligned}

\frac{\left<x,\sigma\right>\rightarrow\left<{\rm{n_1} },\sigma’\right>}{\left<x+y,\sigma\right>\rightarrow\left<{\rm{n_1} }+y,\sigma’\right>}

\frac{\left<y,\sigma’\right>\rightarrow \left<{\rm{n_2} },\sigma’‘\right>}{\left<{\rm{n_1} }+y,\sigma’\right>\rightarrow\left<{\rm n_1+n_2},\sigma’‘\right>}

\frac{x\in\text{Var} }{\left<x,\sigma\right>\rightarrow\left<\sigma(x),\sigma\right>}

\frac{\text{Meaning}({\rm n_1})+\text{Meaning}({\rm n_2})=\text{Meaning}({\rm n_3})}{\left<{\rm n_1+n_2},\sigma\right>\rightarrow\left<{\rm n_3},\sigma\right>}

\end{aligned}

注意这里$\text{Meaning}$映射后的加法实际上是正整数的加法，而二元组中的$+$仅作为符号，具体含义由$\text{Meaning}$决定

以求值为例，来展示一下小步语义的特点

给出的求值语义有一些比较好的性质：

可以看到上面给出的求值语义是确定的(Deterministic)，这并不是所有语言必备的
并且我们对代码、状态二元组的推导只能通过每次寻找当前语句的结构中，最左的可推导的句子，这也不是所有语言必备的；

到这里就可以发现一些情况了。所谓的形式语义无非是刻画某些东西性质的一类工具，具体只能作为解决问题的帮手，而本身只起到一种规范的作用，也就是Reference Manual了。并且这种语义是建立在数学符号上的，可以与具体的实现无关（当然也可以有关，但这并不是我们希望的），可以非常容易地进行推理

对于上面给出的例子，可以用写表达式求值辅助：对于给定的表达式二叉树（why 二叉？），我们规定必须先算左子树，再算右子树。如果遇到了变量，就替换为它在环境中的值；如果遇到了常量+常量，就把token转化为整数，计算之后再变回token。

到这里就又可以发现一些事情。操作语义几乎就是在模拟一个具体的算法、一个抽象计算机上编程语言的执行过程、一个解释执行的解释器。反过来，有了操作语义，我们也可以以此指导编译器、解释器的实现，规范具体细节。

这有什么用？用JYY的话说，我们就可以用一个甚至还没有被实现的语言来编写程序、模拟执行，并且预测这些程序的结果、证明它的细节了。这是多酷的一件事情！

While

\begin{aligned}

\frac{[![exp]!]\sigma=\textbf{true} }{\left<{\textbf{while} }\;exp\;\textbf{do}\;stmt,\sigma\right>\rightarrow\left<stmt\textbf;\;\textbf{while}\;exp\;\textbf{do}\;stmt,\sigma\right>}

\frac{[![exp]!]\sigma=\textbf{false} }{\left<{\textbf{while} }\;exp\;\textbf{do}\;stmt,\sigma\right>\rightarrow\left<\textbf{skip},\sigma\right>}

\frac{\left<stmt_1,\sigma\right>\rightarrow \left<stmt_1’,\sigma’\right>}{\left<stmt_1\textbf;\;stmt_2,\sigma\right>\rightarrow\left<stmt_1’\textbf;\;stmt_2,\sigma’\right>}

\frac{}{\left<\textbf{skip;}\;stmt,\sigma\right>\rightarrow\left<stmt,\sigma\right>}

\frac{}{\left<\textbf{skip},\sigma\right>\rightarrow\left<\textbf{skip},\sigma\right>}

\end{aligned}

这里主要想讲 $[![exp]!]\sigma$ 这个符号的用法。这里表示在环境 $\sigma$ 下，表达式求出的值是什么。其具体含义与操作语义的求值相同，但是注意到操作语义在执行的过程中会丢失表达式的结构信息（我们在一步步化简），因此通常需要把求值和化简分开，这里表现为用单独的函数表示求值操作，以此简化$\textbf{while}\;\ldots\;\textbf{do}$ 的操作语义规则，否则我们得这么写：

\begin{aligned}

\frac{}{\left<{\textbf{while} }\;exp\;\textbf{do}\;stmt,\sigma\right>\rightarrow\left<\textbf{if}\;exp\;\textbf{then}\;(stmt\textbf;\;\textbf{while}\;exp\;\textbf{do}\;stmt)\;\textbf{else}\;\textbf{skip},\sigma\right>}

\end{aligned}

Evaluation Context

人总喜欢偷懒，观察到上面的操作语义其实在做很重复的事情：

我们写一堆加法的rules，然后获得了加法操作
再写一堆乘法的rules
再写一堆减法的rules
再写一堆二元运算的rules….

可以发现，既然这些都是二元运算，那么能不能给所有的二元运算定义一次求值顺序（e.g. 最左推导、确定性blabla），然后只需要根据不同情况带入具体算符就可以了？

这就是所谓的Evaluation Context了

仍然以Evaluation为例，可以规定

\begin{aligned}

{\cal E}:=[\;]{\,\Big	\,}{\cal E}+exp{\,\Big	\,}{\rm n}+{\cal E}{\,\Big
	\,}{\cal E}-exp{\,\Big	\,}{\rm n}-{\cal E}

\end{aligned}

这里我们称 $\cal E$ 为Evaluation Context，对于带入其中的项 $r$ 称为Redex

那么我们只需要如下几条rules，就足够表达出带有加减法的表达式求值语法：

\begin{aligned}

\frac{\text{Meaning}({\rm n_1})+\text{Meaning}({\rm n_2})=\text{Meaning}({\rm n_3})}{\left<{\rm n_1+n_2},\sigma\right>\rightarrow\left<{\rm n_3},\sigma\right>}

\frac{\text{Meaning}({\rm n_1})-\text{Meaning}({\rm n_2})=\text{Meaning}({\rm n_3})}{\left<{\rm n_1-n_2},\sigma\right>\rightarrow\left<{\rm n_3},\sigma\right>}

\frac{\left<s,\sigma\right>\rightarrow \left<t,\sigma\right>}{\left<{\cal E}[s],\sigma\right>\rightarrow\left<{\cal E}[t],\sigma’\right>}

\end{aligned}

Share on

Bluesky Facebook LinkedIn Mastodon X (formerly Twitter)

Jinpeng Wang (王锦朋)

形式语义05 Semantics

Formal Semantic

Operational Semantic

Evaluation

While

Evaluation Context

Share on

You May Also Enjoy

Jane Street 挂经

如何投稿一篇论文

JVM exception handlers

我是如何成为TA的

唠嗑