简单算术表达式求值

参考:http://interactivepython.org/runestone/static/pythonds/BasicDS/InfixPrefixandPostfixExpressions.html

本文主要探讨简单的数学算术表达式求值算法的原理和实现。

1. 约束

本文只是探讨简单的算术表达式的求值算法,为了将主要精力放在算法思想的探讨和实现上,避免陷入对其他不是直接相关的细节的过多思考,所以提前做如下约束:

  • 本文所讨论的算术表达式字符串中每个运算数、运算符之间都有空白符分隔开(方便后面用python字符串的split函数分割处理成列表)。

  • 算术表达式中参与运算的运算数都为1位整数。

  • 表达式中的运算符都为二元运算符(即一个运算符需要两个运算数),不会出现其他元的运算符(如一元运算符负号:-)。

  • 运算的中间结果和最终结果也都为整数,且都不会产生异常(如除数为0等)。

  • 暂且只支持如下几种运算符:+ - \* / ( )

2. 中缀表达式与后缀表达式

算术表达式,根据运算符和运算数的相对位置不同,可以分为三种:前缀表达式(prefix)、中缀表达式(infix)和后缀表达式(postfix),其中后缀表达式又称为逆波兰式,在本文中只讨论中缀和后缀表达式。

  • 中缀表达式:就是我们平时常见的算术表达式,如1 + 2 \* 3( 1 + 2 ) \* 3这样的运算符在运算数中间的表达式,中缀表达式的特点是符合人的理解习惯,并且可以加小括号改变运算的先后顺序。但缺点是如果用编程来求值的话比较困难。

  • 后缀表达式:是将中缀表达式进行变换后得到的表达式,如1 2 3 \* +1 2 + 3 \*这样的运算符在运算数后面的表达式,后缀表达式的特点是虽然不符合人的理解习惯,但编程来求值却很方便,且没有括号的烦恼。

后缀表达式因为不需要括号,所以编程求值起来比较方便,下面将先从如何对后缀表达式求值讲起。

3. 后缀表达式求值

1. 核心算法:

  • 创建一个空栈,名为numstack,用于存放运算数。

  • 用python字符串的split函数将输入的后缀表达式(postfix)分割为列表,将该列表记为input。

  • 从左到右遍历input的每一个元素token:

  • 若token为运算数,将其转换为整数并push进numstack;

  • 若token为运算符,则将numstack pop两次,将第一次pop得到的数作为运算符的右操作数,将第二次pop得到的数作为运算符的左操作数,然后求出运算结果,并将结果push进numstack;

  • 遍历完input后,numstack仅剩下一个元素,这就是表达式的最终求值结果,pop出这个元素,算法结束。

2. 举例

比如求4 5 6 \* +这样一个后缀表达式的值(注:其前缀表达式为:4 + 5 \* 6,值为34),按照上述算法,过程如下:

No. operator numstack
1 4
2 4 5
3 4 5 6
4 * 4 5 6
5 4 30
6 + 4 30
7 34

所以最终的表达式求值结果为:34

3. 代码实现

# 准备工作:创建一个栈类
class Stack():
    def __init__(self):
        self.data = []
    
    def __str__(self):
        return str(self.data)
    
    __repr__ = __str__
    
    def pop(self):
        if len(self.data) != 0:
            return self.data.pop()
        return None
    
    def push(self,e):
        self.data.append(e)
        
    def clear(self):
        del self.data[:]
    
    # 获取栈顶元素,但不弹出此元素
    def peek(self):
        if len(self.data) != 0:
            return self.data[-1]
        return None
    
    # 判断栈是否为空
    def empty(self):
        return len(self.data) == 0
    
# 求值函数
def get_value(num1,op,num2):
    if op == '+':
        return num1 + num2
    elif op == '-':
        return num1 - num2
    elif op == '*':
        return num1 * num2
    elif op == '/':
        return num1 / num2
    else:
        raise ValueError('invalid operator!')
    
# 后缀表达式求值函数
def get_postfix_value(postfix):
    # 1. 创建一个运算数栈
    numstack = Stack()
    
    # 2. 分割postfix
    inPut = postfix.strip().split()  # 注:因为'input'是内置函数名,所以用'inPut';strip函数的作用是去掉字符串的开始和结尾的空白字符
    
    # 3. 遍历inPut
    for token in inPut:
        # 3.1 如果token为运算数
        if token.isdigit():
            numstack.push(int(token))
        # 3.2 如果token是运算符
        else:
            num2 = numstack.pop()
            num1 = numstack.pop()
            numstack.push(get_value(num1,token,num2))
    
    # 4. 输出numstack的最后一个元素
    return numstack.pop()
            
# 后缀表达式
# 注:对应的中缀表达式为:(1+2)*(3+4),运算结果为:21
postfix = '1 2 + 3 4 + *'

print '【Output】'
print get_postfix_value(postfix)
【Output】
21

4. 中缀表达式转后缀表达式

1. 核心算法

  • 创建一个空栈opstack,用于存放运算符,创建一个空列表output用于保存输出结果。

  • 使用python字符串的split函数将输入的中缀表达式(infix)字符串分割成列表并存入input列表中。

  • 从左到右遍历input列表的每个元素token:

  • 若token是运算数,直接append到output中;

  • 若token是运算符,先判断它与opstack栈顶元素的运算优先级(注:小括号的优先级约定为最低),若:token的优先级小于等于栈顶元素优先级,则先从opstack中pop出栈顶元素并append到output,再将token push进opstack;否则直接将token push进opstack;

  • 若token是左括号,直接将其push进opstack;

  • 若token是右括号,依次pop出opstack中的元素并依次append到output,直到遇到左括号,将左括号继续pop出(但不append到output)。

  • 当遍历完成input,将opstack中所有的剩余元素pop出并依次append到output。

  • 将output转换为字符串,即为最终求得的后缀表达式。

2. 举例

比如将(A+B)\*C这样一个中缀表达式转换为后缀表达式(其中A,B,C表示整数),按照上述算法,转换过程如下:

No. opstack output
1 (
2 ( A
3 (+ A
4 (+ A B
5 A B +
6 * A B +
7 * A B + C
8 A B + C *

所以最终求得的后缀表达式为:A B + C *

3. 代码实现

# 准备工作:创建一个栈类
class Stack():
    def __init__(self):
        self.data = []
    
    def __str__(self):
        return str(self.data)
    
    __repr__ = __str__
    
    def pop(self):
        if len(self.data) != 0:
            return self.data.pop()
        return None
    
    def push(self,e):
        self.data.append(e)
        
    def clear(self):
        del self.data[:]
    
    # 获取栈顶元素,但不弹出此元素
    def peek(self):
        if len(self.data) != 0:
            return self.data[-1]
        return None
    
    # 判断栈是否为空
    def empty(self):
        return len(self.data) == 0
    
# 求值函数
def get_value(num1,op,num2):
    if op == '+':
        return num1 + num2
    elif op == '-':
        return num1 - num2
    elif op == '*':
        return num1 * num2
    elif op == '/':
        return num1 / num2
    else:
        raise ValueError('invalid operator!')
        
# 将中缀表达式转换为后缀表达式的函数
def infix2postfix(infix):
    # 1. 创建运算符栈和输出结果列表
    opstack = Stack()
    output = []
    
    # 准备一个运算符优先级字典,其中左小括号的优先级最低
    priority = {'(' : 0,'+' : 3,'-' : 3,'*' : 4,'/' : 4}
    
    # 2. 分割infix
    inPut = infix.strip().split()
    
    # 3. 遍历inPut
    for token in inPut:
        # 3.1 若token是运算数
        if token.isdigit():
            output.append(token)
        # 3.2 若token是运算符
        elif token in ['+','-','*','/']:
            if not opstack.empty() and priority[token] <= priority[opstack.peek()]:
                output.append(opstack.pop())
            opstack.push(token)
        # 3.3 若token是左括号
        elif token == '(':
            opstack.push(token)
        # 3.4 若token是右括号
        elif token == ')':
            while opstack.peek() != '(':
                output.append(opstack.pop())
            # 弹出左括号
            opstack.pop()
        else:
            raise ValueError('invalid token:{0}'.format(token))
    # 4. 将opstack中剩余元素append到output
    while not opstack.empty():
        output.append(opstack.pop())
        
    # 5. 将output转换为字符串(每个元素用空格隔开)并输出
    return ' '.join(output)

infix = '( 1 + 2 ) * ( 3 + 4 )'

print '【Output】'
print infix2postfix(infix)
【Output】
1 2 + 3 4 + *

5. 整理:中缀表达式求值

1. 核心算法

经过前面的讨论,那么现在求中缀表达式的值就很简单了,分为两步:第1步,将中缀表达式转换为对应的后缀表达式;第2步,对后缀表达式求值。

2. 完整代码实现

# 准备工作:创建一个栈类
class Stack():
    def __init__(self):
        self.data = []
    
    def __str__(self):
        return str(self.data)
    
    __repr__ = __str__
    
    def pop(self):
        if len(self.data) != 0:
            return self.data.pop()
        return None
    
    def push(self,e):
        self.data.append(e)
        
    def clear(self):
        del self.data[:]
    
    # 获取栈顶元素,但不弹出此元素
    def peek(self):
        if len(self.data) != 0:
            return self.data[-1]
        return None
    
    # 判断栈是否为空
    def empty(self):
        return len(self.data) == 0
    
# 求值函数
def get_value(num1,op,num2):
    if op == '+':
        return num1 + num2
    elif op == '-':
        return num1 - num2
    elif op == '*':
        return num1 * num2
    elif op == '/':
        return num1 / num2
    else:
        raise ValueError('invalid operator!')

# 将中缀表达式转换为后缀表达式的函数
def infix2postfix(infix):
    # 1. 创建运算符栈和输出结果列表
    opstack = Stack()
    output = []
    
    # 准备一个运算符优先级字典,其中左小括号的优先级最低
    priority = {'(' : 0,'+' : 3,'-' : 3,'*' : 4,'/' : 4}
    
    # 2. 分割infix
    inPut = infix.strip().split()
    
    # 3. 遍历inPut
    for token in inPut:
        # 3.1 若token是运算数
        if token.isdigit():
            output.append(token)
        # 3.2 若token是运算符
        elif token in ['+','-','*','/']:
            if not opstack.empty() and priority[token] <= priority[opstack.peek()]:
                output.append(opstack.pop())
            opstack.push(token)
        # 3.3 若token是左括号
        elif token == '(':
            opstack.push(token)
        # 3.4 若token是右括号
        elif token == ')':
            while opstack.peek() != '(':
                output.append(opstack.pop())
            # 弹出左括号
            opstack.pop()
        else:
            raise ValueError('invalid token:{0}'.format(token))
    # 4. 将opstack中剩余元素append到output
    while not opstack.empty():
        output.append(opstack.pop())
        
    # 5. 将output转换为字符串(每个元素用空格隔开)并输出
    return ' '.join(output)
    
# 后缀表达式求值函数
def get_postfix_value(postfix):
    # 1. 创建一个运算数栈
    numstack = Stack()
    
    # 2. 分割postfix
    inPut = postfix.strip().split()  # 注:因为'input'是内置函数名,所以用'inPut';strip函数的作用是去掉字符串的开始和结尾的空白字符
    
    # 3. 遍历inPut
    for token in inPut:
        # 3.1 如果token为运算数
        if token.isdigit():
            numstack.push(int(token))
        # 3.2 如果token是运算符
        else:
            num2 = numstack.pop()
            num1 = numstack.pop()
            numstack.push(get_value(num1,token,num2))
    
    # 4. 输出numstack的最后一个元素
    return numstack.pop()

# 中缀表达式求值函数
def get_infix_value(infix):
    postfix = infix2postfix(infix)
    return get_postfix_value(postfix)

infix = '( 1 + 2 ) * ( 3 + 4 )'

print '【Output】'
print get_infix_value(infix)
【Output】
21

你可能感兴趣的:(简单算术表达式求值)