本文隶属于AVR单片机教程系列。
在第一期中,我们已经开始使用UART来实现单片机开发板与计算机之间的通信,但只是简单地讲了讲一些概念和库函数的使用。在这一篇教程中,我们将从硬件与软件等各方面更深入地了解UART。
USART组件
一直在讲的UART其实是USART组件的一部分,USART比UART多了同步的一部分,但这一部分用得太少(我从来没用过),而且缺乏实例,所以就略过了。然而,单片机的设计者很机智地把这个鸡肋功能升华了一下,USART组件可以支持SPI模式。SPI是一种同步串行总线,可以支持很高的传输速率。这个功能使得ATmega324PA支持最多3个SPI通道,其中一个是纯SPI,另两个就是SPI模式下的USART。我们将在下一讲中揭开SPI的神秘面纱。
回到UART模式下的USART组件。开发板引出的RX
和TX
引脚是属于USART0组件的,因此使用时以下n
都用0
代替。
UART共有5个寄存器:
-
UDRn
是收发数据寄存器,收(RXB
)和发(TXB
)使用不同的寄存器,但都通过UDRn
来访问。向TXB
写入一个字节,UART就开始发送;RXB
保存接收到的数据,带有额外一个字节的缓冲(如同下一节要讲的缓冲区)。 -
UCSRnA
包含UART状态位,如三个中断对应的标志,以及一些不常用的设置位。 -
UCSRnB
主要用于使能,包括收发器与三个中断的使能位,以及9位帧格式相关的位。 -
UCSRnC
是最主要的控制寄存器,可以配置USART的模式与格式。 -
UBRRnL
和UBRRnH
(可以通过UBRRn
来访问这个16位寄存器)用于设定波特率,在异步模式下,(BAUD = frac {f_{CPU}} {16(UBRRn + 1)})。
UART支持三个中断,分别是接收完成(RX
)、数据寄存器空(UDRE
)、发送完成(TX
)。第一个用于接收,后两个用于发送,一般使用UDRE
。
RX
中断允许程序在任何时刻及时地接收并处理总线上发来的数据。沿用串口接收一讲中的例子:
#include <avr/io.h>
#include <avr/interrupt.h>
#include <ee1/led.h>
int main(void)
{
led_init();
PORTD |= 1 << 0; // RXD0 pull-up
UCSR0B = 1 << RXCIE0 // RX interrupt
| 1 << RXEN0 // RX enabled
| 1 << TXEN0; // TX enabled
UCSR0C = 0b00 << UMSEL00 // asynchronous USART
| 0b10 << UPM00 // even parity
| 0 << USBS0 // 1 stop bit
| 0b11 << UCSZ00; // 8-bit
UBRR0L = 40; // 38400bps
sei();
while (1)
;
}
ISR(USART0_RX_vect)
{
static const char led_char[4] = {'r', 'y', 'g', 'b'};
static uint8_t which = 4;
uint8_t byte = UDR0;
bool matched = false;
for (uint8_t i = 0; i != 4; ++i)
if (byte == led_char[i])
{
matched = true;
which = i;
break;
}
if (!matched && (byte == '0' || byte == '1'))
{
matched = true;
if (which < 4)
led_set(which, byte - '0');
which = 4;
}
if (!matched)
which = 4;
}
TX
与UDRE
中断允许程序在总线发送数据同时执行其他代码。比如,在打印ASCII表的同时控制LED闪烁。
#include <avr/io.h>
#include <avr/interrupt.h>
#include <ee1/led.h>
#include <ee1/delay.h>
int main(void)
{
led_init();
UCSR0B = 1 << UDRIE0 // UDRE interrupt
| 1 << TXEN0; // TX only
UCSR0C = 0b00 << UMSEL00 // asynchronous USART
| 0b10 << UPM00 // even parity
| 0 << USBS0 // 1 stop bit
| 0b11 << UCSZ00; // 8-bit
UBRR0L = 40; // 38400bps
sei();
while (1)
{
led_on();
delay(500);
led_off();
delay(500);
}
}
ISR(USART0_UDRE_vect)
{
static char c = 0x21;
UDR0 = c;
if (++c == 0x7F)
c = 0x21;
}
你看,不用定时器,只需总线中断与老套的main
结合即可。
值得一提的是UDRE
中断的设计特别人性化——UDREn
的复位值是1
,程序可以把所有数据都放在中断中,控制部分只需开关中断——而SPI和I²C组件都没有这个特性。至于它到底带来多少好处,只有在码的过程中体会了。
缓冲区
如果你较真一点,就会觉得上面这个程序很烂:
-
把硬件驱动(UART配置与中断)与业务逻辑(要输出的内容)紧紧地连接在一起(专业点讲,叫“紧耦合”),不符合可复用性等一系列设计原则;
-
ASCII表是十分有规律的,而大多数程序的输出则不然,需要
UDRE
中断以外的代码来决定要输出什么字符串,仅中断并不能解放常规的输出。其实我们还遇到过其他问题:
-
相比25MHz的CPU频率,UART的38400波特率是很慢的,传输一个字节的时间可以让CPU执行几千条指令,但
uart_print_string
等函数的策略都是等待UART把数据发送完成才返回,是阻塞的; -
uart_scan_string
等函数要求程序乖乖地等待总线上的数据到来,不能错过,这使程序不能在等待的同时做其他事; -
以上两点相结合更让人尴尬——在发送的同时接收到的数据会被错过,怎么还能叫全双工总线呢?
这输入和输出两方面的问题可以用一种高度对称的手段来解决,它就是缓冲区。缓冲区是这样一种结构,它存放着一串字符,来自于程序的输出或UART的接收,并可以按顺序取出,用于UART的发送或程序的输入。显然,这需要用到中断:在RX
中断中,向缓冲区中放入接收到的数据;在UDRE
中断中,如果缓冲区中有数据,则取出并发送之。
于是,当程序需要输入时,可以从缓冲区中取一些字符,并解析成整数等类型,如果缓冲区为空,则等待输入,与C语言标准输入scanf
很类似;当程序需要输出时,可以直接把字符串写到缓冲区中,让中断来逐字节发送,而主程序可以无需等待,直接继续工作,这种输出是异步的。这个“异步”与UART总线的“异步”是不同的概念。关于阻塞、异步等概念,可参考:怎样理解阻塞非阻塞与同步异步的区别?
但是现在“缓冲区”还只是一个抽象概念,我们要把它落实成代码。如何实现一个缓冲区呢?
我们先把缓冲区想象成一个管道,有头和尾两端,我们需要从尾部放入球,从头部取出。这种数据结构称为队列。
队列可以用链表来实现,好处是队列的长度没有限制,除非内存耗尽。但是在我们的应用场景中,链表节点中有效的数据是一个字节,却还需要两个字节来存放一个指针,不太划算。并且,malloc
函数是比较耗时的,应避免频繁调用。
我们使用一种叫作“循环队列”的实现。循环队列是一个数组,保存两个下标,分别指向头和尾(由于我主要写C++,我习惯用尾后)。循环体现在,假如队列的大小是64,那么下标为63的元素的后一个就是下标为0的元素。如果把普通数组想象成一个矩形,那么循环队列就是一个圆环。
初始时,头和尾下标相同。向尾部放入一个字节,就是在尾下标处写数据,并让尾下标指向下一个元素;取出一个字节,就是读取头下标处的数据,并让头下标指向下一个元素。当两个下标相等时,队列为空;当尾的后一个等于头时,队列满——可是明明这时只放了63个元素,为什么不再放一个呢?因为会与队列空的情况冲突,无法分辨,为了省事,还是浪费一个字节吧。
下面这段代码需要你认真阅读并理解,但是请先忽略volatile
和ATOMIC_BLOCK(ATOMIC_FORCEON)
,当它们不存在就可以了。你也可以参考一些循环队列相关的资料来更好地理解这种结构(本来我想写的,但这篇已经很长了)。
#include <stdint.h>
#include <stdbool.h>
#include <avr/io.h>
#include <avr/interrupt.h>
#include <util/atomic.h>
#define UART_TX_BUFFER_SIZE 64
#define UART_TX_BUFFER_MASK (UART_TX_BUFFER_SIZE - 1)
volatile char uart_tx_buffer[UART_TX_BUFFER_SIZE];
volatile uint8_t uart_tx_head = 0;
volatile uint8_t uart_tx_tail = 0;
void uart_init_buffered()
{
UCSR0B = 0 << UDRIE0 // UDRE interrupt disabled
| 1 << TXEN0; // TX only
UCSR0C = 0b00 << UMSEL00 // asynchronous USART
| 0b10 << UPM00 // even parity
| 0 << USBS0 // 1 stop bit
| 0b11 << UCSZ00; // 8-bit
UBRR0L = 40; // 38400bps
}
void uart_print_char_buffered(char c)
{
bool full = true;
while (1)
{
ATOMIC_BLOCK(ATOMIC_FORCEON)
{
if (((uart_tx_tail + 1) & UART_TX_BUFFER_MASK) // 0->1, ..., 63->0
!= uart_tx_head)
full = false;
}
if (!full)
break; // if full, wait until buffer is not full
}
ATOMIC_BLOCK(ATOMIC_FORCEON)
{
if (uart_tx_head == uart_tx_tail)
UCSR0B |= 1 << UDRIE0;
uart_tx_buffer[uart_tx_tail] = c;
uart_tx_tail = (uart_tx_tail + 1) & UART_TX_BUFFER_MASK;
}
}
ISR(USART0_UDRE_vect)
{
UDR0 = uart_tx_buffer[uart_tx_head];
uart_tx_head = (uart_tx_head + 1) & UART_TX_BUFFER_MASK;
if (uart_tx_head == uart_tx_tail)
UCSR0B &= ~(1 << UDRIE0);
}
看到这里我默认你已经理解了循环数组,下面来看这些被忽略的语句。声明为volatile
的变量一定会被放在内存中而不是通用寄存器中;ATOMIC_BLOCK
的功能是,后面的大括号中的语句是原子的,在执行时不会被中断;ATOMIC_FORCEON
会在执行完后把全局中断打开。
相信你一定对这种代码感到不适,为什么需要这么麻烦呢?以if (uart_tx_head == uart_tx_tail)
这一句为例,这句语句通常由主程序执行。
-
假设执行到这一句前时
uart_tx_head
为41
,uart_tx_tail
为42
,即缓冲区中还有1
字节没有发送。 -
程序读取
uart_tx_head
,其值为41
。 -
在读取
uart_tx_tail
之前,USART0_UDRE_vect
中断触发了,在中断中最后一个字节被发送,uart_tx_head
被修改为42
,UDRIE0
被写0
,关掉了这个中断,随后中断退出。 -
程序读取
uart_tx_tail
,其值为42
,两者不相等,UDRIE0
不会被写1
,中断保持关闭状态。 -
缓冲区中被写了一个字节,
uart_tx_tail
变为43
。缓冲区明明非空,UDRE
中断却没有开,这个字节无法发送。
这样分析很累,我写的时候并没有认真分析不加原子操作可能带来的问题,而是遵循这样的原则:对于非中断与中断的代码共享的数据,在非中断代码中一定要加原子,在中断代码中,如果在使用这些数据时全局中断可能处于打开状态,则也需要加原子。
现在我们实现了串口输出缓冲区,输入缓冲区的原理类似,留作作业。我们还需要关注几个问题:
-
串口输出是连续的字符流。“连续”是指不存在发送几个字节,停顿一下,再继续发送的情况;“字符流”是指发送的数据都是字符。在字符流的假设下,如果需要可以断开的输出,可以通过用