定点运算和浮点运算_C2000浮点运算注意事项——CPU和CLA的差异及误差处 ...--688IT编程网

定点运算和浮点运算_C2000浮点运算注意事项——CPU和

CLA的差异及误差处理技巧...

C28x+FPU架构的C2000微处理器在原有的C28x定点CPU的基础上加⼊了⼀些寄存器和指令，来⽀持IEEE 单精度浮点数的运算。对于在定点微处理器上编写的程序，浮点C2000也完全兼容，不需要对程序做出改动。浮点处理器相对于定点处理器有如下好处：

1. 编程更简单

2. 性能更优，⽐如除法，开⽅，FFT和IIR滤波等算法运算效率更⾼。

3. 程序鲁棒性更强。

⼀、IEEE754格式的浮点数

C28x+FPU的单精度浮点数遵循IEEE754格式。它包括：

1位符号位：0表⽰正数，1表⽰负数。

8位阶码

23位尾数

3130 2322 0

符号位阶码尾数

表1：IEEE单精度浮点数

符号位S阶码E尾数M值

000正0

100负0

0或10⾮0⾮规格化数(1)

01-2540x00000-0x7FFFF正常范围正数(2)

11-2540x00000-0x7FFFF正常范围负数(2)

02550正⽆穷⼤

12550负⽆穷⼤

0或1255⾮0⾮数值(NaN)

(1)⾮规格化数值⾮常⼩，计算公式为(-1)sx2(E-126)x0.M

(2)正常范围数值计算公式为(-1)sx2(E-127)x1.M

正常范围数值落在± ~1.7 x 10 -38 to ± ~3.4 x 10 +38范围内。从表1可以看出，IEEE754标准包括：

标准数据格式和特殊值，⽐如⾮数值(NaN)和⽆穷⼤

标准舍⼊模式和浮点运算

多平台⽀持，包括德州仪器C67x系列芯⽚。

C2000对该标准作了⼀些简化：

状态标志位和⽐较运算不区分正0和负0

⾮规格化数值被认为是0

对⾮数值(NaN)处理⽅式和⽆穷⼤⼀样。

IEEE754标准有5种舍⼊模式，C28x+FPU只⽀持其中两种：

--截断：⼩数位不管⼤⼩全部舍去

--就近舍⼊向偶舍⼊：这种模式下如果⼩数位⼩于5就舍去，⼤于5就进位，如果⼩数位为5，则舍⼊到最近的偶数。

表2展⽰了不同的舍⼊模式对数据的影响。C28x+FPU编译器默认将微处理器配置为就近舍⼊向偶舍⼊模式[1]。

表2：不同舍⼊模式⽰例

模式 / 实际值+11.5+12.5−11.5−12.5

就近舍⼊向偶舍⼊+12.0+12.0−12.0−12.0

就近舍⼊远离0舍⼊+12.0+13.0−12.0−13.0

截断+11.0+12.0−11.0−12.0

向上舍⼊+12.0+13.0−11.0−12.0

向下舍⼊+11.0+12.0−12.0−13.0

⼆、浮点C2000芯⽚运算技巧和注意点

浮点数的精度由尾数位决定，绝⼤多数的数在⽤浮点数表⽰时都会有误差，这些误差很⼩，多数情况下可以忽略，但是在经过多次计算后这个误差可能会⼤到⽆法接受。

下⾯⽤实例来进⾏说明，下⾯⼀段代码定义float类型变量，分别在TI最新的Delfino芯⽚F28379D的CPU1和CLA1上，将11.7加20001次。

float CLATMPDATA=0;

int index=20001;

while(index--)

{

CLATMPDATA=CLATMPDATA+11.7;

}

得到如下结果：

其中CLATMPDATA1是在CLA中将11.7加20001次得到的结果，CLATMPDATA2是在CPU中将11.7加20001次得到的结果。可以看出两者所得到的结果不同，并且都和正确结果234011.7有较⼤差距。

1. 为何CPU和CLA计算结果不同？

CPU和CLA运算结果的不同是由于其对浮点数的舍⼊模式的不同造成的，前⽂已经说过，C28x+FPU 编译器默认将CPU配置为就近舍⼊向偶舍⼊模式。⽽CLA不同，CLA默认为截断舍⼊模式[2]。在CLA的代码中，我们可以通过增加下述代码：

__asm(" MSETFLG RNDF32=1");//1为就近舍⼊向偶舍⼊，0为截断舍⼊

将CLA的舍⼊模式更改为就近舍⼊向偶舍⼊模式，然后再运⾏代码，可以得到和CPU同样的结果。

2. 为何CPU和CLA计算结果都有较⼤误差？如何解决？

11.7在⽤IEEE754格式的浮点数表⽰时为0x413b3333，其对应的实际值为11.69999980926513671875，可以看出误差很⼩，但是经过多次累加多次舍⼊后得到的结果误差较⼤，对此，我们可以将CLATMPDATA定义为long double型变量(64位)，再次运⾏相同的代码，可以得到如下结果，可以看到误差很⼩可以忽略。

需要指出的是，现有的C28x CPU只⽀持单精度(32位)的硬件浮点运算，对于64位双精度浮点数的运算都是通过软件实现的，所以其运算速率会慢很多。另外CLA不⽀持64位数。

在这个实例中，我们可以分别观察float类型变量和long double类型变量的汇编代码如下：浮点型变量float

C code: CLATMPDATA2=CLATMPDATA2+11.7;

如果CLATMPDATA2是float型变量，则相应的汇编代码为：

00c08d: E80209D8 MOVIZ R0, #0x413b 1cycle

00c08f: E2AF0112 MOV32 R1H, @0x12, UNCF 1cycle

00c091: E8099998 MOVXI R0H, #0x3333 1cycle

00c093: E7100040 ADDF32 R0H, R0H, R1H 2cycle

00c095: 7700 NOP 1cycle

00c096: E2030012 MOV32 @0x12, R0H 1cycle

如果CLATMPDATA2是long double型变量，则相应的汇编代码为：

00c08b: 7680005A MOVL XAR6, #0x00005a 1cycle

00c08d: 8F00005A MOVL XAR4, #0x00005a 1cycle

00c08f: 8F40C26A MOVL XAR5, #0x00c26a 1cycle

00c091: FF69 SPM #0 1cycle

00c092: 7640C0C9 LCR FD$$ADD 4cycle(跳转耗时)

+25cycle(FD$$ADD函数内部需要25cycle)

可以看出CPU对float类型数执⾏⼀次加法耗时7个cycle，对long double类型数执⾏⼀次加法耗时33个cycle。

三、结论

1. C2000的CPU和CLA默认的舍⼊模式不同，在计算浮点数时可能会得到不同的结果，但是我们可以通过代码改变其舍⼊模式得到相同的结果。

2. 单精度浮点数经过多次计算后可能会有较⼤误差，可以通过将变量定义为64位long double型解决精度问题。

3. C28x CPU只⽀持单精度(32位)的硬件浮点运算，对于64位双精度浮点数的运算都是通过软件实现的，所以其运算速率会慢很多。在下⼀代的C2000产品中我们会实现对64位双精度浮点数运算的硬件⽀持。

References

[1]. TMS320C28x FPU Primer (SPRAAN9A)

[2]. TMS320F2837xD Dual-Core Delfino Microcontrollers Technical Reference Manual (SPRUHM8F)

688IT编程网

定点运算和浮点运算_C2000浮点运算注意事项——CPU和CLA的差异及误差处 ...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

定点运算和浮点运算_C2000浮点运算注意事项——CPU和CLA的差异及误差处 ...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式