Double和Float的区别

蜗牛君

2019-10-20

Java / 基本类型

Double和Float的区别

对编程人员来说，double 和 float 的区别是double精度高，单精度浮点数有效数字8位，双精度浮点数有效数字16位。但double消耗内存是float的两倍，double的运算速度比float慢得多，C语言中数学函数名称double 和 float不同，不要写错，能用单精度时不要用双精度（以省内存，加快运算速度）。

Double与Float的存储方式

java语言中，float类型数字在计算机中用4个字节（32位）来存储。double类型占用8个字节（64位）。从存储结构和算法上来讲，double和float是一样的，不一样的地方仅仅是float是32位的，double是64位的，所以double能存储更高的精度。

　　按照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法：用符号、指数和尾数来表示。指数可正可负，所以，IEEE规定，此处算出的次方必须减去127才是真正的指数。底数定为2，即把一个浮点数表示为尾数乘以2的指数次方再添上符号。

下面是具体的规格：

类型	符号位	指数	尾数	长度
float	1	8	23	32
double	1	11	52	64

以float为例：

　　因为指数需要减去127，所以float类型的指数可从-126到128。

科学计数法：

SEEEEEEE EMMMMMMM MMMMMMMM MMMMMMMM

S表示浮点数正负

E表示指数加上127的值后得到的二进制数据

==M表示尾数，最高位固定为1==

举例：

17.625在内存中的存储为：

首先要把17.625换算成二进制：10001.101。

整数部分：除以2，直到商为0，余数反转。（即：模2取余法）

　　　　　　 17 % 2 = 8 —> 1 低位

　　　　　　8 % 2 = 4 —> 0

　　　　　　4 % 2 = 2 —> 0

　　　　　　2 % 2 = 1 —> 0

　　　　　　1 % 2 = 0 —> 1 高位

所以整数部分的二进制表示= 10001

小数部分：乘以2，直到乘位为0，进位顺序取。（即：乘2取整法）

按如下算法进行：

1）首先给小数部分乘2，得到的数，如果小数点前为1；则计1，为0，则计0。
2）再对剩下的小数部分乘2，再计出1或0。
3）重复以上步骤，直至达到需要的精度。

0.625 x 2 = 1.25 —> 1 -1位

0.25 x 2 = 0.5 —> 0 -2位

0.5 x 2 = 1.0 —> 1 -3位

0.0 x 2 = 0.0 —> 0 -4位

…….

所以小数部分得到的二进制表示= 0101 即101

以上得到17.625换算成二进制为10001.101。

再将10001.101右移，直到小数点前只剩1位，1.0001101 * 2^4 ，右移动了四位。

此时，底数和指数就出来了。

底数：因为小数点前必为1，所以IEEE规定只记录小数点后的就好。所以，此处的底数为：0001101

指数：实际为4，必须加上127(转出的时候，减去127)，所以为131。也就是10000011

符号：因为是正数，所以是0

综上所述，17.625在内存中的存储格式是：

0 (符号)+ 10000011 (指数)+ 0001101(底数)+00000000 00000000 (补0, 凑满32位)

即=>01000001 10001101 00000000 00000000

蜗牛君的NoteBook

Double和Float的区别

Double和Float的区别

Double与Float的存储方式

举例：

Previous

Main

Next

Java修饰符详解

Java

Comments