Vì sao 0.1 + 0.1 + 0.1 không bằng 0.3?

written by HVN on 2016-12-29

Nếu có thể trả lời chính xác câu hỏi sau và giải thích tại sao, bạn có thể bỏ qua bài này:

0.1 + 0.1 + 0.1 == 0.3

Trong Python, biểu thức này trả về đúng (True) hay sai (False)? hay nói cách khác, khi gõ biểu diễn trên máy tính vế trái có bằng vế phải không?

Có thể sử dụng bất kỳ ngôn ngữ lập trình nào khác: Python, C, Java, Golang, ... kết quả là không đổi.

Câu trả lời ngắn gọn: Kết quả trả về là False, hay vế trái không bằng vế phải.

Float là gì?

Kiểu dữ liệu float là viết tắt của "real floating-point number" - kiểu "số thực dấu chấm động".

float là một cách BIỂU DIỄN XẤP XỈ cho một số thực (real number) bằng cách đánh đổi độ chính xác (precision).

Các quy tắc / chuẩn để biểu diễn float được mô tả trong tiêu chuẩn quốc tế IEEE 754

Số thực

là tập số gồm:

  • các số hữu tỷ (số biểu diễn được ở dạng phân số: VD: 2, 1/3)
  • và các số vô tỷ (số không biểu diễn được ở dạng phân số: VD: căn bậc 2 của 2)

Số vô tỷ

Bản chất của các số vô tỷ là bạn không thể biểu diễn chính xác chúng ở dạng số (A.BCDEF) hay phân số. Vậy nên khi biểu diễn các số vô tỷ bằng kiểu float, ta chỉ biểu diễn một giá trị gần đúng với giá trị thật, trong một phạm vi sai số ta chấp nhận.

In [14]: import math

In [15]: math.sqrt(2)
Out[15]: 1.4142135623730951

Ở các trường đại học có dạy môn giải tích số / phương pháp tính, đưa ra các cách tính để tính ra các số phần thập phân của căn bậc 2 của 2 trong phạm vi sai số cho phép. Có thể kể tới phép lặp Newton.

Số hữu tỷ

Đối với các số hữu tỷ, ta luôn có thể biểu diễn chúng ở dạng phân số thập phân (decimal fractions). Nhưng nếu không sử dụng ký hiệu phân số để biểu diễn, giá trị số thực thu được không bằng giá trị thật của phân số. Ví dụ với 1/3, khi biểu diễn trên máy tính bằng kiểu float, 1/3 sẽ chỉ được biểu diễn bằng giá trị xấp xỉ của nó:

In [1]: 1/3
Out[1]: 0.3333333333333333

In [2]: len(str(1/3))
Out[2]: 18

Dù đã biểu diễn bằng 17 con số (16 số sau dấu thập phân .) thì giá trị mà ta nhìn thấy vẫn không phải là giá trị chính xác mà ta cần biểu diễn, dù có thêm bao nhiêu số sau dấu phẩy đi nữa.

Một lý do mà số hữy tỷ không được biểu diễn chính xác trên máy tính nữa là do: máy tính biểu diễn các giá trị phân số thập phân (hệ 10) bằng các phân số nhị phân (các phân số có mẫu là lũy thừa của 2 - binary fractions).

Ví dụ: 0.125 là biểu diễn thập phân của giá trị 1/10 + 2/100 + 5/1000 sau khi rút gọn ta có phân số tối giản là 1/8. Máy tính biểu diễn giá trị này ở hệ nhị phân: 0.001 - có giá trị là 0/2 + 0/4 + 1/8 = 1/8. Vấn đề dẫn đến sai số khi dùng float biểu diễn các số hữu tỷ là bởi hầu hết các phân số hệ thập phân không có biểu diễn ở hệ nhị phân. Điều này dẫn đến mỗi số float người dùng nhập vào sẽ được máy tính lưu trữ tương ứng một giá trị nhị phân gần bằng với nó. Ví dụ với biểu diễn 0.1 hay giá trị ở hệ thập phân là 1/10. Khi đưa vào máy tính biểu diễn ở dạng phân số nhị phân, ta có phân số sau đây:

In [1]: 3602879701896397 / 2 ** 55
Out[1]: 0.1

In [2]: format(3602879701896397 / 2 ** 55, '.17f')
Out[2]: '0.10000000000000001'

Giá trị máy tính thực sự lưu trữ kiểu float khi người dùng gõ 0.1 là giá trị sinh bởi phân số nói trên. Và nó không bằng 0.1.

Khi ta cộng 3 giá trị 0.1 với nhau sẽ có:

In [1]: 0.1
Out[1]: 0.1

In [2]: 0.1 + .1 # .1 là kiểu viết tắt cho 0.1
Out[2]: 0.2

In [3]: 0.1 + .1 + .1
Out[3]: 0.30000000000000004

In [4]: 0.1 + .1 + .1 == 0.3
Out[4]: False

Vậy nên, khi nhìn thấy số kiểu float, thì khả năng lớn nó không phải là một giá trị chính xác, mà chỉ là giá trị xấp xỉ - mặc dù việc xấp xỉ (làm tròn) này không đáng kể - nhưng khi dồn lại nhiều sẽ dẫn đến một sai số lớn. Điều này khiến các ứng dụng liên quan đến tài chính không bao giờ dùng kiểu float. Đặc biệt không so sánh các số kiểu float với nhau vì sẽ gặp những kết quả bất ngờ như ví dụ trên. Để so sánh float, dùng function math.isclose

In [1]: import math

In [2]: math.isclose(10**60, 1e60)
Out[2]: True

In [3]: 10**60 == 1e60
Out[3]: False

In [4]: type(1e60)
Out[4]: float

Khi cần tính toán chính xác, hãy sử dụng các thư viện có sẵn của Python như decimal, fraction để tính toán chính xác:

In [5]: from decimal import Decimal as D

In [6]: D('0.1') + D('0.1') + D('0.1') == D('0.3')
Out[6]: True

Cách tìm ra phân số nhị phân được dùng để xấp xỉ giá trị 0.1

In [4]: n = 0.1

In [5]: n.as_integer_ratio()
Out[5]: (3602879701896397, 36028797018963968)

In [6]: t, m = (0.1).as_integer_ratio()

In [7]: import math

In [8]: math.log2(m)
Out[8]: 55.0

In [9]: 2 ** 55
Out[9]: 36028797018963968

In [12]: from fractions import Fraction as F
In [13]: F.from_float(0.1)
Out[13]: Fraction(3602879701896397, 36028797018963968)

Với dạng biểu diễn phân số nằm dưới giá trị float 0.1, ta lấy tử số nhân với 10 rồi so sánh với mẫu số xem lệch bao nhiêu (nếu không lệch thì tử * 10 - mẫu == 0).

In [30]: for idx, i in enumerate([.1, .2, .3, .4, .5, .6, .7, .8, .9, 1.0], start=1):
    ...:     t, m = i.as_integer_ratio()
    ...:     print(i, t * 10 - m * idx)
    ...:
    ...:
0.1 2
0.2 2
0.3 -2
0.4 2
0.5 0
0.6 -2
0.7 -2
0.8 2
0.9 2
1.0 0

Kết quả cho thấy trong các số float ở trên, chỉ có 0.5 và 1.0 là giá trị biểu diễn chính xác.

Tham khảo