关于有理分数精确十进制表示的信息含量与可压缩性的技术问询

阿华AIGC实验室

2026-4-20

嘿，这个问题问得特别切中要害——你其实已经触及了信息论里数据压缩、有理数与无理数本质的核心点，咱们一步步拆解来聊：

首先给你个明确的核心结论：所有有理数的信息含量本质上是等价的，但它们的十进制表示的可压缩性差异极大；而无理数确实是完全不可压缩的（至少在标准的信息论定义下）。

为什么有理数的信息含量是等价的？

有理数的本质就是两个整数的比值 a/b（b≠0），从信息论的「最小描述长度（MDL）」角度看，只要能精确指定这两个整数，就完全确定了这个分数——不管它的十进制展开是有限、短循环还是超长循环。比如你提到的93/113，你只需要存储93和113这两个整数，这比存储它那112位的循环节高效太多了，这才是它的「最小信息单元」。

十进制表示的差异来自哪里？

你观察到的有限小数、带前置位的循环小数、纯循环小数，本质上是分母和10的质因数关系决定的：

如果分母的质因数只有2和5，十进制展开就是有限的（比如1/4=1/(2²)、1/20=1/(2²×5)），这时候展开本身就是很紧凑的形式，几乎没有冗余。
如果分母包含2、5之外的质因数，就会出现循环节：
- 纯循环小数（比如93/107、93/113）是因为分母和10互质，循环节的长度由「10在模分母下的乘法阶」决定——对于质数p（非2、5），循环节最长就是p-1（像113这个质数，循环节112位就是最大值）。
- 带前置非循环部分的循环小数（比如93/104=93/(8×13)），是因为分母里有2或5的因子，这部分对应前置的有限位，剩下的非2/5质因数则对应循环节部分。