使用C#指定ANSI编码生成文件却被识别为UTF-8的问题

阿华AIGC实验室

2026-4-8

C#指定ANSI编码生成文件却被识别为UTF-8的问题

我懂你遇到的困惑！你写的代码逻辑本身是没问题的，但为啥记事本这类工具还是把文件识别成UTF-8呢？其实核心原因出在你写入的内容上——你写的"Test"全是ASCII字符，而ASCII字符在ANSI（Windows-1252）和UTF-8里的编码字节是完全一致的。再加上UTF-8文件如果只有ASCII内容的话，通常不会添加BOM（字节顺序标记），这时候像记事本这种工具就没法准确区分到底是ANSI还是UTF-8，会默认显示成UTF-8。

给你两个实用的解决思路：

验证编码正确性：写入一个包含非ASCII的字符试试，比如把内容改成"Testé"（带重音的e）。这时候你再用记事本打开，就会发现它会正确识别为ANSI编码了，因为这个字符在Windows-1252和UTF-8里的编码字节完全不同，工具能准确区分。
无需纠结的场景：如果你的业务确实只需要写入ASCII字符，那其实不用在意工具的显示——文件的实际编码就是你指定的Windows-1252，只是因为内容兼容才被误判。毕竟ASCII字符在两种编码下的存储是完全相同的，不会影响后续的读取操作。

修改后的验证代码示例：

Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);
var encoding = Encoding.GetEncoding(1252);
using (var streamWriter = new StreamWriter(@"C:\test.txt", false, encoding))
{
    // 写入带非ASCII的字符来验证编码
    streamWriter.Write("Testé");
}

内容来源于stack exchange