解决C#读写txt文件中文(汉字)乱码的问题--688IT编程网

解决C#读写txt⽂件中⽂（汉字）乱码的问题

最新⽂章：

不少朋友遇到⽤System.IO.StreamReader读取包含汉字的txt⽂件时，经常会读出乱码（StreamWriater写⽂本⽂件也有类似的问题），原因很简单，就是⽂件的编码（encoding）和StreamReader/Writer的encoding不对应。

为了解决这个问题，我写了⼀个类，来取得⼀个⽂本⽂件的encoding，这样我们就可以创建对应的

StreamReader和StreamWriter来读写，保证不会出现乱码现象。其实原理很简单，⽂本编辑器（⽐如XP⾃带的记事

本）在⽣成⽂本⽂件时，如果编码格式和系统默认的编码（中⽂系统下默认为GB2312）不⼀致时，会在txt⽂件开头

部分添加特定的“编码字节序标识（Encoding Bit Order Madk，简写为BOM）”，类似PE格式的"MZ"⽂件头。这样

它在读取时就可以根据这个BOM来确定该⽂本⽂件⽣成时所使⽤的Encoding。这个BOM我们⽤记事本等程序打开默认

是看不到的，但是⽤stream按字节读取时是可以读到的。我的这个TxtFileEncoding类就是根据这个BOM“⽂件头”

来确定txt⽂件⽣成时⽤到的编码的。

using System;

using System.Collections.Generic;

using System.Text;

using System.IO;

namespace OnlineEditLib

{

public class TxtFileEncoding

{

public TxtFileEncoding()

{

// TODO: 在此处添加构造函数逻辑

}

///<summary>

///取得⼀个⽂本⽂件的编码⽅式。如果⽆法在⽂件头部到有效的前导符，Encoding.Default将被返回。

///</summary>

///<param name="fileName">⽂件名。</param>

///<returns></returns>

public static Encoding GetEncoding(string fileName)

{

return GetEncoding(fileName, Encoding.Default);

}

///<summary>

///取得⼀个⽂本⽂件流的编码⽅式。

///</summary>

///<param name="stream">⽂本⽂件流。</param>

///<returns></returns>

public static Encoding GetEncoding(FileStream stream)

{

return GetEncoding(stream, Encoding.Default);

}

///<summary>

///取得⼀个⽂本⽂件的编码⽅式。

///</summary>

///<param name="fileName">⽂件名。</param>

///<param name="defaultEncoding">默认编码⽅式。当该⽅法⽆法从⽂件的头部取得有效的前导符时，将返回该编码⽅式。</param>

///<returns></returns>

public static Encoding GetEncoding(string fileName, Encoding defaultEncoding)

{

FileStream fs = new FileStream(fileName, FileMode.Open);

Encoding targetEncoding = GetEncoding(fs, defaultEncoding);

乱码文字生成

fs.Close();

return targetEncoding;

}

///<summary>

///取得⼀个⽂本⽂件流的编码⽅式。

///</summary>

///<param name="stream">⽂本⽂件流。</param>

///<param name="defaultEncoding">默认编码⽅式。当该⽅法⽆法从⽂件的头部取得有效的前导符时，将返回该编码⽅式。</param>

///<returns></returns>

public static Encoding GetEncoding(FileStream stream, Encoding defaultEncoding)

{

Encoding targetEncoding = defaultEncoding;

if (stream != null && stream.Length >= 2)

{

//保存⽂件流的前4个字节

byte byte1 = 0;

byte byte2 = 0;

byte byte3 = 0;

byte byte4 = 0;

//保存当前Seek位置

long origPos = stream.Seek(0, SeekOrigin.Begin);

stream.Seek(0, SeekOrigin.Begin);

int nByte = stream.ReadByte();

byte1 = Convert.ToByte(nByte);

byte2 = Convert.ToByte(stream.ReadByte());

if (stream.Length >= 3)

{

byte3 = Convert.ToByte(stream.ReadByte());

}

if (stream.Length >= 4)

{

byte4 = Convert.ToByte(stream.ReadByte());

}

/根据⽂件流的前4个字节判断Encoding

//Unicode {0xFF, 0xFE};

//BE-Unicode {0xFE, 0xFF};

//UTF8 = {0xEF, 0xBB, 0xBF};

if (byte1 == 0xFE && byte2 == 0xFF)//UnicodeBe

{

targetEncoding = Encoding.BigEndianUnicode;

}

if (byte1 == 0xFF && byte2 == 0xFE && byte3 != 0xFF)//Unicode {

targetEncoding = Encoding.Unicode;

}

if (byte1 == 0xEF && byte2 == 0xBB && byte3 == 0xBF)//UTF8 {

targetEncoding = Encoding.UTF8;

}

//恢复Seek位置

stream.Seek(origPos, SeekOrigin.Begin);

}

return targetEncoding;

}

688IT编程网

解决C#读写txt文件中文(汉字)乱码的问题

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

688IT编程网

解决C#读写txt文件中文(汉字)乱码的问题

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林 重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

随机森林重要性