好资源导航 » 文章资讯 » C#（.net）中按字节数截取字符串最后出现乱码问题的解决

C#（.net）中按字节数截取字符串最后出现乱码问题的解决

2023-09-11 23:58:05 219

前言

最近需要用到按字节数截取字符串。在网上找了很多方法。

Encoding.Default.GetString采用的Default

Encoding.UTF8.GetBytes采用的是utf-8编码。这样当然是乱码。尤其出现中文时候。

对这类数据处理当然要用统一的编码来处理。下面话不多说了，来一起看看详细的介绍吧

例子：1

stringmsg=Encoding.UTF8.GetString(Encoding.UTF8.GetBytes(strcode));

例子：2

stringstrcode="我是小明";
byte[]buffer=Encoding.UTF8.GetBytes(strcode);
stringmsg=Encoding.UTF8.GetString(buffer,0,buffer.Length);

实际结果是截取的结尾会出现乱码。原因是最后的字符是多个字节，被不完整的截取了。

改进后的办法如下：

///
///按字节数截取字符串的方法(比SubString好用)
///
///要截取的字符串（可空）
///要截取的字节数
///System.Text.Encoding
///结果字符串的后缀（超出部分显示为该后缀）
///
publicstaticstringSubStringByBytes(stringsource,intNumberOfBytes,System.Text.Encodingencoding,stringsuffix="...")
{
if(string.IsNullOrWhiteSpace(source)||source.Length==0)
returnsource;

if(encoding.GetBytes(source).Length<=NumberOfBytes)
returnsource;

longtempLen=0;
StringBuildersb=newStringBuilder();
foreach(varcinsource)
{
Char[]_charArr=newChar[]{c};
byte[]_charBytes=encoding.GetBytes(_charArr);
if((tempLen+_charBytes.Length)>NumberOfBytes)
{
if(!string.IsNullOrWhiteSpace(suffix))
sb.Append(suffix);
break;
}
else
{
tempLen+=_charBytes.Length;
sb.Append(encoding.GetString(_charBytes));
}
}
returnsb.ToString();
}
///
///按字节数截取字符串的方法(比SubString好用)
///
///要截取的字符串（可空）
///要截取的字节数
///UTF-8，Unicode，GB2312...
///结果字符串的后缀（超出部分显示为该后缀）
///
publicstaticstringSubStringByBytes(stringsource,intNumberOfBytes,stringencoding="UTF-8",stringsuffix="...")
{
returnSubStringByBytes(source,NumberOfBytes,Encoding.GetEncoding(encoding),suffix);
}

原理很简单，就是截取之前逐个先判断字符是否超出字节长度，如果超出则扔掉整个字符。

在JavaScript里面的Blob对象很容易获取字节长度：varlen=newBlob(['字符串']).size;

JS代码是不是比较简洁？

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对毛票票的支持。

返回顶部
3162201930
czq8825@qq.com

C#（.net）中按字节数截取字符串最后出现乱码问题的解决

热门推荐

随机推荐