C#(.net)中按字节数截取字符串最后出现乱码问题的解决
前言
最近需要用到按字节数截取字符串。在网上找了很多方法。
Encoding.Default.GetString采用的Default
Encoding.UTF8.GetBytes采用的是utf-8编码。这样当然是乱码。尤其出现中文时候。
对这类数据处理当然要用统一的编码来处理。下面话不多说了,来一起看看详细的介绍吧
例子:1
stringmsg=Encoding.UTF8.GetString(Encoding.UTF8.GetBytes(strcode));
例子:2
stringstrcode="我是小明"; byte[]buffer=Encoding.UTF8.GetBytes(strcode); stringmsg=Encoding.UTF8.GetString(buffer,0,buffer.Length);
实际结果是截取的结尾会出现乱码。原因是最后的字符是多个字节,被不完整的截取了。
改进后的办法如下:
//////按字节数截取字符串的方法(比SubString好用) /// ///要截取的字符串(可空) /// 要截取的字节数 /// System.Text.Encoding /// 结果字符串的后缀(超出部分显示为该后缀) /// publicstaticstringSubStringByBytes(stringsource,intNumberOfBytes,System.Text.Encodingencoding,stringsuffix="...") { if(string.IsNullOrWhiteSpace(source)||source.Length==0) returnsource; if(encoding.GetBytes(source).Length<=NumberOfBytes) returnsource; longtempLen=0; StringBuildersb=newStringBuilder(); foreach(varcinsource) { Char[]_charArr=newChar[]{c}; byte[]_charBytes=encoding.GetBytes(_charArr); if((tempLen+_charBytes.Length)>NumberOfBytes) { if(!string.IsNullOrWhiteSpace(suffix)) sb.Append(suffix); break; } else { tempLen+=_charBytes.Length; sb.Append(encoding.GetString(_charBytes)); } } returnsb.ToString(); } /// ///按字节数截取字符串的方法(比SubString好用) /// ///要截取的字符串(可空) /// 要截取的字节数 /// UTF-8,Unicode,GB2312... /// 结果字符串的后缀(超出部分显示为该后缀) /// publicstaticstringSubStringByBytes(stringsource,intNumberOfBytes,stringencoding="UTF-8",stringsuffix="...") { returnSubStringByBytes(source,NumberOfBytes,Encoding.GetEncoding(encoding),suffix); }
原理很简单,就是截取之前逐个先判断字符是否超出字节长度,如果超出则扔掉整个字符。
在JavaScript里面的Blob对象很容易获取字节长度:varlen=newBlob(['字符串']).size;
JS代码是不是比较简洁?
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对毛票票的支持。