C#判断字符串的显示宽度
起因:
公司有一个使用项目使用HTML转换为PDF,其中有一个表格,表格的最后一列中的单元格,其字符串超长后会被丢弃,而不是换行到下一行展示(HtmlToPdf渲染引擎导致的,没办法更改)
解决方案:
根据字符串长度手动添加
换行
var source = "ABCD"; if (GetLength(source)>2) { source = source.Insert(2,"
"); } Console.WriteLine(source); // 输出AB
CD int GetLength(string src) { return src.Length; }
出现了一个BUG:
当原始内容中存在中文时,中文字符的显示宽度大于英文字符的宽度,按照字符串中的字符数进行处理,并不准确
/* * 中文:中文
CD * 英文:AB
CD */
原因分析:
在文字的显示中,有全角和半角的区别
全角:指一个字符占用两个标准字符位置的状态。
半角:指一个字符占用一个标准字符位置的状态。
尝试解决:
字符编码:最早的字符编码为Ascii码,只考虑了英文语种使用者,后来随着计算机的普及,有了其他编码,比如GB2312、UTF8等,不止包含英文的字符编码,但是这些编码都对Ascii码进行了兼容
没有细心求证的结论:Ascii码对应的是半角,中文扩展部分是全角展示,半角显示宽度为全角的一半(这结论是我猜的,没有求证,如果不对还请提出批评指正)
通过上面猜测的结论,可以先对每个字符判断是不是Ascii字符来决定当前是全角还是半角
var source = "ABCD"; var index =InserAtDisplayWidth(2,source); if (index!=-1) { source = source.Insert(index,"
"); } // AB
CD Console.WriteLine(source); var source2 = "中文CD"; var index2 =InserAtDisplayWidth(2,source2); if (index2!=-1) { source2 = source2.Insert(index2,"
"); } // 中
文CD Console.WriteLine(source2); int InserAtDisplayWidth(int inserAtDisplayWidth, string source){ int now =0; for (int i = 0; i < source.Length; i++) { if( char.IsAscii(source[i])){ // 半角占一个显示宽度 now +=1; }else{ // 全角占两个显示宽度 now +=2; }; if (now>inserAtDisplayWidth) { return i; } } return -1; }
通过对字符的判断,更加准确的匹配了分隔的位置,既避免了无效的空白区域,又避免了过长的字符串溢出导致看不到内容
/* * AB
CD * 中
文CD */