先查看编码格式:
检测字符编码,得出的结果是CP936
mb_detect_encoding($str, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', true)
用以下两种方式转换为utf-8格式
错误方式【仅对于带汉字的字符串,对于纯数字与英文的字符串并不影响】:
mb_convert_encoding($str, 'UTF-8', 'CP936');
iconv($encoding, 'UTF-8', 'CP936')
正确方式:
1. iconv('utf-8', 'latin1', $str);
2. iconv('utf-8','latin1//IGNORE', $str);
而后正常正常截取(用mb_substr【此方式截取的字节个数会适当偏移:汉字占2-3个字节;为使其正常显示】);
mb_substr($str,0,50);