不想说什么,此刻的内心是膨胀的。
这几天在做一个题库,要把文件里面的内容读取到数据库中去。从刚开始的编码问题一步一步都弄好了。结果在后面入坑了。
$str = 在古代中外文化交流史上,出现了一些流传千古的动人佳话,它们包括( )。 正确答案:ABCD
以上是源字符串,utf-8的编码格式,为了将题目和答案拆分,我用PHP的正则表达式来匹配。
1、获得题目 $title=preg_replace('/[正确答案\:]+\w*/','',$str);
结果,数据库全是乱码,我检测了$Str的编码格式 :UTF-8
在检测$title的编码格式:CP936 !!!!!!
你说我气不气!我都不知道那里出问题了-----
结果,我换了个匹配的内容:/[正确答案\:]+\w{1,4}/
再检测编码格式就是UTF-8了,你说气不气。。。