热搜:NVER node 开发 php

strtr函数字符替换出现乱码

2024-09-20 21:15:01
strtr函数字符替换出现乱码

我的替换词库来源于一个文本文件。文本文件无论改成gbk还是utf-8格式都出现乱码。
如果把替换词库自己定义如下:
$words = array('发文说'=>'DDDDDDDDDDDDDDDDDDDd');
替换就不会出现乱码
$data['content'] = strtr($data['content'], $words);

我把words变量打印出来,里面的词组都没有乱码,用函数检测,也不是utf-8格式。所以可以确认,内容和替换词组都是gbk格式的字符串。
请问如何解决这个问题?谢谢


回复讨论(解决方案)

你词库的格式?你如何读词库的?

你词库的格式?你如何读词库的?

$data_file = PICK_DATA.'/word.txt';$handle = fopen($data_file, "r");$data = fread($handle, filesize($data_file));

你词库的格式?你如何读词库的?

我在网上搜索,得到答案说: 因为strtr在字符串替换的时候是以单个字节对应进行替换的,所以对于非单字节编码的数据(如中文utf-8)就可以会出现乱码。
但是我的字符串都是gbk呀。而且我以前也用这个函数,没出现乱码。到这里就出现乱码了,不知道为何。

你没有说你的词库是如何组织的

不多只要你的原词有单个汉字的话,乱码的概率一般不会低于50%

你没有说你的词库是如何组织的

不多只要你的原词有单个汉字的话,乱码的概率一般不会低于50%

问题找到了。我切割字符的时候用的是\n,而不是\r\n。这就是造成乱码的原因。感谢回答。