客户反映,ECShop后台用CSV批量上传商品数据包出现一堆乱码,字段完全对不上。分析了代码后发现,ECShop读CSV的方式弱爆了。在admin/目录下找到good_batch.php这段代码
/*将文件按行读入数组,逐行进行解析*/
$line_number=0;
$arr=array();
$goods_list=array();
$field_list=array_keys($_LANG['upload_goods']);//字段列表
$data=file($_FILES['file']['tmp_name']);
用file方法将每行作为一个记录读入数组$data中。这里会有个问题,当商品描述里出现换行符,读入就会出错。
继续往下看。ECShop根据上传时选择的编码类型,如果不是UTF-8则会强制转换成UTF-8。但也只是支持中文GB2312编码,客户上传的数据包却是Unicode编码(客户用淘宝助理导出),结果就乱码了。
//转换编码
if(($_POST['charset']!='UTF8')&&(strpos(strtolower(EC_CHARSET),'utf')===0))
{
$line=ecs_iconv($_POST['charset'],'UTF8',$line);
}
EC的编码转换果真是奇葩,好端端的mb库放着不用,偏要自己搞一套。用phpExcelReader导入Excel文件就工作得很好,编码都不存在问题。于是,把这段代码改了。
/*将文件按行读入数组,逐行进行解析*/
$line_number=0;
$arr=array();
$goods_list=array();
$field_list=array_keys($_LANG['upload_goods']);//字段列表
$reader=newSpreadsheet_Excel_Reader();
$reader->setOutputEncoding('utf-8');
$reader->read($_FILES['file']['tmp_name']);
$data=$reader->sheets[0]['cells'];
phpExcelReader包含两个文件,使用时需要将Excel/reader.phpinclude进来。修改完之后,问题解决。