注册
登录
查看:390 | 回复:4
佩奇
bs4爬一个数据,爬出来不对劲,大佬们帮忙看看
发表于 2023/5/25 13:54:01
楼主

image.png

image.png

佩奇
发表于 2023/5/25 13:55:44
沙发

就是这个天气这个部分

有些是有两个的

所以爬出来就是这样的

就是保存csv就不行因为有/xa0

上善若水
发表于 2023/5/25 13:57:56
板凳

因为数据中包含了非ASCII字符

可以引入 codecs 包,使用 utf-8 编码方式打开文件:

import codecs
with codecs.open( data.csv ,  w ,  utf-8 ) as file:

加上这个

上善若水
最佳答案 发表于 2023/5/25 14:01:34
4楼

或者

使用 replace() 方法将 /xa0 替换为空格

data = data.replace(u \xa0 , u )

试试吧

佩奇
发表于 2023/5/25 14:06:00
5楼

OK,我解决啦

谢谢~

立即注册站大爷用户,免费试用全部产品
立即注册站大爷用户,免费试用全部产品