爬不到的这些url都是没有.html后缀的,我起初是认为后缀问题,结果加上后缀也没内容
异步加载的吧?
没有异步
多线程都没用
HTML是静态网页
jsp的话是动态加载的,不是一次申请
奇怪的是,它一部分能抓到,一部分抓不到,抓不到的都是没有 html后缀的
我在url后面加上.html还是可以打开
那些链接有可能是服务器的代码请求操作
比如xxx/service
你的意思……有可能这个页面post发送了别的数据到后端,然后后端给了别的页面?
会定位到服务器里面的一段代码,然后代码操作完了转发到其他页面显示
哦,明白了,谢谢,我还在吃饭,等会儿去看看状态码
我也不是很清楚,刚刚学了点web编程,感觉你请求的可能是一些服务器里面定义的一些类
一般这些是不给直接请求的,会加检验
嗯嗯,我明白你的意思,类似flask后端路由,做了处理之后再给到其他页面
服务器端重定向,会给前端302的状态码