Skip to content

Latest commit

 

History

History
57 lines (36 loc) · 1.52 KB

README.md

File metadata and controls

57 lines (36 loc) · 1.52 KB

hnustdx

爬取湖南科技大学党课题库

网站分析

  • 服务器直接生成html返回给客服端
  • 采用thinkphp3.4.3 还不需要cookies.......
  • 页面结构如图
  • image-20220515001308938

试题页面

页面数据获取

xpath解析

  • name = html.xpath('//*[@id="form1"]/table/thead/tr/th//text()')
  • problemid = html.xpath('//*[@id="form1"]/table/tbody/tr[1]/td[1]/input//@name')[0]
    
  • selectionA = html.xpath('//*[@id="form1"]/table/tbody/tr[1]/td[2]//text()')[0]
    

获取答案

总结

这网站真憨比。。。。。。。

拿到数据在1250道左右

image-20220515003512943

哦,还有个笑点

image-20220515002604772

查题接口