每一颗眼泪,是一万道光:迎新系统学生信息爬取You don’t get over the fear. You run towards it, with your knees buckling.—Amin Ariana, Technical Founder, hacker and advisor at several ventures有多少次,希望那短暂平凡的一刻又一刻定格到永恒。简简单单就是幸福忘乎所有只有热爱去年8月,来跪邮写得第一个程序。在学十还略显空荡的房间,空荡荡的桌面,床上没有被子只有个睡袋,惨白惨白的灯光和兴奋的新同学们。这次,依然是selenium专场。让程序操作浏览器。首先,依然是研究整个流程。打开 http://welcome.bupt.edu.cn看看怎么登录一切显而易见,输入用户名密码,点击登录按钮。进入界面这时候看到有个选框,发现可以选择研究生或者本科生。在这里我不讨论这个问题,留作读者自己思考。我们随便翻翻看看注意到左下角有几个页码,左边还有个3136/210之类的东西。大概研究下猜想,3136是学生总数,210是总页数。同时注意到页码是一次显示5页,通过点击>翻入下个5页。为了得到我们要翻多少页,需要提取出210这个数。我们已经讲过如何用xpath来索引到对应的元素。紧接着,抓取,点击下一页,每翻五页,点击>,然后继续重复以上步骤。直到把210页全翻完。
...
继续阅读
(26)