診療情報管理士認定試験の合格者受験番号一覧をPhantomJSでスクショしようとしたらブロックされた
3月23日に診療情報管理士認定試験の合格者受験番号が発表されました。認定試験のホームページに掲載されております。
よーし、こりゃあWebscrapingしがいがあるのー、ということで、小手調べにPhantomJSでスクリーショットを撮って見よー、と試して見たことろブロックがかかってしまいました。
from selenium import webdriver from selenium.webdriver.common.keys import Keys as keys import time def main(): url = "https://www.jha-e.com/top/certExams/resultDetails" driver = webdriver.PhantomJS() driver.get(url) print(driver.current_url) driver.save_screenshot("testnum.jpg") driver.quit() print("end") if __name__ == '__main__': main()
やっぱセキュリティ気にしてるのかな?このはてなブログにリンク貼ることもできないようです。
ちなみにurlを一つ上の階層の"https://www.jha-e.com/top/certExams/result"にして見たらちゃんとスクショ撮れました。