Дело в том что уже несколько месяцев ищу работу в области IT. И вот в один прекрасный день мне надоело точечно высылать резюме и получать отказы. И тут я подумал а если разослать свое резюме всем компаниям моей страны, но для этого нужно где то раздобыть их адреса.
И тут мне на помощи пришел dev.by, на странице "компании" предоставлено 1460 компаний.
Теперь мне нужно распарсить этот список и извлечь из них адреса. Но вот и первая проблема:
адреса (в целях безопасности) формируются скриптами и по этому просто так распарсить страницу не получится.
Очевидное решение использовать Selenium WebDriver, но каким то образом сайт распознавал использование селениума и не хотел выдавать заветные адреса.
Покопавшись в вызовах нашел запрос страницы к серверу с получением емейлов.
Данный вызов делает post запрос с интересными параметрами.
Они идентичны тем что отображены поле "data-verify" тега span.
А это значит что нужно извлечь именно эту строку и сформировать запрос к серверу для получения емейлов.
Написал скрипт на питоне для парсинга страниц.
Далее скрипт на яваскрипте для получения адресов.
P.S.
К сожалению после рассылки мой почтовый ящик заблокировали. И не обошлось без эксцессов, хотелось бы показать отклики но на данный момент жду пока разблокируют почтовый ящик.
P.P.S.
Вдобавок покажу вам график просмотров резюме:
За несколько часов его посмотрела порядка сотни компаний.