Недели две уже как на моем нетбуке стоит SliTaz linux 3.0. Приятный и быстрый дистрибутив со всем необходимым и некоторыми проблемами, которые хочется решить. Одна из проблем – отсутствие свежей среды для выполнения скриптов Python. О самом дистрибутиве и о том, как он «поселился» на моем EEE PC я расскажу позже, а пакет для Python 2.6.5 выложу прямо сейчас: http://peter.infosreda.com/python-2.6.5.tazpkg

По воле случая на последнем месте работы познакомился с каркасом для сбора данных с web сайтов Scrapy, который реализован на Python. Сфера его использования – сбор структурированных данных со страниц. И хотя его область применения достаточно широка и включает в себя мониторинг и автоматизированное тестирование, но использовали мы его по большей части для сбора информации с сайтов. О самом фреймворке я напишу позже. Сейчас же опишу одну проблему, с которой я столкнулся, реализую один проект «для себя».

Читать запись полностью »