Сделал таки обновленные версии пакетов для Ubuntu 9.10 (i386):
Читать далее…
У кого не работает Empathy (стандартный ныне мессанджер для GNOME), с сообщением
«<account number> network error»
то посмотрите сюда: https://bugzilla.gnome.org/show_bug.cgi?id=606471 и сюда https://bugs.launchpad.net/ubuntu/+source/empathy/+bug/462530
Судя по всему это заморочки с протоколами в команде разработчиков аськи. они как-то странно сделали, что в разных регионах и у разных UIN-ов может быть разное поведение. То есть у одного и того же чела может не коннектиться из России, зато коннектиться из Гамбурга к примеру. или наоборот, у двух соседей с разными номерами – у одного работает, у другого – нет. Причем на одном и том же софте.
У меня перестало коннектиться сегодня. Т.ч. если что-то кому-то от меня надо, то добро пожаловать в jabber / GTalk. Ну или сюда, на крайний случай.
В одном очень интересном проекте у нас использовался MySQL и Sphinx. Первый в качестве сервера баз данных. Вот только не нужно снобизма. Многие веб проекты его используют. Работает и ладно. Мы поддерживаем все базы данных, которые поддерживает Django. У нас data access layer взят из этого проекта.
Как всегда гром прогремел среди ясного неба. Перестала индексироваться база событий с ошибкой, ноги которой растут из MySQL:
indexer --all --rotate -c /home/vs/app/sphinx.conf
Sphinx 0.9.9-rc2 (r1785)
Copyright (c) 2001-2009, Andrew Aksyonoff
using config file '/home/vs/app/sphinx.conf'...
indexing index 'events_eventssphinx'...
ERROR: index 'events_eventssphinx': sql_query: Incorrect key file for table
'/tmp/#sql_15e2_1.MYI';
try to repair it (DSN=mysql://root:***@localhost:3306/scrapy).
total 0 docs, 0 bytes
total 368.361 sec, 0 bytes/sec, 0.00 docs/sec
total 0 reads, 0.000 sec, 0.0 kb/call avg, 0.0 msec/call avg
total 0 writes, 0.000 sec, 0.0 kb/call avg, 0.0 msec/call avg
Читать далее…

я - не бот!
Устроился на новую работу. Работаю уже чуть больше недели. Но вот с интернетом там – явная несвобода. Что-то есть, а по большей части – нет. Список ресурсов, которыми можно воспользоваться составлен по принципу: «Что не разрешено, то – запрещено». Как-то это неправильно. Особенно после неограниченного свободного и доступного интернета на предыдущем рабочем месте.
В общем приходится те источники информации, которые не разрешены «откапывать» через гугль. Обычно пользовался ссылкой на сохраненный в поисковике экземпляр страницы, но тут заметил, что после 12 часов и он перестает открываться с обвинением меня (вернее – всю сеть), в том, что я – бот. Обидно и несправедливо и даже капчу нигде не ввести
.
Но ничего. Я притащил свой старый Eee PC 701 с интернет GPRS модемом и теперь читаю все что мне нужно на нем. Можно попробовать пробить себе «правильный интернет», но ни желания ни уверенности в успехе нет.
Можно еще воспользоваться преобразователем интернет страниц для мобильных устройств. От той же «корпорации зла», что и поисковик, но как-то там все убого. Кому надо, делаете так: http://www.google.com/gwt/n?u=http://bash.org.ru , где bash.org.ru заменяете на url того сайта, который вам нужен.
А еще я тут думаю чем бы обработать более чем 2 миллиарда записей в сутки, но это уже совсем другая история
.
По воле случая на последнем месте работы познакомился с каркасом для сбора данных с web сайтов Scrapy, который реализован на Python. Сфера его использования – сбор структурированных данных со страниц. И хотя его область применения достаточно широка и включает в себя мониторинг и автоматизированное тестирование, но использовали мы его по большей части для сбора информации с сайтов. О самом фреймворке я напишу позже. Сейчас же опишу одну проблему, с которой я столкнулся, реализую один проект «для себя».
Читать далее…

Спер у знакомого. Прости, Леха!
Комментарии