понедельник, 22 февраля 2010 г.

Wiki на Linux.ru.

Уважаемый Roger DeeGreeze, путем убеждения с использованием Jabber, сагитировал меня учавствовать в создании Wiki на сём замечательном ресурсе, членом редакции которого он является.

Пока что совместными усилиямии пилим статью о Linux дистрибутивах, и там уже можно что-то почитать. Будем надеяться проект получит дальнейшую поддержку.

воскресенье, 21 февраля 2010 г.

Установка mediawiki на локальную машину.

Зачем?
Решил начать бороться с бардаком в over 9000 различных текстовых заметках, todo списках, дневниках и т.п. Для этого выбрал радикальный подход, несколько напоминающий вскапывание грядки экскаватором: установил на локальную машину Mediawiki.

Как?
Первым делом устанавливаем необходимые пакеты:
sudo pacman -Sy mediawiki apache php mysql texvc php-apache
Добавляем в /etc/httpd/conf/httpd.conf следующие строки:
LoadModule php5_module modules/libphp5.so
# PHP5
Include conf/extra/php5_module.conf
Кроме того в файле /etc/php/php.ini необходимо раскомментировать следующую строку:
;extension=mysql.so
Запускаем необходимых демонов:
sudo /etc/rc.d/httpd start sudo /etc/rc.d/mysqld start
Проверяем всё ли работает: вводим в адресную строку браузера: http://localhost/mediawiki
Если видим не голый текст, а заглавную страницу, значит всё в порядке. Далее переходим по ссылке на этой странице, и заполняем форму, для первичной конфигурации.
Важный момент. Для того чтобы установить пароль root для mysql в консоли вбиваем
$ mysqladmin -u root password пароль_который мы устанавливаем
Далее вбиваем этот пароль в соответствующее поле web формы. Если всё сделано правильно, то при нажатии кнопки внизу страницы, наше вики будет сгенерировано. После этого останется сделать
sudo mv /srv/http/mediawiki/config/LocalSettings.php /srv/http/mediawiki/
И можно пользоваться.

Tips & Tricks
Чтобы включить возможность простановки ссылок на файлы локальной машины. В файле настроек /srv/http/mediawiki/LocalSettings.php дописываем параметр:
 $wgRawHtml = true;
После этого ссылки на локальный контент проставляются следующим образом: <html> <a href="file://путь_к_папке_или_файлу">Текст ссылки</a> </html> Громоздко, но всё же.
Также для использования формул TeX, неплохо присвоить параметру $wgUseTeX значение "true"
Также знающие люди подсказывают, что во избежание подключений извне, к уютненькой домашней википедии, следует исправить следующую часть httpd.conf
#Listen 12.34.56.78:80 Listen 80 на Listen localhost:8080
Сам не проверял, ибо сижу за роутером, который отпинывает таких гостей. Но может кому надо.
Файлы домашней вики располагаются в папке /srv/http/mediawiki их неплохо бы забекапить.

Полезные ссылки.
Статья, с несколько устаревшей инфой, ставшая отправной точкой для плясок с бубном.
Заметка в Арч Вики по настройке Apache, MySQL, PHP.

воскресенье, 14 февраля 2010 г.

Nepomuk

А всё же Nepomuk можно использовать, если вырубить службу индексирования. Присвоение метатегов файлам это уже killer feature, хотя пока очень-очень сыро.

среда, 3 февраля 2010 г.

Зеркала. Хозяйке на заметку.

При выбора зеркала основных репозиториев, не следует ориентироваться на географическую близость, в первую очередь.
Гораздо полещнее параметр "задержки синхронизации", ну и время отклика, конечно. Посмотреть можно тут.
Сменил yandex.ru на giantix-server.de, и доволен.

понедельник, 1 февраля 2010 г.

OCR в Linux

Ещё пару лет назад, тему данного поста можно было раскрытьодним предложением: "Приложений OCR в Linux нет".

В интернетах уже давно встречаются сообщения о существовании Finereader Engine for Linux, однако юзабельного Finereader'а нет. Также говорят некоторые люди запускали FR под wine. Лично у меня это не вышло. В итоге у меня он сидит под виртуальной машиной с ХР.

Однако дело всё же сдвинулось с мёртвой точки.
Явление №1 "Cognitive Technologies открыла код OCR Cuneiform" Лицензия BSD.
Явление №2 Программист Андрей Боровский написал для Cuneiform GUI, под названием YAGF. Вот такой:


Установка YAGF в Arc Linux делается, как обычно, в одну комманду: yaourt -S yagf, что мною и было проделано. После того как я его погонял немного, пришёл к следующему итогу:
Умеет:
  • Таки распознаёт русский текст, и неплохо.
  • Можно выделить область распознавания.
  • Распознаёт текст со сложным форматированием (колонки, картинки) в правильной последовательности.
Не умеет:
  • Распознавать скриншоты. Только сканированный текст, с разрешением около 300 dpi (если честно, сканировать с меньшим разрешением я не пробовал).
  • Сохранять форматирование: таблицы/колонки превращаются в plain text.
  • Выделять несколько блоков для распознавания. Можно задать только один блок. Вариант: тут распознаём, тут нет, а тут опять распознаём, отсутствует.
  • Экспорт в форматы отличные от html/txt.
  • Распознавание pdf/djvu.
  • И много чего ещё.
Вывод такой: конечно сравнивать это с Finereader, всё равно что сравнивать paint с Adobe Photoshop. Потому Finereader я сносить покамест не буду. Но всё равно можно порадоваться, что для простых задач у нас пооявился OCR инструмент не требующий бубна.

P.S. Сайт разработчика: http://symmetrica.net/