Articles of lucene

Настройка Solr с использованием Java для модифицированного вывода?

Я разрабатываю приложение uaing Solr. Все идет хорошо, и я смотрю вперед, чтобы интегрировать Solr с CodeIgniter или некоторые другие рамки для интерфейса. Но есть проблема. Я выполняю некоторые вычисления на выходных строках, созданных Solr, и показывая их пользователям. Это действительно невозможно сделать в PHP (так как занимает очень много времени). У меня есть существующий […]

Zend Lucene: фатальная ошибка, максимальное время выполнения

Я написал базовый индексный скрипт для своего сайта и, похоже, работает … несколько. Он просматривает около 3/4 страниц, которые нужно индексировать, а затем выдавать эту ошибку: Неустранимая ошибка: максимальное время выполнения 0 секунд превышено в /Zend/Search/Lucene/Analysis/Analyzer.php в строке 166 Кажется, что каждый раз он повесился в другом месте. Я запустил его через минуту и ​​получил […]

Создание и обновление индексов Zend_Search_Lucene

Я использую Zend_Search_Lucene для создания индекса статей, который позволяет им искать на моем сайте. Всякий раз, когда администратор обновляет / создает / удаляет статью в области администратора, индекс перестраивается: $config = Zend_Registry::get("config"); $cache = $config->lucene->cache; $path = $cache . "/articles"; try { $index = Zend_Search_Lucene::open($path); } catch (Zend_Search_Lucene_Exception $e) { $index = Zend_Search_Lucene::create($path); } $model […]

Почти двойное обнаружение в Solr

Solr используется для поиска в базе данных, созданных пользователями. Эти списки импортируются в Solr из MySQL через DataImportHandler. Проблема. Довольно часто пользователи сообщают о том же листинге в базу данных, иногда с незначительными изменениями в своем листинговом сообщении, чтобы избежать простого обнаружения в виде дубликата сообщения. Как я должен реализовать обнаружение почти дублирования с помощью […]

Лучший способ справиться с ошибками в полнотекстовом поиске MySQL

У меня около 2000 строк в базе данных mysql. Каждая строка имеет максимум 300 символов и содержит предложение или два. Я использую mysql в полнотекстовом поиске для поиска этих строк. Я хотел бы добавить функцию, чтобы опечатки и случайные неправильные ошибки были исправлены, если это возможно. Например, если кто-то набирает «правильный shlder» в поисковом поле, […]

Zend_Search_Lucene против SOLR

Я вернулся в проект Zend Lucene из Lucene. У меня немного опыт работы с SOLR, поэтому я хотел бы знать, в чем разница между двумя из них, особенно с точки зрения производительности и установки. Насколько я знаю, SOLR требует, чтобы сервер Tomcat работал в веб-хостинге для работы, а что же с библиотекой Zend Lucene? Я […]

Использование совместно с Solr и Zends Lucene

Во второй половине дня, После моих приключений с Zend-Lucene-Search, и обнаружив, что это не все, что было сломано, когда вы индексируете большие массивы данных, я обратился к Солру (спасибо Биллу Карвину за это :)) У меня есть Solr, индексирующий db намного быстрее, и занимает чуть более 8 минут, чтобы индексировать таблицу чуть более 1,7 миллиона […]

сравнение производительности между Zend Lucene и Java Lucene

Zend Lucene и Java Lucene построены в PHP и java соответственно, а язык PHP имеет более высокий уровень, чем java. Просто интересно, насколько велика разница в производительности между этими двумя, в отношении построения индекса и поиска данных? Является ли более эффективным, чтобы позволить java создавать и восстанавливать индекс, и позволить php использовать индекс?

Lucene с PHP

Можно ли использовать Lucene с PHP? Я не хочу использовать Zend. Могу ли я использовать в родном PHP (не в фреймворке)?

php mysql fulltext search: lucene, sphinx, или?

Это, по общему признанию, похоже на (но не дубликат) Сравнение полнотекстовой поисковой системы – Lucene, Sphinx, Postgresql, MySQL? , однако то, что я ищу, является конкретным, поддерживаемым, рекомендациями из опыта работы с более чем одной из доступных систем (кажется, много: «Я использовал lucene, но не сфинкс», и Versa). Настройка: стандартная LAMP (Mysql 5.0, PHP 5). […]