Intereting Posts
Поиск символов в строке, которая встречается только один раз Созданный Symfony Bundle не работает Вход в Google OAuth2 – получите ник и реальный адрес электронной почты YouTube как получить константы из класса, исключая все константы, которые могли произойти от родителей? синхронизировать удаленную базу данных (mysql) с базой данных sqlite и наоборот Использование PHP для удаления элемента html из строки Как назначить роль PHP в Drupal? Как получить данные массива $ _FILES, как и после отправки формы в следующем сценарии? Является ли добавление PHP уязвимым для SQL-инъекции? Поддерживает ли PHP шаблон RAII? Как? Захват WooCommerce для действий «после оплаты» Отправка правильного типа содержимого JSON для CakePHP Отправить параметр на сервер из приложения Android Уведомление о добавлении новой записи в базу данных php-jquery как удалить parsererror: SyntaxError: Неожиданный токен <в JSON в позиции 0

Проектные мысли: поиск справочника PDF-файлов

Чтобы предисловие к этому, я знаю, что в разных местах есть дискуссии об этом. Половина того, что я прочитал, устарела, глючит или просто не связана с моей ситуацией.

Вот почему я привожу его в сообщество, которое, как я знаю, будет иметь ответы.

Вопрос: У меня есть каталог (он-лайн идеально) около 70 000 страниц в документах PDF (документы варьируются от 20 до 100 страниц, до 70 000 страниц).

Я ищу метод, сценарий или идею для самого простого способа поиска этих PDF-файлов для продуктов. Все файлы PDF имеют текстовый слой, созданный OCR в Acrobat.

Любые идеи , будь то сложные или изобретательные, более чем приветствуются.