Я пытался понять документацию MediaWiki за последние 2 дня, и я не могу понять, как получить первый абзац статьи в Википедии через MediaWiki API. Может ли кто-нибудь указать мне в правильном направлении? Я собираюсь обратиться к file_get_contents, но я уверен, что есть «более чистое» решение.
Это вопрос, который немного сложно выполнить, но я сделаю все возможное, чтобы объяснить это. Во-первых, позвольте мне привести примерную страницу: http://en.wikipedia.org/wiki/African_bush_elephant Это страница википедии, специальная страница, в частности, поскольку она имеет «таксобокс» справа. Я пытаюсь проанализировать атрибуты в этом taxobox с помощью PHP. В Википедии есть два способа создать такой таксобокс: вручную или с помощью […]
Используя PHP, есть ли хороший способ получить (проанализированное) введение только со страницы wikipedia? У меня есть текущие методы: Первый заключается в вызове страницы api и возврате, затем вызовите парсер Wiki при введении, которое я вытащил из первого запроса (два запроса, извлечение вставки из текста тоже не очень). Во-вторых, вызывать весь синтаксический анализатор страницы и использовать […]
Я разбираю инфобокс википедии, и я заметил, что в некоторых инфобоксах есть поля изображений – эти поля содержат имена файлов изображений, спрятанных в wikipedia где-то. Однако они просто содержат имя файла, как в отличие от фактической ссылки. Я проверил ссылки изображений на реальных живых инфобоксах, и ссылки, похоже, не из одного источника, но источники меняются. […]
Хорошо, вот что мне нужно: У нас есть полный XML-файл статьи в Википедии Нам нужен только раздел Infobox Я пробовал разные вещи, но моя основная проблема, похоже, не в состоянии сопоставить «внутренние» фигурные скобки. Любые идеи (или любое регулярное выражение, которое вам удалось сделать?) Для тех из вас, кто не знает, о чем я говорю, […]
Я все еще придерживаюсь своей проблемы, пытаясь разобрать статьи из Википедии. На самом деле, я хочу разобрать секцию статей из Википедии, то есть в моей заявке есть ссылки на страны и на каждой странице страны, на которой я хотел бы показать инфобокс, который находится в соответствующей статье википедии этой страны. Я использую php здесь – […]