Я пытался понять документацию MediaWiki за последние 2 дня, и я не могу понять, как получить первый абзац статьи в Википедии через MediaWiki API.
Может ли кто-нибудь указать мне в правильном направлении?
Я собираюсь обратиться к file_get_contents, но я уверен, что есть «более чистое» решение.
Не пытайтесь использовать необработанный API, вместо этого используйте клиентскую оболочку. Вот длинный список на выбор, все для PHP:
http://en.wikipedia.org/wiki/Wikipedia:PHP_bot_framework_table
file_get_contents довольно чистый, вы получаете код HTML. Затем вы можете проанализировать html-код с помощью DOMDocument. DOMDocument работает как javascript, вы можете получить все <p>
в div, например. Или возьмите первый.
например:
$html = file_get_contents('the url'); $dom = new DomDocument(); @$dom->loadHTML($html); $p = $dom->getElementsByTagName('p')->item(0)->nodeValue;