кто-нибудь знает, как генерировать выдержку из любой страницы статьи (так что может быть источником из многих типов сайтов)? Что-то вроде того, что делает facebook, когда вы вставляете URL-адрес в сообщение. Спасибо.
То, что вы хотите сделать, называется веб-соскабливанием . Основным методом для этого было бы захват страницы (вы можете очистить URL-адрес с помощью file_get_contents
), а затем каким-то образом проанализировать его для контента, который вы хотите (т. Е. Вытащите контент из <body>
).
Чтобы проанализировать возвращаемый HTML, вы должны использовать парсер DOM. PHP имеет свои собственные классы DOM, которые вы можете использовать.
Вот видео-учебник о том, как это сделать:
http://net.tutsplus.com/tutorials/php/how-to-create-blog-excerpts-with-php/