Регулярные выражения: где ангелы боятся протектора

Я только начал изучать регулярные выражения в PHP, но я испытываю страшное время после некоторых уроков в WWW и, похоже, не нашел ничего, что могло бы удовлетворить мои текущие потребности. Возможно, я слишком многому научился. Этот аспект PHP для меня совершенно незначителен.

То, что я пытаюсь создать, является регулярным выражением для замены всего кода HTML между n-м вхождением <TAG> и </ TAG> с любым кодом, который я выбираю.

Моя конечная цель – создать интернет-фильтр в PHP, через который я могу просматривать веб-страницу, лишенную определенного контента (или замененного санированным контентом) между любым указанным набором тегов <TAG> … </ TAG> на странице, где <TAG> … </ TAG> представляет любые допустимые парные теги HTML, такие как <B> … </ B> или <SPAN> … </ SPAN> или <DIV> … </ DIV> и т. Д. И т. Д.

Например, если страница имеет порно объявление, содержащееся в 5 <DIV> … </ DIV> блок в пределах страницы, то, что регулярное выражение может быть использовано для выявления и заменить этот код с чем-то еще, например, XXXXXXX, но только 5-й блок <DIV> внутри страницы и ничего больше?

Вся веб-страница содержится в одной текстовой строке, и отфильтрованный результат также должен быть отдельной строкой текста.

Я не уверен, но я думаю, что код для этого может иметь формат, похожий на:

$FilteredPage = preg_replace("REG EXPRESSION", "xxxxxxxx", $OriginalPage); 

«REG EXPRESSION» для вызова – это то, что мне нужно знать, а «xxxxxxxx» представляет текст для замены кода между тегами, нацеленными на «REG EXPRESSION».

Регулярные выражения – это, очевидно, работа сатаны!

Любые общие предложения или, возможно, несколько рабочих примеров, которые я мог бы изучить и экспериментировать, были бы весьма признательны.

Спасибо, Джей

Related of "Регулярные выражения: где ангелы боятся протектора"