подсчет слов с помощью класса domDocument

Как я могу подсчитать слова на странице html с domDocument?

например, если входной сигнал выглядит примерно так:

<div> Hello something open. <a href="open.php">click</a> lorem ipsum <a href="open.php">here></a> 

выход:
Числовое слово
1 Привет
2 что-то
3 открытых
4 щелчка
5 лорам
6 ipsum
7 здесь.

А что, если мне нужен только linktext?
щелкните 4
здесь 7

Related of "подсчет слов с помощью класса domDocument"

Если вам нужно это для всего документа, скорее всего, просто просто strip_tags а затем запустите str_word_count в результате.

Если вам нужно сделать это с помощью DOM, вы можете сделать

 $str = <<< HTML <div> Hello something open. <a href="open.php">click</a> lorem ipsum <a href="open.php">here></a></div> HTML; $dom = new DOMDocument; $dom->loadHTML($str); $xpath = new DOMXPath($dom); $nodes = $xpath->query('//text()'); $textNodeContent = ''; foreach($nodes as $node) { $textNodeContent .= " $node->nodeValue"; } print_r(str_word_count( $textNodeContent, 1 )); 

Использование text() в качестве выражения XPath даст вам только text() поля в документе. Вы можете ограничить это, чтобы просто вернуть тексты ссылок с помощью //a/text() для выражения.