Articles of regex

Regex для удаления котировок вокруг атрибутов, когда это возможно

Я ищу регулярное выражение, работая с PHP, для очистки (и минимизации) кода HTML. Вот пример тега HTML: <meta name="viewport" content="width=device-width, initial-scale=1" > И исключенный результат: <meta name=viewport content="width=device-width, initial-scale=1" > Другой пример : <img src="picture.png" alt="Picture" width="800" height="20"/> И исключенный результат: <img src="picture.png" alt=Picture width=800 height=20/> Я уже использую этот класс: https://github.com/mrclay/minify/blob/master/lib/Minify/HTML.php Но функция, которую […]

Поиск прикрепления, h / li / ul теги

Мне нужно проверить (не обязательно возвращать), если определенный текст содержит любые типы вложений, h теги, теги li или теги ul. Мои знания о регулярном выражении действительно бедны. Я нашел следующие фрагменты кода на этом сайте preg_match_all('/<a\s[^>]*href=([\"\']??)([^\" >]*?)\\1[^>]*>(.*)<\/a>/siU', $text, $matches); отлично работать и возвращать все вложения, прикрепленные к тексту. Как мне добавить h / li / […]

Извлечение содержимого из каждого первого ТД в таблицу

У меня есть HTML, который выглядит так: <tr class="row-even"> <td align="center">abcde</td> <td align="center"><a href="deluserconfirm.html?user=abcde"><img src="../images/delete_x.gif" alt="Delete User" border="none" /></a></td> </tr> <tr class="row-odd"> <td align="center">efgh</td> <td align="center"><a href="deluserconfirm.html?user=efgh"><img src="../images/delete_x.gif" alt="Delete User" border="none" /></a></td> </tr> <tr class="row-even"> <td align="center">ijkl</td> <td align="center"><a href="deluserconfirm.html?user=ijkl"><img src="../images/delete_x.gif" alt="Delete User" border="none" /></a></td> </tr> И мне нужно получить значения, efgh , efgh и […]

Regex заменить слово, если оно не заключено в скобки

Я пытаюсь создать регулярное выражение, где оно заменяет слова, которые не заключены в скобки. Вот что я сейчас имею: $this->parsed = preg_replace('/\b(?<!\[)('.preg_quote($word).')\b/','[$1['.implode(",",array_unique($types)).']]',$this->parsed); Где $ word может быть одним из следующих: «Burkely Mayfair Trunk» или «Trunk». Это заменит предложение Это Burkely Mayfair Trunk довольно приятно для Это [Burkely Mayfair [Trunk [productname]] [productname] довольно приятно Хотя это […]

Как я могу извлечь или preg_replace китайские символы в строке?

В настоящее время у меня есть список строк, подобных этому 蘋果,香蕉,橙。 榴蓮, 啤梨 鳳爪,排骨,雞排 24個男,2個女,30個老人 То, что я хочу сделать, это просто взорвать все китайские и буквенно-цифровые символы из этих строк. Как я могу заменить все специальные символы, такие как 。 / " И пробелы с – или _ затем извлечь весь китайский символ с […]

Regex для извлечения всех URL-адресов, не содержащих определенную строку

Я использую API-интерфейс Google Analytics PHP и пытаюсь использовать его для извлечения наиболее популярных ссылок на моем сайте. Он работает, но он извлекает некоторые дубликаты из-за того, что он извлекает URL-адреса, содержащие строки запроса. Поэтому в основном, я хочу получить все ссылки, которые не содержат строку «? Start =» внутри них. Я думаю, что это […]

PHP RegEx не получит знак вопроса

Я пытаюсь сопоставить URL-адреса в строке, используя функцию PHP «preg_match_all». Он отлично работает, за исключением того, что он не будет соответствовать URL-адресам с вопросительными знаками. Например, это будет соответствовать штрафу: http://espn.com/mlb Но это не будет соответствовать: http://espn.com/mlb?player=71 Вот регулярное выражение, которое я использую, $regexUrl = "/(http|https|ftp|ftps)\:\/\/[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,3}(\/\S*)?/"; Я не могу понять, почему знак вопроса не подхвачен […]

Разметка разметки в абстрактном дереве синтаксиса с использованием регулярного выражения

Этот вопрос дополняет: Рекурсивная обработка разметки с использованием регулярного выражения и DOMDocument Код, предоставленный выбранным ответом, очень помог понять построение базового дерева синтаксиса. Однако теперь у меня возникают проблемы с ужесточением регулярных выражений, чтобы соответствовать только синтаксису, а не {. но не {{ . В идеале я бы хотел, чтобы он соответствовал только моему синтаксису: […]

.htaccess вызывает бесконечный цикл на реальном сервере, но работает на localhost

Я новичок .htaccess и регулярное выражение. У меня есть скрипт, который работает локально, но когда я загружаю его на живой сервер, он вызывает бесконечный цикл. Как я могу это исправить? На сайте, когда вы загружаете http://example.com если вы не аутентифицированы, вы http:///example.com/index.php http://example.com/auth/ для формы входа в систему, иначе он отображает содержимое http:///example.com/index.php . Он […]

Xpath Regex в PHP не работает

Вот мой XML, который возвращается: <?xml version="1.0" encoding="utf-8"?> <lists> <list> <id>6791</id> <title><![CDATA[List 1]]></title> <type>0</type> <priority>0</priority> <due><![CDATA[0000-00-00 00:00:00]]></due> <notes><![CDATA[]]></notes> <user_id>49211</user_id> <owner><![CDATA[]]></owner> <item1> <done>0</done> <title><![CDATA[Bamboo Montage-83 Knee High Studded Contrast Colored Zipper Riding Boot – Brown PU]]></title> <barcode>B00H2Y2UY6</barcode> <priority>2</priority> <item_id>57741</item_id> </item1> <item2> <done>0</done> <title><![CDATA[List 2]]></title> <barcode><![CDATA[]]></barcode> <priority>2</priority> <item_id>57751</item_id> </item2> <item3> <done>0</done> <title><![CDATA[List Item 1]]></title> <barcode><![CDATA[]]></barcode> <priority>2</priority> <item_id>57761</item_id> […]