Articles of parsing

как получить innerhtml по имени или имени, используя php

Привет, я загружаю контент из внешнего url. что-то вроде этого. $html=get_data($external_url); где get_data () – это функция для получения контента с использованием curl. теперь после этого я хочу получить внутренний html из разных html-элементов, таких как h1, div, p, span, используя их класс или id. например, если содержимое из внешнего url ($ html) является чем-то […]

Простой HTML DOM, возвращающий false

Я столкнулся с чем-то странным при использовании Simple HTML DOM для анализа веб-страницы с определенной строкой запроса. Некоторые строки запросов работают при попытке проанализировать эту страницу подержанного автомобиля на веб-сайте дилера, однако другие нет. Кажется, что всякий раз, когда на странице появляется больше транспортных средств, оно не будет возвращать HTML-содержимое (это означает, что если мы […]

Проблема с получением автора из RSS-ленты wordpress с использованием SimpleXmlElement

Хей, я пытаюсь разобрать RSS-канал из блога WordPress. Пока все работает так, как ожидалось, вот мой код <?php $feedUrl = "FEED URL"; $rawFeed = file_get_contents($feedUrl); $xml = new SimpleXmlElement($rawFeed); $channel = $xml->channel; $items = $channel->item; foreach($items as $item){ echo "<a href='".$item->link."'>".$item->title."</a>"; echo $item->description; echo $item->pubDate; } ?> Однако у меня, похоже, возникают проблемы с получением […]

Анализ PHP DOM для доступа к элементам внутри определенного идентификатора div

У меня есть несколько html: <div id="tvcap"> <div class="c" id="tads"> <ol> <li> <div class="vsc vsta"> <h3> <a id="pa1" href=""> </a> <a id="vpa1" href="http://www.link1.com"> Link 1 Text 1</a> </h3> <div> <div class="kv kva"> <cite> www.link1.com</cite> </div> </div> <span class="ac">Link 1 Text2</span> </div> </li> <li> <div class="vsc vsta"> <h3> <a id="pa2" href=""> </a> <a id="vpa2" href="http://www.link2.com">Link 2 […]

Анализ XML-файла с использованием php

Перефразируйте его. Вот мой код вместе с XML. Каждый раз, когда я пытаюсь выполнить print_r, он ничего не отражает. $portal = 'CaregiverPortal'; $userName = 'dxt3uyk27U3wRRrzaFGiwQ=='; $password = 'wD81PILmPuJX2fyFek937A=='; $url = "https://webapp.healthcaresynergy.com:8002/demoalpha/CaregiverPortalMobile/CaregiverPortalS ervice.svc?singleWsdl"; $option = array('trace' => 1 ); $xml = '<soapenv:Envelope xmlns:soapenv="http://schemas.xmlsoap.org/soap/envelope/">'. '<soapenv:Header/>'. '<soapenv:Body>'. '<LoginCaregiverPortal>'. '<userName>Anything</userName>'. '<password>Anything</password>'. '<portal>'.$portal.'</portal>'. '<caregiverID>'.$userName.'</caregiverID>'. '<timeStamp>'.$password.'</timeStamp>'. '</LoginCaregiverPortal>'. '</soapenv:Body>'. '</soapenv:Envelope>'; $client = […]

Как сделать эту функцию PHP для парсинга почти идеальной?

Эта функция отличная, но ее основным недостатком является то, что она не обрабатывает домены, заканчивающиеся на .co.uk или .com.au. Как его можно изменить, чтобы справиться с этим? function parseUrl($url) { $r = "^(?:(?P<scheme>\w+)://)?"; $r .= "(?:(?P<login>\w+):(?P<pass>\w+)@)?"; $r .= "(?P<host>(?:(?P<subdomain>[-\w\.]+)\.)?" . "(?P<domain>[-\w]+\.(?P<extension>\w+)))"; $r .= "(?::(?P<port>\d+))?"; $r .= "(?P<path>[\w/-]*/(?P<file>[\w-]+(?:\.\w+)?)?)?"; $r .= "(?:\?(?P<arg>[\w=&]+))?"; $r .= "(?:#(?P<anchor>\w+))?"; $r = […]

Проблемы с разбором объектов JSON

Мой сайт называет Spotify Web API и получает все публичные плейлисты для данного пользователя. Ответ первоначально в JSON, но мой код его декодирует. Следующее, что я хочу сделать для кода, – отображать только объекты [external_urls] , [name] и [tracks] для каждого элемента в ответе. Для этого я пробовал это: foreach($response_2['items'] as $item) { echo 'Link: […]

XML-анализ с помощью php

Я хотел бы создать новый упрощенный xml на основе существующего: (используя «simpleXml») <?xml version="1.0" encoding="UTF-8"?> <xls:XLS> <xls:RouteInstructionsList> <xls:RouteInstruction> <xls:Instruction>Start</xls:Instruction> </xls:RouteInstruction> </xls:RouteInstructionsList> <xls:RouteInstructionsList> <xls:RouteInstruction> <xls:Instruction>End</xls:Instruction> </xls:RouteInstruction> </xls:RouteInstructionsList> </xls:XLS> Поскольку в тегах элементов всегда есть двоеточия, он будет работать с «simpleXml», я попытался использовать следующую ссылку solution->. Как я могу создать новый xml с этой структурой: <main> […]

php – загрузить файл csv непосредственно в память, желательно без cURL

Это эквивалентно вопросу: Загрузите CSV прямо в Python CSV parser, но в php. В основном я ищу библиотеку, предлагающую интерфейс, способный делать то, что я делаю с python, всего лишь в нескольких строках кода: h = httplib2.Http('.cache') url = 'http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=' + code + '&region=AUS&culture=en_us&reportType='+ report + '&period=12&dataType=A&order=asc&columnYear=5&rounding=1&view=raw&productCode=usa&denominatorView=raw&number=1' headers, data = h.request(url) return data Мне нужно […]

Чтение простого текста из двоичного файла с помощью PHP

Файл 1: asdffdsa Файл 2: asdfjklfdsaHGUik Как читать эти двоичные файлы с PHP, чтобы я мог заполнить массив с помощью открытого текста, например: $file1_output = ["asdf", "fdsa"]; $file2_output = ["asdfjkl", "fdsaHGUik"];