О web-разработке
и даже немного больше...

Парсинг XML в PHP

XML универсальный язык разметки данных, и на сегодняшний день широко используется для обмена данными между различными системами. На практике довольно часто требуется работать с XML файлами, парсить различного рода информацию из XML-файлов. После чего информацию можно записывать в базу данных, либо выполнять какие-либо операции с данными. Существуют множество различных стандартов XML для обмена данными, и целесообразно иметь библиотеку для упрощения работы с подобными типами данных.

Начиная с PHP 5 версии появилось расширение SimpleXML, которое в значительной степени помогает работать с XML фидами, и упрощает этот процесс. Как правило на хостингах расширение SimpleXML включено по умолчанию, поэтому выполнять каких-либо манипуляций с настройками хостинга вам не придётся.

Рассмотрим пример парсинга XML файла, для наглядности возьмём фид для Яндекс.Маркета, оформленный по стандарту YML.

Парсинг фида Яндекс.Маркета

Создаём пустой файл, с именем YML_sample.xml, добавляем в него следующее содержимое.

001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030
031
032
033
034
035
036
037
038
039
040
041
042
043
044
045
046
047
048
049
050
051
052
053
054
055
056
057
058
059
060
061
062
063
064
065
066
067
068
069
070
071
072
073
074
075
076
077
078
079
080
081
082
083
084
085
086
087
088
089
090
091
092
093
094
095
096
097
098
099
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
<?xml version="1.0" encoding="UTF-8"?>
<yml_catalog date="2019-11-01 17:22">
    <shop>
        <name>BestSeller</name>
        <company>Tne Best inc.</company>
        <url>http://best.seller.ru</url>
        <platform>uCoz</platform>
        <version>1.0</version>
        <agency>Технологичные решения</agency>
        <email>example-email@gmail.com</email>
        <currencies>
            <currency id="RUR" rate="1"/>
            <currency id="USD" rate="60"/>
        </currencies>
        <categories>
            <category id="1">Бытовая техника</category>
            <category id="10" parentId="1">Мелкая техника для кухни</category>
            <category id="101" parentId="10">Сэндвичницы и приборы для выпечки</category>
        </categories>
        <delivery-options>
            <option cost="200" days="1"/>
        </delivery-options>
        <pickup-options>
            <option cost="200" days="1"/>
        </pickup-options>
        <offers>
            <offer id="9012" bid="80">
                <name>Мороженица Brand 3811</name>
                <vendor>Brand</vendor>
                <vendorCode>A1234567B</vendorCode>
                <url>http://best.seller.ru/product_page.asp?pid=12345</url>
                <price>8990</price>
                <oldprice>9990</oldprice>
                <enable_auto_discounts>true</enable_auto_discounts>
                <currencyId>RUR</currencyId>
                <categoryId>101</categoryId>
                <picture>http://best.seller.ru/img/model_12345.jpg</picture>
                <delivery>true</delivery>
                <pickup>true</pickup>
                <delivery-options>
                    <option cost="300" days="1" order-before="18"/>
                </delivery-options>
                <pickup-options>
                    <option cost="300" days="1-3"/>                       
                </pickup-options>
                <store>true</store>
                <description>
                    <![CDATA[         
                        <h3>Мороженица Brand 3811</h3>
                        <p>Это прибор, который придётся по вкусу всем любителям десертов и сладостей, ведь с его помощью вы сможете делать вкусное домашнее мороженое из натуральных ингредиентов.</p>
                ]]>
                </description>               
                <sales_notes>Необходима предоплата.</sales_notes>
                <manufacturer_warranty>true</manufacturer_warranty>
                <country_of_origin>Китай</country_of_origin>
                <barcode>4601546021298</barcode>
                <param name="Цвет">белый</param>
                <condition type="likenew">
                    <reason>Повреждена упаковка</reason>
                </condition>               
                <credit-template id="20034"/>
                <weight>3.6</weight>
                <dimensions>20.1/20.551/22.5</dimensions>
                </offer>
            <offer id="12346" type="vendor.model" bid="60">
                <typePrefix>Сэндвичница</typePrefix>                           
                <vendor>Brand</vendor>
                <model>K220Y9</model>   
                <vendorCode>A1234567B</vendorCode>
                <url>http://best.seller.ru/product_page.asp?pid=12345</url>
                <price>1099</price>
                <oldprice>1399</oldprice>
                <enable_auto_discounts>false</enable_auto_discounts>
                <currencyId>RUR</currencyId>
                <categoryId>101</categoryId>
                <picture>http://best.seller.ru/img/device56789.jpg</picture>               
                <delivery>false</delivery>
                <pickup>true</pickup>
                <pickup-options>
                    <option cost="350" days="1" order-before="12"/>                       
                </pickup-options>               
                <param name="Мощность">750 Вт</param>
                <description>Сэндвичница 2 в 1: можно приготовить как сэндвичи, так и вафли.</description>
                <sales_notes>Наличные, Visa/Mastercard, б/н расчет</sales_notes>
                <store>false</store>
                <manufacturer_warranty>true</manufacturer_warranty>
                <country_of_origin>Россия</country_of_origin>
                <barcode>9876543210</barcode
                <weight>1.03</weight
                <dimensions>20.800/23.500/9.000</dimensions>
            </offer>
        </offers>
        <gifts>
            <gift id="33">
                <name>Кружка 300 мл Brand 16</name>
                <picture>https://best.seller.ru/promos/33.jpg</picture>
            </gift>           
        </gifts>
        <promos>
            <promo id="PromoGift" type="gift with purchase">
                <start-date>2020-02-01 09:00:00</start-date>
                <end-date>2020-03-01 22:00:00</end-date>
                <description>Купите бытовую технику марки Brand и получите кружку в подарок.</description>
                <url>http://best.seller.ru/promos/gift</url>
                <purchase>
                    <product offer-id="9012"/>
                    <product offer-id="12346"/>
                </purchase>
                <promo-gifts>
                    <promo-gift offer-id="9012"/>
                    <promo-gift gift-id="33"/>
                </promo-gifts>
            </promo>
        </promos>
    </shop>
</yml_catalog>

Не смотря на сложность ветвления узлов в файле фида, работать с ним можно довольно просто. Давайте теперь создадим PHP-скрипт, который будет получать данные из файла фида.

1
2
3
4
$feedObj = simplexml_load_file("YML_sample.xml");
echo '<pre>';
    print_r ($feedObj);
echo '</pre>';

В переменную $feedObj попадает объект, который содержит все узлы фида. Имея объект в качестве значения переменной, мы можем работать с ним согласно синтаксису PHP. К примеру, мы может перебрать все товарные предложения в цикле foreach:

1
2
3
4
5
6
$feedObj = simplexml_load_file("YML_sample.xml");
foreach ($feedObj->shop->offers->offer as $offer){
    echo '<pre>';
        print_r ($offer);
    echo '</pre>';
}

Аналогичным образом можно работать и с другими узлами в документе. Стоит помнить один важный момент. При работе с большими объемами данных XML файла, всё это дело будет занимать больше времени на обработку, по этой причине нужно внимательно подходить к использованию SimpleXML. Ранее на нашем сайте публиковался пост, показывающий парсинг курса валют с удалённого ресурса банка. В том примере так же используется расширение SimpleXML.
На этом у меня всё, надеюсь материал оказался полезным!

Опубликован: 26.06.2020 г.

См. также:

Редакторы кода для PHP
Как просмотреть время загрузки страницы в PHP?
Генерация QR-кода в PHP
Загрузка файлов на сервер посредством Ajax
Импорт записей из Excel в WordPress
Установка IonCube на XAMPP
Создание PDF файлов в PHP
Как сделать мобильную версию сайта на Битрикс?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *