.xml.gz mit PugiXML und boost::iostreams parsen

English Deutsch

In unserem vorherigen Beitrag Minimales PugiXML-Datei-Lese-Beispiel haben wir ein kurzes Beispiel gezeigt, wie man aus einer unkomprimierten XML-Datei mit PugiXML liest. In der Praxis werden viele große XML-Dateien als .xml.gz-Paket vertrieben.

Da Sie boost::iostreams verwenden können, um gzip-komprimierte Daten on-the-fly zu dekomprimieren und direkt an PugiXML weiterzuleiten, müssen Sie die unkomprimierten Daten nicht auf Ihrer Festplatte speichern.

pugixml_piped_gz.cpp
#include <iostream>
#include <fstream>
#include <pugixml.hpp>
#include <boost/iostreams/filtering_streambuf.hpp>
#include <boost/iostreams/copy.hpp>
#include <boost/iostreams/filter/gzip.hpp>
using namespace std;
using namespace pugi;

int main() {
    // "Rohe" gzip-komprimierte Datenstrom öffnen
    ifstream file("test.xml.gz", ios_base::in | ios_base::binary);
    // Dekompressionsfilter konfigurieren
    boost::iostreams::filtering_streambuf<boost::iostreams::input> inbuf;
    inbuf.push(boost::iostreams::gzip_decompressor());
    inbuf.push(file);
    //Streambuf in istream umwandeln
    istream instream(&inbuf);
    // Aus Stream parsen
    xml_document doc;
    xml_parse_result result = doc.load(instream);
    // Inhalt des Wurzelelements ausgeben
    cout << "Load result: " << result.description() << "\n"
         << doc.child("root-element").child_value() // "Test text"
         << endl;
}
CMakeLists.txt
ccmake_minimum_required(VERSION 3.0)
find_package(Boost 1.36.0 COMPONENTS iostreams)

include_directories(${Boost_INCLUDE_DIRS})
add_executable(pugixml-example pugixml-example.cpp)
target_link_libraries(pugixml-example pugixml ${Boost_LIBRARIES})
test.xml
<?xml version="1.0" encoding="UTF-8"?>
<root-element>Test text</root-element>

Laden Sie alle drei Dateien herunter und führen Sie dann

build_and_run.sh
gzip test.xml
cmake .
make
./pugixml-example

Sie sollten eine Ausgabe wie

pugixml_output.txt
Load result: No error
Test text

Check out similar posts by category: Boost, C/C++