チャンク

チャンク

このエントリーをはてなブックマークに追加
最終更新日 2016-12-31

XmlLite は、大きなデータを読み込む際のメモリ使用量を制限するために、 データを分割して読み込むチャンクという仕組みを用意しています。

次に示すのは、XML を分割して読み込む例です。 あらかじめ sample.xml というファイルをプログラムと同じフォルダに用意しておき、 XML を読み込んだ結果をメッセージボックスに表示します。なお、分割した各文字列は [ ] で囲んで表示します。

プロジェクトファイル ダウンロード

// sample.xml
<?xml version="1.0" encoding="UTF-8"?>
<sample>
  <requirement>
    <type>ヘッダ</type>
    <name>XmlLite.h</name>
  </requirement>
  <requirement>
    <type>ライブラリ</type>
    <name>XmlLite.lib</name>
  </requirement>
</sample>
// stdafx.h
#pragma once

#include "targetver.h"

#define WIN32_LEAN_AND_MEAN
#define _ATL_CSTRING_EXPLICIT_CONSTRUCTORS

#include <atlbase.h>  // CComPtrを使用するため
#include <atlstr.h>   // CStringを使用するため

#include <xmllite.h>
#pragma comment(lib, "xmllite.lib")
// SampleProject.cpp
#include "stdafx.h"

void Run()
{
    CComPtr<IXmlReader> pReader;
    if(FAILED(CreateXmlReader(__uuidof(IXmlReader), reinterpret_cast<void**>(&pReader), 0))){
        MessageBox(NULL, _T("CreateXmlReader失敗"), _T("警告"), MB_OK | MB_ICONWARNING);
        return;
    }

    // XMLファイルパス作成
    TCHAR xml[MAX_PATH];
    GetModuleFileName(NULL, xml, sizeof(xml) / sizeof(TCHAR));
    PathRemoveFileSpec(xml);
    PathAppend(xml, _T("sample.xml"));

    // ファイルストリーム作成
    CComPtr<IStream> pStream;
    if(FAILED(SHCreateStreamOnFile(xml, STGM_READ, &pStream))){
        MessageBox(NULL, _T("SHCreateStreamOnFile失敗"), _T("警告"), MB_OK | MB_ICONWARNING);
        return;
    }

    if(FAILED(pReader->SetInput(pStream))){
        MessageBox(NULL, _T("SetInput失敗"), _T("警告"), MB_OK | MB_ICONWARNING);
        return;
    }

    CString result;
    LPCWSTR pwszLocalName;
    XmlNodeType nodeType;
    while(S_OK == pReader->Read(&nodeType)){
        switch(nodeType){
        case XmlNodeType_Element:
            if(FAILED(pReader->GetLocalName(&pwszLocalName, NULL))){
                MessageBox(NULL, _T("GetLocalName失敗"), _T("警告"), MB_OK | MB_ICONWARNING);
                return;
            }
            break;
        case XmlNodeType_Text:
            // 4文字ずつ読み込む
            CString value;
            const UINT buffSize = 5;  // 4文字 + 終端null文字
            WCHAR buff[buffSize];
            UINT charsRead;
            while(true){
                HRESULT hr = pReader->ReadValueChunk(buff, buffSize - 1, &charsRead);
                if(S_FALSE == hr || 0 == charsRead){
                    break;
                }
                if(S_OK != hr){
                    MessageBox(NULL, _T("ReadValueChunk失敗"), _T("警告"), MB_OK | MB_ICONWARNING);
                    return;
                }
                buff[charsRead] = L'\0';
                CString tmp;
                tmp.Format(_T("[%s]"), buff);
                value += tmp;
            }

            CString row;
            if(lstrcmp(pwszLocalName, _T("type")) == 0){
                row.Format(_T("種類:%s\n"), value);
            }else if(lstrcmp(pwszLocalName, _T("name")) == 0){
                row.Format(_T("名前:%s\n\n"), value);
            }
            result += row;
            break;
        }
    }

    MessageBox(NULL, result, _T("結果"), MB_OK | MB_ICONINFORMATION);
}

int APIENTRY _tWinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPTSTR lpCmdLine, int nCmdShow)
{
    UNREFERENCED_PARAMETER(hPrevInstance);
    UNREFERENCED_PARAMETER(lpCmdLine);

    Run();

    return 0;
}

データを分割して読み込むためには、IXmlReader::GetValue() の代わりに IXmlReader::ReadValueChunk() を呼び出します。 IXmlReader::ReadValueChunk() の引数は順に、分割した文字列を読み込むバッファ、分割サイズ、読み込んだ文字数です。 IXmlReader::ReadValueChunk() は Unicode を扱うため、今回の例では日本語もアルファベットも4文字で分割します。