【3/18〜】Amazon、VMwareが語る『クラウドの未来』 スラッシュドット    はてなブックマーク  Yahoo!ブックマークに登録  印刷
Windows TIPS
[Office master]
  Windows TIPS TOPへ
Windows TIPS全リストへ
内容別分類一覧へ

Word 2007の.DOCXファイルから高解像度の画像データを取り出す

―― .DOCXファイルをZIP形式に変換して内部を閲覧する ――

解説をスキップして操作方法を読む

デジタルアドバンテージ 打越 浩幸
2007/10/19
対象ソフトウェア
Office Word 2007
.DOCXファイルに画像データを貼り込むと、PNG形式で保存される。
.DOCXファイルの内部構造は、XMLベースのファイルをZIP形式で圧縮したものである。
画像データを取り出すためには、拡張子を.ZIPにして、エクスプローラで閲覧、コピーすればよい。

解説

 TIPS「Wordの.DOCファイルから高解像度の画像データを取り出す」では、Wordの.DOCファイルに含まれている高解像度のオリジナル画像データを.PNGファイルとして取り出す方法を紹介した。具体的には、ファイルをWebページとして保存し、そこに出力された.PNGファイルを読み出す方法であったが、同様の方法は(2007 Office systemファミリの)Word 2007でも可能である。Word 2007では従来の.DOCではなく、新しく.DOCXファイル形式が利用されているが、このファイルの内容を直接ブラウズすれば、いちいち保存し直さなくても画像データ・ファイルを取り出すことができる。本TIPSでは、この方法について解説する。

操作方法

 2007 Office systemでは新しくXMLベースのファイル形式が利用され、例えば.DOCではなく、.DOCXという拡張子のファイルが作成されるようになっている。このファイルは実はXMLベースのデータ(ファイル)を、ZIP形式でまとめて圧縮したものである。そのため、.DOCXファイルの内部をのぞくには、単に拡張子を.ZIPに変更するだけでよい。

 例えば、sample.docxというWord 2007のファイルがあった場合、これをsample.docx.zipなどというふうに、.ZIPという拡張子にリネームする。するとエクスプローラでそのまま内容をブラウズできるようになる。

.DOCXファイルを.ZIPファイルとしてブラウズする
.DOCXファイルの拡張子を.ZIPに変更すると、エクスプローラでそのまま内容を閲覧できる。内部には、XMLベースのファイルが多数保存されている。
「sample.docx」というファイルを「sample.docx.zip」にリネームすると、.ZIPファイルとして内部をブラウズできる。内部には階層的なフォルダやXMLファイルがいくつか保存されている。
このwordフォルダの中には、文書中のテキストや画像などのデータが保存されている。
このmediaフォルダの中に画像データが保存されている。
PNG形式で画像データが保存されている。元の文書ファイル中には画像ビットマップ・データが5つ貼り付けてあるので、.PNGファイルも5つある。

 リネームした.ZIPファイルの中には多数のファイルやフォルダがあるが、このうちword\mediaというフォルダに格納されている.PNGファイルが文書ファイル中の画像データである。以下は、上の画面にあるmediaフォルダを.ZIPファイルから取り出し、エクスプローラで見たところである(いったん取り出さないと、画像解像度情報などが表示されない)。

取り出したmediaフォルダの内容
先の.ZIPファイル中にあるmediaフォルダをコピーして取り出したところ。
取り出したmediaフォルダ。
全部で5つの.PNGファイルがある。
元は同じサイズの画像であるが、貼り付けた領域のサイズが異なるため、ファイル・サイズも異なっている。.DOCファイルの場合は、オリジナルの画像データはそのまま保存されていたので、割り付けた領域のサイズで、この.PNGファイルのサイズが変わることはない。
元の解像度は1024×768であったが、貼り付け後にリサイズして縮小すると、.DOCXファイル中の画像ファイルのサイズもリサイズされて小さくなる。そのため、後で拡大しても、元の高解像度データは得られない。

 ここには、5つの.PNGファイルが含まれているが、これが元の.DOCXファイル中に貼り付けてあった画像データのファイルである。Webページとして保存して取り出さなくても、このように直接画像ファイルを取得することができる。

縮小されたサイズの画像データに注意

 ただしこれらの.PNG画像ファイルは、文書中に貼り付けたオリジナルの画像の解像度ではなく、使用サイズ(文書中での割り付けサイズ)に応じて自動的に縮小/リサイズされている。上の例では、元々は1024×768の解像度のビットマップ・データを、サイズを縮小しながら5つ文書中に貼り付けているのだが、最終的には異なるサイズの.PNGファイルが作成されている。よって、.DOCXファイルから画像データを取り出しても、(貼り付けるサイズによっては)元の高解像度のデータはもう得られないことに注意していただきたい。いったん.DOCXとして保存すると、後で画像の割り付けサイズを拡大しても、もう元の解像度のデータには戻らない(.DOCXファイルのサイズが小さいのは、このように自動的に画像ファイルのリサイズなども行うからといえる)。

 これに対して以前のWordにおける.DOCファイルの場合は、オリジナル解像度のままのデータと、表示用の縮小データの2種類が保存されている。そのため、オリジナル・サイズの画像データを取り出すことができる。End of Article

この記事と関連性の高い別のWindows TIPS
Wordの.DOCファイルから高解像度の画像データを取り出す
互換機能パックを使ってOffice 2007のファイルを読み書きする
印刷時に不要な画像の表示を防ぐには(Outlook Express編)
Thumbs.dbファイルを作成しないようにする
IE 6でイメージが正しく表示されない
このリストは、(株)デジタルアドバンテージが開発した
自動関連記事探索システム Jigsaw(ジグソー) により自動抽出したものです。
generated by

「Windows TIPS」

ホワイトペーパーTechTargetジャパン

Windows Server Insider フォーラム 新着記事

@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

RSSフィード

スキルアップ/キャリアアップ(JOB@IT)

- PR -
- PR -

お勧め求人情報

キャリアアップ 〜JOB@IT
@IT Special -PR-
  TomcatやJBossなどAPサーバ環境に関する
情報を集約! “業務”用APサーバ大百科

New!
  一気に解説! 最新のクラスタストレージ
「RAIDを超えたストレージ基準」……など

New!
  クラウド的ユーザー体験の変化は脅威か?
仮想化技術を使いこなす運用管理術を紹介

New!

  上司や部下、部署内メンバーとの情報共有
を“ガラッ”と変えるコラボツールとは?

New!
  おばかアプリ選手権、第4弾開催中!!
ムダにカッコよくてくだらない作品求ム!

  社内ファイルサーバを“クラウド”に統合
VPN直結「クラウド型ストレージ」を紹介

  Twitterのアカウントはなぜ突破された?
メールによる新手の攻撃手法とその対策

  もう仮想化のお試しフェイズは終わりだ!
Hyper-V 2.0が基幹システムも仮想化

  美人!? まあまあ? 気になる いやし系!!
PV急増で「美人時計」がとった手段とは?

  クライアント企業から求められる人材
⇒IT技術と経営戦略を併せ持つ「戦略家」

  .NET編集長が実践する「技術情報検索術」
サンプル・コードを簡単に探す“技”は?

  業務効率と情報セキュリティ対策を両立!
手間なく確実に機密情報を守る方法とは?

  進化を続ける富士通ストレージETERNUS DX
製品開発者の自信を裏付けるものとは何か

  運用管理の課題を“2つの観点”から分析
ユーザー満足度の高い「仮想環境」とは?

  【CTC事例】約30の基幹システムを統合!
膨大なバッジジョブを制御した方法は?

  仮想化すればコストは削減できるか?
仮想化に必要な「3つの視点」を解説する

  その数、なんと400台以上! グループ内
サーバの「統合管理」によるメリットは?