Linux Tips

暗号化されたWord文書をLinuxでテキストファイルに変換するには

北浦訓行
2006/10/5

 LinuxでWord文書をテキストファイルに変換するにはで、Word文書をテキストファイルに変換する方法を紹介した。しかし、暗号化されているWord文書をwvTextコマンドでテキストファイル化しようとすると、「Could not convert into HTML」というエラーメッセージが表示される。

 Word文書が暗号化してあるかどうかは、wvVersionコマンドで調べられる。

$ wvVersion tmp.doc
Version: word8 or higher, Encrypted: Yes

 wvTextコマンドには、暗号化されたWord文書をテキストファイルに変換する機能がないため、wvWareコマンドを使用する。しかしwvWareコマンドを使っても、デフォルトでは「暗号化されたWord文書のパスワードが必要」という旨のメッセージが表示される。

$ wvWare tmp.doc
Password required, this is an encrypted document

 そこで、-pオプションを使ってパスワードを指定する。

$ wvWare -p password tmp3.doc

 wvWareコマンドは、デフォルトではHTMLファイルへ変換する。wvWareコマンドでテキストファイルへ変換するには、テキストファイルへの変換規則が定義された/usr/share/wv/wvText.xmlを--configオプションで指定する。

$ wvWare -p password --config /usr/share/wv/wvText.xml tmp.doc

 ちなみに、wvWareにはほかにも以下の変換用定義ファイルが用意されている。

ファイル
変換形式
wvAbw.xml
AbiWord形式
wvCleanLaTeX.xml
CleanなLaTeX形式(LyXへのインポートなどに使用できるが開発途中)
wvDocbook.xml
DocBook形式
wvHtml.xml
HTML 4.0形式
wvLaTeX.xml
LaTeX形式
wvText.xml
テキスト形式
wvXml.xml
XML形式
wvWml.xml
WML形式

Linux Tips Index



 Linux Squareフォーラム Linux Tipsカテゴリ別インデックス
インストール/RPM ブート/ブートローダ
ファイル操作 環境設定
ユーザー管理 コンソール/ターミナル
X Window System セキュリティ
トラブルシューティング 他OS関係
ネットワーク ハードウェア
Webサーバ Samba
GNOME KDE
OpenOffice.org エミュレータ
ソフトウェア そのほか/FAQ
全Tips公開順インデックス Linux Tips月間ランキング
Linux Squareフォーラム全記事インデックス

MONOist組み込み開発フォーラムの中から、Linux関連記事を紹介します


Linux & OSS フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Linux & OSS 記事ランキング

本日 月間