- - PR -
日本語のタグについて
1
投稿者 | 投稿内容 | ||||
---|---|---|---|---|---|
|
投稿日時: 2002-08-20 17:22
はじめまして。XML初心者です。
みなさまのお力を借りたくて書き込みしました。 XML+XSLTからHTMLに変換する作業をすることになり、 いろいろと入門書等を読みあさっているのですが、 XMLのタグ名に日本語が使用できると書いてあります。 しかし文字化け等が心配です。 本当に日本語を使用して大丈夫でしょうか? 一般的にはあまり日本語は使用しないものなのでしょうか? ちなみに開発環境は Windows2000、IE5.5SP2、msxml3.0です。 HTML変換はmsxsl.exeを使用する予定です。 よろしくお願いします。 | ||||
|
投稿日時: 2002-08-20 18:41
ご苦労様です。
個人的な経験からですが、日本語のタグ名は使わないようにしています。最初のころに よくやってしまったのが、XMLの文字コード指定で <?xml version="1.0" encoding="Shift_JIS"?> としているのに、文字コードをEUCやUTF-8で保存してしまったままXMLプロセッサに渡 してしまい、タグが認識されなかったことがありました。特に、参考にしようとサンプ ルファイルを開いて編集したら、元のファイルがUTF-8なのに先程の宣言を書いてしま ったりするとなりました。それと、EUCコードとShift_JISを同じに扱っていると、 ’表’などの漢字を使った部分の処理が上手く行かなくなったりすることもありました。 この手のトラブルは未然に防ぐという意味では、半角英数使うのがいいとは思うのです が、しばらくやってきて思うことは、適切な英単語が分からないままタグを使っている と、後々意味合い的に矛盾する構成になったXMLになってしまうことがあるということ です。変換ができないわけではないのですが、XMLフォーマットとしては残ってしまうの 、恥ずかしいといつまでも思いつづけなければならないのは辛いですよー。あと、聞い たことも無いような英単語を使ったはいいけど、後で意味がわからなくなってしまった り。ローマ字を使おうかなーと、真面目に思ってます。(;_;) ちょっと脱線してしまいましたが、タグの意味を表現するには最適だけれども、処理系 のことなどを注意しながら使うか、トラブルの元を未然に防ぐ方を取って、半角英数に するかで決めるのはどうでしょうか。 お互い、XMLのお勉強を頑張りましょう。 | ||||
|
投稿日時: 2002-08-21 09:22
小僧さん、アドバイスありがとうございます。
タグの種類が増えた場合、日本語だったら分かりやすいなぁ と思ったのと、英語で表した場合に使い慣れない単語だと、 入力ミスが増えそうだし、意味が分からなくなって 辞書で調べるってことになりそうな気がして、 日本語を使うかどうか迷ってました。 小僧さんのおっしゃる通り、トラブルを未然に防ぐためにも、 半角英数使うようにしていきます。 私の場合、ローマ字表記になるかな・・(^^;) またアドバイスよろしくお願いします。 | ||||
|
投稿日時: 2002-08-21 12:37
ローマ字を使った場合に扱い易くなったかどうかを、今度ここに
書き込んでくださいね。 待ってます。 | ||||
|
投稿日時: 2002-08-21 14:15
変数の命名規則とかと同じだと思います。
日本語でも表記/意味の揺れが生じますよね。 ぱっとみわかりやすそうというメリットありますが、 別の意味にとってしまうという危険性もはらみます。 また、ローマ字も同様。 ちゃんとヘボン式だの訓令式だの考えておかないと泣きを見ます。 となると、むしろ名前は記号と割り切るのがいいんではないですかね。 たかだか数十単語でしょ?中学生の中間テストレベルですよ。 # あ、こっぱずかしいスペルミスが後々まで残るかもしれないという危険は… # 「editer」とか:b [ メッセージ編集済み 編集者: しょむ 編集日時 2002-08-21 14:17 ] | ||||
|
投稿日時: 2002-08-21 14:36
ローマ字使うのも何かと注意が入りそうですね。
ローマ字表記と英単語表記と混じっていると、 後々悩んだりしますよね、やっぱり。 タグ名に技術用語を使いたいのですが、 ちょうどいい単語が見つからなかったりするので、 ローマ字を・・・と思ったのですが、 10文字以上になるのもざらにあります。 記号と割り切って考えた方が良さそうですね。 タグ名決めるのに悩んでいるようでは、 「超初心者脱出」はまだまだ先なのかな・・。 | ||||
|
投稿日時: 2002-08-21 14:56
ローマ字(私はヘボン式)と英単語との使い分けは、ユーザに対する項目名の見せ方 にあわせています。画面や帳票で「ユーザ」と有るなら「user」ですし、「社員」なら「shain」にしています。DB系のルールはこれが楽チンだったのでXMLでもそうしています。 ローマ字は長くなりがちですが、省略し始めると省略ルールのぶれが出てき始めるので、省略は あまり使っていません。せいぜい「○○区分」を「○○_kbn」にしたり「○○コード」を 「○○_cd」という形で「プリフィックスルール」というものを作るくらいです。 扱っている項目が英訳しにくいものもあったりするので(「戸建て」とか「江戸間」とか 「礼金」とか)無理やり英訳しちゃうと今度は読めないです(礼金=謝礼=feeって言われて もなぁ)。 | ||||
|
投稿日時: 2002-08-21 15:06
みなさん、いろいろと工夫されているのですね。
参考にしながら頑張ります! |
1