- PR -

タブ区切りファイル(TSV)の仕様

1
投稿者投稿内容
ボブ
常連さん
会議室デビュー日: 2007/10/03
投稿数: 44
投稿日時: 2008-10-20 18:39
投稿場所が違うかもしれませんが、
ご勘弁ください。

タブ区切りファイルの仕様は どのようになっているのでしょうか?
CSVファイルであれば、
RFC4180 ttp://www.ietf.org/rfc/rfc4180.txt?number=4180
で定義されていますが、TSVファイルについては良く分りません。

IANA
ttp://www.iana.org/assignments/media-types/text/tab-separated-values
にてMIME type text/tab-separated-values
が定義されているようですが、データとしてタブがあったらどうするか?
などの詳細な仕様が載っていませんでした。

CSVファイルのように、データとしてのタブはダブルクォーテーションで囲む、
またデータとしてのダブルクォーテーションは ダブルクォーテーションで重ねる
といった感じでいいのでしょうか?

みなさんどうされていますか?


あしゅ
ぬし
会議室デビュー日: 2005/08/05
投稿数: 613
投稿日時: 2008-10-20 19:53
CSV,TSV,固定長レコードなどは歴史的なしがらみが多いので、
いまさらRFCで定義されてもほとんど影響力は無さそうに感じます。

Excelが出力する形式に準拠、とかの方がメジャーでは?
わたなべ
大ベテラン
会議室デビュー日: 2007/12/09
投稿数: 123
お住まい・勤務地: 札幌
投稿日時: 2008-10-20 20:45
汎用的なフォーマットとはならないから、プロジェクト毎にどう特殊文字をエスケープするか選択すれば充分かと。
まあ、無理にテキストで行単位のフォーマットを使用しなくてはならない、わけでもないですから、区切りや特殊文字が解釈できればどうでもいいと思います。
むしろ、その辺りの仕様を考えなくてはならないならば、CSVとかTSVは選択肢から外しますね、XMLとか幾らでも代替手段はありますから。
ボブ
常連さん
会議室デビュー日: 2007/10/03
投稿数: 44
投稿日時: 2008-10-20 21:55
この辺りは各ベンダーや、プロジェクトで独自に決めていってるという感じでしょうか。
ある製品を作るにあたって、CSV、TSV、固定長、XMLなどのデータ形式に対応させようとしているのですが、汎用的にするために標準フォーマットを探していたところです。
XMLのように仕様が厳格に決まってないのですね。
わたなべ
大ベテラン
会議室デビュー日: 2007/12/09
投稿数: 123
お住まい・勤務地: 札幌
投稿日時: 2008-10-21 09:22
>汎用的にするために標準フォーマット
汎用的なフォーマットはないと思います。
製品の顧客がどこかは解りませんけど、幾つかのフォーマットを選択できるようにし、改行の置換文字などを詳細設定でカスタマイズできる方が便利かと。
その辺はコストとの兼ね合いかとは思いますが、「データの取り込み」に重みを置く製品ならばこだわってもいいんじゃないですかね。
ボブ
常連さん
会議室デビュー日: 2007/10/03
投稿数: 44
投稿日時: 2008-10-21 21:59
引用:

わたなべさんの書き込み (2008-10-21 09:22) より:
>汎用的にするために標準フォーマット
幾つかのフォーマットを選択できるようにし、改行の置換文字などを詳細設定でカスタマイズできる方が便利かと。
その辺はコストとの兼ね合いかとは思いますが、「データの取り込み」に重みを置く製品ならばこだわってもいいんじゃないですかね。


そうですね、CSVや、TSVに汎用的なフォーマットがないとなると、おっしゃるとおり、
詳細にカスタマイズできるものの方が売りになりそうです。
1

スキルアップ/キャリアアップ(JOB@IT)