連載
» 2018年08月06日 05時00分 公開

Tech TIPS:Excelで住所録などの重複データを一発で削除する

案内状などを送付するために住所録を作成する際、データが重複して登録されていれば削除しなければならない。しかし手作業で削除するのは、非常に手間のかかる作業だ。このような場合は、Excelの「重複の削除」機能を利用しよう。簡単に重複したデータを削除できる。

[小林章彦,デジタルアドバンテージ]
「Tech TIPS」のインデックス

連載目次

対象:Microsoft Excel 2010/2013/2016


 年賀状や案内状などを送付するために住所録を作成する場合、十分に気を付けたつもりでも、重複が生じることがある。重複を防ぐために、住所でソートして、順番に重複を確認する、といった手間をかけていないだろうか。100件程度ならば、それほど時間をかけずに確認できるだろうが、1000件、2000件ともなると、時間もかかるし、見落としも起こりがちだ。

郵便番号でソートした住所録 郵便番号でソートした住所録
郵便番号で住所録をソートすると、重複している行があることが分かる。ただ、これを目視で確認しながら削除するのは面倒だ。また同じ住所でも名前が異なる行は削除したくないので、同じ住所というだけでは削除できない。

 Excelを使えば、実に簡単に重複行が削除できる。ただし、事前にデータの正規化を行っておく必要がある。例えば、「1丁目1番地」「1-1」「1丁目1」といった表記のゆらぎがあると、別の住所と認識されて重複であると見なされないからだ。住所録でいえば、こうした番地や姓と名の間の半角、全角の空きなどを統一しておくこと。ここでは、正規化されたデータ(住所録)から重複しているものを削除する方法を説明する。

Excelで重複するデータを一発削除

 正規化されたデータをExcelで開き、セルが結合されている場合は、結合を解除しておく。結合したセルがあると、重複の削除が行えないためだ。

 重複削除を行いたいセル範囲を選択し、[データ]タブの「データツール」にある[重複の削除]アイコンをクリックする。[重複の削除]ダイアログが開くので、重複するデータが含まれている可能性のある列を選択する。住所録であれば、「住所」と「名前」の両方(会社の場合は部署なども含めた方がよいだろう)を選択する。これで、「住所」と「名前」の両方が一致する場合に、その行が削除される。名前だけの一致で削除するのであれば、「名前」のみをチェックすればよい。

住所録の重複行を削除する(1) 住所録の重複行を削除する(1)
住所録をソートなどせずに、重複行を削除する。
住所録の重複行を削除する(2) 住所録の重複行を削除する(2)
住所録の列を選択し、[データ]タブの[重複の削除]アイコンをクリックする。
住所録の重複行を削除する(3) 住所録の重複行を削除する(3)
ここでは、「住所」と「名前」をキーにして重複のチェックを行うので、この2つにチェックを入れる。
住所録の重複行を削除する(4) 住所録の重複行を削除する(4)
4件の重複した行が見つかったため、削除された。
住所録の重複行を削除する(5) 住所録の重複行を削除する(5)
重複していた行が正しく削除されたか、郵便番号でソートして確認してみた。このように住所と名前の組み合わせで重複していた「小室 岳」さんは削除されて1行になったが、住所は同じながら名前が「小室 景子」さんは、異なる行としてそのまま残り、削除されなかった。

 重複を削除することで、同じ人に複数の案内状やダイレクトメールを送付する失礼を回避できるし、無駄な送料の削減にもなる。前述の通り、事前にデータを正規化する必要はあるものの、ソートするなどの手間は不要だ。アンケートの集計前に重複を削除するなどの場合にも便利な機能なので、覚えておくとよい。

「Tech TIPS」のインデックス

Tech TIPS

Copyright© 1999-2018 Digital Advantage Corp. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。