【Excel】重複データを見つける
Excelでデータ整理をしているとき、避けて通れないのが「重複チェック」です。
実はこれ、データの量や「見つけたいだけか」「リストとして抽出したいのか」によって、最適な正解が違います。今回は、初心者から上級者まで使える2つの手法をご紹介します。
1. 【少量データ】条件付き書式で「色付け」
数千件程度のリストで、パッと見てどこが重複しているか確認したいときは、標準機能の「重複する値」が一番早いです。
▲ [条件付き書式] > [セルの強調表示ルール] > [重複する値] を選択
一瞬で重複に色がつくので、そのままフィルターで「色」を絞り込めば、抽出も簡単。また、設定を「一意」に変更すれば、ダブっていないデータだけを浮き彫りにすることもできます。
2. 【大量データ】パワークエリでリストを「マージ」
数万件を超えるデータや、2つの異なるリスト(データAとB)を突き合わせたい場合は、パワークエリ(Power Query)の出番です。
パワークエリは関数よりもマウス操作がメイン。聞きなれない言葉をいくつか覚えるだけで、スピーディーに正確な結果を導き出せます。
STEP A:データの読み込み
まず、データ範囲を指定し、「テーブル」として読み込ませます。この時に「先頭行を見出しとする」にチェックを入れると手間が省けます。
データのインポートでは「接続の作成のみ」を選んでおきましょう。同様に比較したいもう一方のデータも読み込みます。
STEP B:クエリの結合(マージ)
[データ]タブ > [データの取得] > [クエリの結合] > [マージ] を選択します。
マージ画面で、上段にテーブル1、下段にテーブル2を選びます。比較したい列(データAとB)をそれぞれクリックし、結合の種類で「完全外部」を選択します。
結合の種類にはいくつかありますが、今回は「完全外部」を選びます。これにより、両方のリストを比較して「一致するもの」「Aにしかないもの」「Bにしかないもの」をすべて1つの表に並べることができるからです。
【早見表】結合の種類と得られる結果
| 結合の種類 | 得られる結果 | 主な用途 |
|---|---|---|
| 左外部 | 表Aをベースに、表Bの情報を足す | データの補完、VLOOKUP代わり |
| 完全外部 | 表Aと表Bの全データを並べる | ダブリ・欠けチェック |
| 内部 | 両方に共通するものだけ残す | 共通項の抽出 |
| 左アンチ | 表Aにだけあるものを抽出 | 削除されたデータの特定 |
STEP C:結果の確認と読み込み
パワークエリエディタが開いたら、結合された列の展開ボタンを押し、内容を確認します。
同一行にデータがあるものは結合され、どちらか一方にしかないものは「null」と表示されます。最後に「閉じて読み込む」を押せば、ワークシートに比較表が展開されます。
今回のポイント
重複チェックは「目立たせる」だけがゴールではありません。パワークエリを使いこなせば、数万件のリスト比較もミスなく一瞬で終わらせることができます。「挿入はShift」「調整は縦横比ロック」といった基本と合わせて、パワークエリという強力な武器を身につけましょう!
コメント
コメントを投稿