CSV / Excel ファイルから「数値であるべきところに混じった文字」「日付フォーマットがズレている」「許可リストに無い値」などのゴミデータ(不正データ)を検出し、統計表示・選択削除ができます。ファイルはブラウザ内で処理され、サーバーには送信されません。
1ファイルを読み込み
クリックまたはここに CSV / Excel をドロップ
対応: .csv .tsv .xlsx .xls .ods(ブラウザ内処理・最大 ~30MB 推奨)
2検査範囲を指定
3正規データのルールを定義
正規データに該当するルールをすべて選んでください。複数選んだ場合、いずれかを満たせば「正規」と判定します(OR条件)。どれにも該当しない値は「ゴミ」として検出されます。
4検出結果
ゴミ 空欄
クリーンアップ操作
正規データを残したまま、検出されたゴミセル/行を編集できます。プレビュー後に「ダウンロード」で書き出します。
エクスポート
このツールでできること
- ゴミデータ検出: 数値・整数・日付・正規表現・許可リスト・文字長などの「正規データのルール」を組み合わせて、当てはまらないセルを抽出します。
- 範囲指定: シート全体/特定の列/A1形式(例:
B2:D500)で検査範囲を限定できます。 - 統計情報: 検査対象セル数・正規データ数・ゴミ数・割合・列別の不正率・値の出現サンプルを表示します。
- クリーンアップ: ゴミセルだけを空欄化/指定値で置換/ゴミを含む行を一括削除。正規データはそのまま残せます。
- エクスポート: クリーンアップ後の表を CSV / Excel(.xlsx) でダウンロード。
主な使用例
- 会員名簿: 郵便番号列に
^\d{3}-\d{4}$を当てて、ハイフン抜け・全角混じり・空欄を検出。 - 売上明細: 金額列を「整数・最小0以上」で検査して、空文字・
不明・全角数字を抽出。 - アンケート集計: 性別列を許可リスト「男,女,その他」で検査して、表記ゆれを発見。
- ログ整形: 日付列を「日付」ルールで検査して、フォーマット崩れの行を削除。
プライバシーについて
読み込んだファイルはブラウザ内(あなたのPC上)でのみ処理されます。サーバーへの送信は一切行いません。閉じれば消えます。
対応形式・制限
- 対応拡張子:
.csv.tsv.xlsx.xls.ods - テーブル描画は最大 1,000 行まで(残りは内部に保持されエクスポート時に含まれます)
- ファイルサイズの目安: 30MB 程度まで(ブラウザの空きメモリに依存)