LINK SEED
2026-01-02

例外・ログ・再実行:運用で壊れない自動化の作り方

“止まらない”より“復旧できる”を優先する。現場で回すための設計メモ。

#automation#operations

自動化は、動いた瞬間よりも**「運用で回り続けるか」**が勝負です。
そのために意識しているのが、例外・ログ・再実行の3点です。

なぜ“復旧できる”が大事か

現場の業務は、例外がゼロになりません。
例外がある前提で「止まったときに誰でも戻せる」ほうが、結果的に安定します。

1) 例外を分類する

例外はまず分類します。

  • 入力不足(必須項目が空、型が違う)
  • データ揺れ(表記ゆれ、余計な空白、名称差)
  • 外部要因(サイト仕様変更、通信、ファイル欠損)
  • 業務ルール(この条件のときは別処理、など)

2) ログは“調査用”ではなく“運用用”

ログは、開発者だけが読むものにしない方が強いです。
最低限これがあれば復旧できます。

  • 工程名(どこで止まったか)
  • 対象(どの行/どのファイル/どのIDか)
  • 結果(成功/失敗、理由)

3) 再実行できるように工程を分ける

「全部一括で実行」は作りやすいですが、壊れやすいです。
工程を分割すると、復旧が速くなります。

  • 収集
  • 整形(正規化)
  • 転記/登録
  • 出力

止まったら、止まった工程から再開できる形にします。

どんな案件で効くか

  • 帳票作成・転記・集計など、定型が多い業務
  • データの揺れ(表記ゆれ/例外)が一定数ある業務
  • 担当交代があり、属人化を避けたい業務

→ 実績(運用設計込みの例):/projects
→ 相談:/contact