業務の隙間を埋める技術メモ。

「それ、作れるか?」より 「それ、作って大丈夫か?」を考えたい。 業務で“ちゃんと使える”かどうかを、 実際に手を動かして確かめたログを残しています。

【AI開発レポート】20人日のシステム連携開発を“フルAI”でやってみたら、まさかの2日で終わった話【AIぱねぇ、、】

 

前回の記事では AI の屁理屈遊びをしていましたが、今回はついに “フルAI”開発モデルを、実際の業務へ本格的に適用してみました。
その結果があまりに衝撃的だったので、記録として残しておきます。


■ 「フルAI」といっても、モデル自作や高額APIは使わない

誤解がないように最初に書いておきます。
今回の “フルAI” 開発とはいえ、

  • AIモデルを自作する

  • 天井なしの従量課金APIでガンガン回す

──といったことは一切していません。
無償でカンタンに利用できる範囲のAIだけで、十分に戦えました。


■ 対象は Netsuite × 外部システムの連携アプリ

作ったのは、Netsuite と外部システムをつなぐ連携処理。
Netsuite 側は SuiteScript で実装します。

見積もりは “1か月(20人日)”。
まあまあ重めの作業です。

ところがこれを AI に任せてみたら──

正味 2日で終わってしまった。

Σ( ̄ロ ̄lll)ガーン

「いやこれ、逆にマズくない?」「ぼったくり?」「工数の概念どうなるの?」
と完成後に焦り出す始末。
というわけで、この2日間の進め方を整理してみます。


■ ポイントは「全部AIに任せない」ことだった

今回のAI活用で一番重要だったのは、

AIの得意なところは徹底的に任せ、苦手なところはやらせない

という割り切りでした。


■ インプットは要件、アウトプットは SuiteScript のコード

AIへ渡すプロンプト(要件) → SuiteScript(コード)の生成
というシンプルな構造です。

ただし、2025/12 時点では SuiteScript の生成がまだ安定しません。
とくに日付処理や細かいロジック周りは、

  • SuiteScript 1.0 と 2.x がネット上で混在

  • AIが古い情報を “正” と誤認しやすい

という事情があり、Pythonなどに比べると成功率が低めです。

そこで私は、頻出エラーに対する制約プロンプト
(「こうしたらダメ、こう書け」)
を別途用意して、必要なときに差し込むようにしました。


■ モデル選択:SuiteScript は Gemini が圧勝

ChatGPT か Gemini か。
この2つを比較した結果、2025/12 時点では

SuiteScript 生成は Gemini のほうが圧倒的に優秀

という結論に至りました。

理由としては、

  • エラー解消能力

  • ログ出力やファイル命名の一貫性

  • 細かなケアの精度

これらが GPT より明確に上回っていました。

言語モデルとしての“文章力”は GPT に軍配があっても、
Google の強みである Web 情報の収集精度が生きているのでは?
という印象です。

Geminiが若干苦手だった日本語文の生成品質も、1年前とは別物レベルで向上しています。


■ AI開発最大の敵「デグレード」をどう防いだか

要件が複雑なため、一度のプロンプトで開発は完結しません。
そこで問題になるのが AIが前回内容を忘れる・手を抜く問題

実際には「覚えていない」か「覚えてるのに手を抜く」かのどちらかですが、AIはこれを何食わぬ顔でやってきます。

対策:すべてのやりとりをテキスト化して残す

  • プロンプト

  • AIの回答

  • 生成されたコード

これらを毎回テキストファイルとして保存。

OKならそのコードを次のプロンプトへ入れる。
NGの場合は、不具合箇所のみを指示して修正させる。

さらに重要なのがDiffチェック
AIが「余計な変更」をこっそり入れてくることがあるため、
必ず差分を確認します。

この地味な作業は面倒なので、
Pythonで半自動化ツール(これもAI生成)を作って効率化しました。


■ プロセス分割の工夫が、開発効率を劇的に上げた

連携処理は基本的に

  1. 認証・接続

  2. 読み取り

  3. 加工

  4. 書き出し

という4段階構造です。

このうち、要件が多く、最も複雑になるのが「加工」部分。
そこで私は AI へ、

加工処理だけは別モジュールとしてファイル分割せよ

と明確にプロンプトで指示しました。

これが大当たり。

● 新規作成処理をAIで作成

● 全要件を取り込んだ後

「では更新処理を作って」と依頼

→ 加工モジュールは一切触らず

書き出し処理だけ適切に修正したコードを一発生成

人間なら十分に1週間はかかる処理が、
AIは一度の生成でピタリと当ててきました。

ただし、これは「加工だけ別モジュール」プロンプトで指示していたからこそ成立した技。

これを明文化しないと、AIは勝手に良かれと分割してくれるわけではありません。


■ ログのカラーアイコン化など、人間では思いつかない“便利機能”も

プロンプトに「デバッグしやすいログにして」と書いたところ、
Geminiは普通に 色分けログ(成功=緑、警告=黄、エラー=赤) を生成してきました。

運用ログとしてもそのまま使えるレベル。
人間がイチから書いていたら絶対にやらない工夫です。

これは完全に思わぬ副産物でした。


■ まとめ:AI開発は速い。しかし“指示側の設計力”が問われる

今回の経験で強く感じたことがあります。

AIは、適切に方向付けしてやれば桁違いの速度で仕事をこなします。
しかし一方で、指示する側が

  • モジュール設計

  • デグレ防止

  • 差分チェック

  • 過去の指示管理

をきちんとやらないと、
AIとの押し問答が続くだけで進捗は止まります。

つまり、AI時代のエンジニアに求められているのは

「AIに上手く仕事をやらせるための設計力」

なのだろうと痛感しました。

言い換えると、このスキルを磨けないエンジニアは、
本当に数年後に仕事がなくなるかもしれない──
そんな危機感を覚えた1日でした。