紙をこよなく愛する松本洋紙店のスタッフが、紙の使い心地や、使用例、豆知識などをドンドン発信! | 紙のブログ

店長ぼんやり日記

AIプロジェクト格闘記 3万通抽出したら全部「返信メール」だった!2日目

店長コラム|AIプロジェクト格闘記 2日め
3万通抽出したら全部「返信メール」だった!AIプロジェクト格闘記2日目【テスト・失敗・学び】

2026年3月更新|松本洋紙店 店長 松本

3万通以上のメールを抽出して「よし!」と思ったら、全部こちらからの返信メールだけでした。肝心のお客様からの質問文が1件もない——。笑えるようで笑えない失敗です。
でもこの失敗のおかげで「最初に小さくテストすることの大切さ」を身をもって学びました。失敗しないと気づけないこともある、それがAIプロジェクトの現実です。今回はその2日めの格闘をお届けします。

01|3万通を抽出してわかった致命的なミス

前回、ツールを使って過去のメールを3万通以上抽出することに成功しました。「よし、これでAIに学習させるデータが揃った!」と喜んでいたのですが……。

データを確認してみると、全部こちらからお客様への返信メールだけでした。

「ありがとうございます。ご注文の件、承りました」「ご質問の紙ですが、◯◯の紙があります」——そんな文章ばかり。肝心のお客様からの質問・問い合わせ文がどこにもないのです。

原因は単純で、抽出するときの指示(条件の設定)が間違っていたようです。「送信済みメール」だけを拾う設定になっていたのでしょう。これは……やり直しです(苦笑)。

🏪 松本洋紙店 独自コメント
返信メールだけが3万通……。「答えだけが3万個あって、問題用紙が一枚もない」状態ですね。試験の答案だけ集めても、何の問題に答えたのかわからなければ意味がない。そのまんまでした(笑)。

02|「質問」と「返信」を紐付けるには?

気を取り直して「じゃあ今度はお客様からの質問メールだけを抽出しよう」と考えました。でも、そこで次の問題が浮かびました。

仮にお客様からの質問を15,000通以上抽出できたとして、それと私の返信をどうやって紐付けるのか、まったくわかりません。

「この質問にはこう答えた」というセットになっていないと、AIが「松本はこの状況にどう返すか」を学べないわけです。質問だけ、返答だけ、それぞれバラバラにあっても宝の持ち腐れです。

しかもAPI接続を使って再度処理するとなると、またその分のコストがかかりそうで……。費用対効果を考えると、正直ちょっとため息が出ます。半額でやったとはいえ、2回やれば意味がない。。

データの状態 AIへの有用性 問題点
返信メールのみ(今回) 何への返答かわからない
質問メールのみ 答えと紐付かなければ意味が薄い
質問+返信のセット これが最終目標。紐付け作業が必要

03|泥の中のダイヤモンド——順序を間違えると大変なことに
今回の失敗を振り返って、こんなたとえが頭に浮かびました。

💎 泥袋とダイヤモンドで例えると…

麻袋の中に泥がたくさん入っていて、その中にはダイヤモンドの原石が混じっている。でも「その泥をどうやって落とすか」「どんな道具を使うか」「どんな手順でやるか」——それを少しだけ試してみないまま、いきなり袋ごと全部やろうとすると、「やり方が違った!」となったとき最初からやり直しになってしまう。

最初に少量だけ試してみること(検証)をしていれば、本番前にミスに気づけた。まさにそれができていませんでした。

道具を全部揃えて、作業を全部してから「やり方が違った」となると、また一から同じことの繰り返しです。「検証(テスト)」というステップは省いてはいけないんだと、今回の失敗でよくわかりました。

04|最初は100件だけ。テストの大切さを痛感した

反省として思ったのは、最初から3万通を対象にするのではなく、まず100件だけ抽出してみればよかったということです。

100件なら確認も早い。「あ、返信メールしか取れていない」「質問文が入っていない」という問題が、すぐに見つかります。APIのコストも100件ならほとんどかかりません。

それを確認してから本番の3万件に進む——この順番を守るだけで、今回のような「全部やり直し」は防げたはずです。

🏪 松本洋紙店 独自コメント
紙の印刷でも同じことが言えます。いきなり1,000枚印刷する前に、まず1枚テスト印刷しますよね。色が違う、サイズが違う——それが1枚なら損失は1枚で済む。1,000枚やってからでは取り返しがつかない。AIプロジェクトも印刷と一緒でした。

05|失敗から得た経験値は本物だと思う

正直、今回の失敗はちょっとへこみました。時間もかかったし、コストもかかった。でも、この失敗があるからこそ「こうじゃない」とわかるというのも、確かに一つの前進です。

うまくいった話だけ読んでいても、実際に手を動かしたときに同じ落とし穴にはまります。失敗の経験は、次の判断を速くしてくれる。

「返信メールと質問メールを紐付けるにはどうするか」「テスト抽出をどう設計するか」——これは次のステップとして引き続き考えていきます。とりあえず今日はここまで、です(笑)。

❓ FAQ:メールデータ活用でよくある疑問

Q. メールの抽出でよくある失敗は何ですか?
A. 今回のように「送信済みメールだけ」「受信メールだけ」など、片方しか取れていないケースがよくあります。抽出条件(フォルダ指定・送受信の区別)を最初に小さい件数で確認することが大切です。

Q. 質問メールと返信メールをAI用に紐付けるにはどうすればいいですか?
A. メールのスレッド(会話の流れ)を使って、同じ件名や返信関係にあるメールをセットで抽出する方法が一般的です。ただし設定が複雑なため、専門知識か専用ツールが必要になる場合があります。

Q. 「テスト抽出」とは何ですか?なぜ必要ですか?
A. 本番処理の前に少量(100件程度)だけ試しに抽出して、データの中身・形式・抜け漏れを確認する作業です。設定ミスを早期に発見できるため、大量処理の前には必ず行うことをおすすめします。コストと時間の節約にもなります。

Q. 抽出したメールデータをAIに学習させると何ができますか?
A. 「この問い合わせにはこう答える」というパターンをAIに覚えさせることで、自動返信の下書き作成や、過去事例に基づいたFAQ生成などが可能になります。店長の判断や文体を再現した「もう1人の自分」をAIで作ることが最終目標です。果たして完成するのか!?

Q. APIの処理コストを抑える方法はありますか?
A. 前回ご紹介したバッチ処理(Batch API)を使うと通常APIの約半額になります。また、最初からすべてを処理しようとせず、必要なデータだけに絞って処理件数を減らすことも有効です。

Q. 失敗してもAIプロジェクトを続ける価値はありますか?
A. あります。失敗の経験は「次にやってはいけないこと」を教えてくれます。特に中小企業のAI活用はまだ事例が少なく、自分で試して学ぶしかない部分も多い。遠回りに見えても、それが最終的には一番の近道です。

07|まとめ:今日の失敗が明日の設計図になる
2日めで学んだこと、正直に整理します。
今日の出来事 わかったこと 結果
3万通以上を抽出した 全部「返信メール」だけだった ❌ やり直し
原因を調べた 抽出指示(条件設定)が間違っていた 💡 原因判明
次の課題が見えた 質問と返信の紐付け方法が不明 🔄 検討中
テストの必要性を実感 最初は100件だけ試すべきだった ✅ 次回に活かす

失敗は失敗ですが、「こうじゃない」とわかったことは確かな前進です。泥の中のダイヤモンドを取り出すには、まず泥の落とし方を小さく試してみること——この教訓は次のステップに必ず活きます。

次回は、質問メールの再抽出と「質問+返信のセット化」に挑戦する予定です。うまくいくかどうかはわかりませんが、またご報告します。(3日目に続く)