この記事は ノバセル Advent Calendar 4日目です。
ノバセル テクノロジー開発部の吉田と申します。
今回の記事ではClaudeが外部のツールとデータのやり取りが可能になったModel Context Protocol(MCP)からみたLLMの進化と作業の近未来を論じていきたいと思います。
MCPの紹介
11/26にAnthoropicからModel Context Protocol(以下MCP)が発表されました。画期的なこのProtocolは瞬く間にニュースとなり広がり革命とまで言われています。それはなぜなのでしょう?
LLMはChatGPTの発表からテキスト生成→ テキスト要約 → イメージ生成 → 音声生成などLLMアプリケーションが過去に収集してきたデータを元に自然言語のアルゴリズムを通して生成をしてきました。MCPはサーバをたてることで任意のデータソース(現在は一定のユースケースに限られる)を読み込むことが可能になりました。
ここに至る経緯をかい摘むと、2022年11月にChatGPTが発表されてから、生成された文章の滑らかさなどから社会インパクトの大きさからOpenAIを中心にLLMの問題点・脅威が議論されることになりました。そこでLLMに対する”規範”に関する議論が巻き起こりModel Specificationが発表されるに至りました。これによりLLMの目的やルールなどが整理され、これを基準にLLMの動作や規範を考えていくことになりました。本題のMCPおよびOpenAIでも同様の機能が開発されていることについてはAIの振る舞いを具体化したものとして
- ユーザーの目標達成を支援: これまでデータのやり取りがスムーズではなかったことについて、MCPサーバーが解決の道を示した。
- ルール(特に危険な情報を提供しないなど): 後述する通りMCPサーバーではデータの正しいデータのやり取りを定義されました。またMCPサーバーを介したデータの操作の際にはポップアップがあがるなどルール準拠の仕様になっています。
表題のMCPはOpenAIとは団体はことなりますが、もとはOpenAIから脱したエンジニアを中心に設立されたAnthropicで作られたLLMサービスとなります。思想は色濃く受け継いでおり、今後の方向性としてLLMがPC内外と繋がって、知識の取得・要約・作業が一貫したLLMアプリケーション上で行われていくことになります。それを裏付けるものとしてほぼ同時期にOpenAIでもChatGPTのPC内操作を可能となることを発表されました1。
MCP利用の構成
MCPはMCP準拠のサーバをたてることによりMCP Host(現在多くはCaludeデスクトップアプリ)とその他データソースとの間のデータの仲立ちをする役目を持ちます。
ここで注目するのはHostとServerが両方向の矢印になります。現在用意されているサーバーのタイプにデスクトップ操作があります。webサイトから得られた情報を要約など加工してエクセルが読み込める形式としてCSVファイルを任意のPC(デスクトップが基本)に置くことが可能です。またDBを立てている場合には読み込み・書き込みが可能になるのでデータの操作性が高いのが特徴です。
設定ファイル概要
サーバーの設定は例えば以下のようになります。
{ "mcpServers": { "sqlite": { "command": "uvx", "args": ["mcp-server-sqlite", "--db-path", "/Users/YOUR_USERNAME/test.db"] } } }
この例はPC内にsqlLiteを立てている場合に任意のdbへのパス指定がされていればClaudeのデスクトップアプリから自然言語で抽出・加工ができることをさします。 このようにシンプルな設定ファイルを用いることでこれまでの検索調査・加工・レポート作成が一度にできてしまいます。
ユースケース
- 調査・レポート作成: 例えば営業が顧客対応のため様々なデータをかき集めて、集計・理解・レポート作成といった手順を踏んでいたと思います。作っては書き直しを繰り返していたと思います。これまでのLLMでは一般的な知識の吸い上げと考察までを人の作業から代替してきましたが、MCPにより手持ちのデータなどここの状況に合わせたデータを加工推論しレポートをまず作ってしまうということがすぐに可能です。ファイルを探す手間すらありません。おそらく一度で完璧なレポートは作れないですが、0-1のレポート作業はほぼ時間をかけずにできてしまうでしょう。
- 定形作業の自動化: これまでマクロを組んで特製のエクセルを作ったり、AutomaterなどRPAを仕込んだり、またはmakeなどでオンライン上の作業の自動化を組んでいたかと思います。それらの作業が(まだ一部ですが)このMCP+プロンプトにより直感的に作業フォーマットを作れてしまいます。こちらはMCPでもできることは多いですが、別途Claudeで利用開始したComputer Useも兼ね合わせると任意のブラウザでの実行を実現できるので興味があればComputer Useも参照されることをお勧めします。
- マーケティング作業: web上にある知識と自己が保有するデータの突き合わせと解釈はデータの成形から解釈まで時間がかかるものと思います。MCPには現段階でもwebスクレイピングツールとの連携が可能な状態になっているので、天気による来店の分析などは手元に来店関連データがあればweb上にあるスクレイピング可能なデータと突合など素早い調査・解釈が可能となります。
気になるところ
web上の集合知によりデータの書き換え、さらに進んでPCの操作が行われることになります。元をたどれば自然言語モデルによる統計値が元になっているので多くの間違った事例があればそれにちなんだ操作が行われることになるかも知れません。現状用意されているライブラリを見ると、例えばGithubではGithub上で期待しているアクションがほぼ取れるようです。一見想定しないアクションを取られた場合はそれなりにリスクはあるように思われますが、MCPサーバーはLLMクライアントに対して、正しいAPIスキーマ定義やAPIエンドポイントごとの操作内容を提供する仕組みなのでそのようなリスク軽減につながっています。例えばMCPサーバーを介しての外部データソース(sqlLiteなど)とのやり取りが発生する際はポップアップが出る仕組みもあります。この点はModel specに準拠していることがよくわかります。
感想
MCPという非常に強力で便利なプロトコルが発表されました。LLMに対して安全にデータのやり取りする方式の方向性が具体的に示されたことから、明らかに利便性が上がりました。今回発表されたケースでもClaude(MCPサーバー)を介して自分の持っているデータと外部にある一般的な知識の集約に境目を感じさせないUXを体感できるものとなっています。 まだこれからもLLMは生成できるものが増えていくことが期待されていくので、人が行なっている作業の代替がより進んでいくことが実感できると思いますのでこれを読まれたか他はぜひ利用して体感することをお勧めします。
- Work with Appは、MacのアクセシビリティAPIを経由してアプリから情報を取得する仕組みであり、MCPとはまた違う機構です。↩