MENU

MENU

カテゴリー

\気になるカテゴリーをクリック!/

やきいも
文系SE
【プロフ】
 ▶ 30代半ば
 ▶ ITエンジニア13年目 | 業務システム
 ▶ 妻と息子の3人で田舎の暮らし

【サイト運営】
このブログは私の体験をもとに以下に関する情報をお届けしています。
 ▶ AI
 ▶ Java
 ▶ Flutterなど
Udemyセール!最大95%オフ!1,200円~最新セール情報をみる

Claude Computer Useとは?何が変わる?25%の限界とは?

この記事にはPRを含む場合があります。
Claude Computer Useで何が変わる?Macを操るAIの実力と25%の限界
この記事でわかること
  • Claude Computer Useの仕組みと対象プラン・OS
  • OpenAI・Googleとの比較スコアと各社の戦略の違い
  • 75%精度が意味する「25%の失敗率」と実用上のリスク
  • AIがPCを操ることで静かに消えていくものへの見方

「AIが自分のMacを操作してくれる」と聞いたとき、便利そうだと思いますか?それとも怖いと感じますか?

正直に言うと、僕はその両方を感じました。2026年3月23日、AnthropicがClaudeのComputer Use機能をClaude ProおよびClaude Maxユーザーに一般公開しました。スクリーンショットを見ながらClaudeが自律的にアプリを操作し、ファイルを動かし、ブラウザをクリックする。そんな光景がいよいよ現実になったんですよね。

ただ、この記事では「すごい!」で終わりにするつもりはないんですよ。

この記事を読むと、Claude Computer Useの技術的な仕組みと限界を正確に把握した上で、「AIがPCを操る」という変化がどんな構造的な意味を持つのかという新しい見方ができるようになります。

Claudeの公式アカウントが発表したこの投稿は、AIとパソコンの関係に大きな転換点をもたらしました。まずは何が起きたのかを整理していきましょう。

目次

Claude Computer Useとは何か、まず整理しておきます

Claude Computer Useの基本を理解しておかないと、その後の話が宙に浮いてしまうので、まずここを押さえましょう。

Computer UseはAnthropicが提供するAI機能で、ClaudeがMacのデスクトップ画面を「見て」「操作する」ことができます。対象製品はClaude CoworkClaude Codeの2つ。利用できるのはClaude Pro(月20ドル)またはClaude Max(月100ドル)のプランで、現時点ではmacOS限定のResearch Preview(Windows対応は数週間後予定)です。

Anthropicの公式発表によると、同時にDispatchという新機能も提供が始まっています。スマートフォンからClaudeに指示を出し、Macで実行させるモバイル連携機能で、iPhoneで始めた会話をMacで継続することもできる設計になっています。

Computer Use機能の歴史を振り返ると、Anthropicは2024年末に開発者向けAPIとしてComputer Useをリリースしていました。当時のOSWorldスコア(AIのPC操作精度を測るベンチマーク)はわずか15%未満。それが2026年2月時点で72.5%まで跳ね上がっています。

Verceptはクラウド上のリモートMacBookを操作するAIエージェント「Vy」を開発していたシアトルのスタートアップで、2026年2月25日にAnthropicが買収を発表しました(調達総額5,000万ドル)。このチームが加わったことで、Computer Use機能の精度が一気に向上したとみられています。

さて、仕組みがわかったところで、実際にどう動くのかを見ていきましょう。

Claude CoworkのComputer Useは「こっそり動く」わけではない

「AIが勝手にMacを操作する」というイメージを持つ人もいるかもしれませんが、実際の動作設計はかなり違います。Claude Coworkのアーキテクチャを見ると、この機能がどれだけ慎重に設計されているかがわかるんですよね。

AIが勝手にファイルを動かしたり、メールを送ったりしないのかな?

実は、大きなアクションの前には必ずユーザーの承認を求める設計になっています。「こっそり動く」ではなく「一緒に動く」イメージが正確ですよ。

まず技術的な仕組みから。Computer Useエージェントの動作は以下のループで成り立っています。

  1. 現在の画面をスクリーンショットで撮影する
  2. Vision対応のAIモデルにスクリーンショットを送る
  3. モデルが画面を解析し次のアクションを決定する
  4. クリック・キー入力・スクロールなどの構造化アクションを出力する

このループを繰り返すことで、人間が操作できるアプリケーションであれば原理的にすべて操作対象になります。GUIを通じて動くため、専用APIがないアプリでも対応できるというのが最大の強みです。

Engadgetの報道によれば、Claude Coworkは画面操作に頼る前に別のルートを優先します。まずGoogle WorkspaceやSlackなど38以上の「Connector」(公式API連携)経由で操作を試み、Connectorが使えない場合のフォールバックとして画面操作を実行する設計です。さらにZapier統合により8,000以上のアプリとも連携できます。

安全設計として、新しいアプリやフォルダにアクセスする際は必ずユーザーの許可を求め、大きなアクションの前には計画を提示して承認を得ます。プロンプトインジェクション攻撃の自動スキャンも実装されています。

ここで面白いのは、Anthropicが「ユーザーの承認フロー」をあえて手厚くしている点です。「AIが自律的に動く」が売り文句のはずなのに、随所に人間の確認が挟まれる。これは後ほど詳しく触れますが、Consumer向け製品としての現実的な妥協点だと僕は見ています。

次は競合他社の状況も見てみましょう。ClaudeだけがPC操作AIをやっているわけではないですし、それぞれ設計思想がかなり異なるんですよね。

Claude・OpenAI・Google、AIのPC操作に対する3社の異なる賭け方

2026年3月時点で、AIのPC操作市場は主要3社が異なる戦略で争っています。数字を比較してみると、各社の狙いの違いがはっきり見えてきます。

プレイヤー製品OSWorldスコア設計の特徴
AnthropicClaude Cowork / Computer Use72.5%(Sonnet 4.6)Consumer向けバンドル、3トラック戦略
OpenAIGPT-5.4 / Operator75.0%人間専門家ベースライン超え
GoogleProject MarinerWebVoyager 83.5%ブラウザ特化、10タスク並列

OSWorldスコアはデスクトップ全般の操作精度を測るベンチマークで、人間の専門家ベースラインが72.4%とされています。ClaudeのSonnet 4.6(72.5%)とOpus 4.6(72.7%)はほぼ人間水準に達し、GPT-5.4の75.0%がその基準をわずかに超えた唯一のモデルです。

各社の比較分析によれば、3社の賭け方はかなり異なります。OpenAIのOperatorは汎用性重視で、人間専門家ベースラインを超えることに注力しています。GoogleのProject MarinerはWebVoyagerスコア83.5%と飛び抜けているものの、ブラウザ操作特化で10タスクをクラウドVM上で並列実行するというアーキテクチャです。

そしてAnthropicはProサブスクリプションにバンドルする形でConsumer向けに普及を図り、開発者向けAPI・Claude Code・Coworkという3トラックで市場全体をカバーする戦略を採っています。

ベンチマークの数字だけ見るとOpenAIが頭一つ抜けているように見えますが、実は「75%達成」という数字には裏の意味があります。それが次のセクションで正直に話す部分です。

正直に言う:75%のスコアは「25%の失敗率」でもある

ベンチマークの話が出たところで、実用性について正直に話しておきたいんですよね。

OSWorldで75%を達成したとして、それは残り25%のタスクで失敗するということを意味します。10回に2〜3回は意図した操作にならないわけです。これを「もう十分使える」と見るか「まだ実用には早い」と見るかは、タスクの種類によります。

メールの下書きを作るとか、スプレッドシートに数値を入力するような単純な繰り返し作業なら、25%の失敗率も許容できるかもしれません。

取引先への送信メールや経費申請、重要なファイル操作などに使う場合は話が変わってきます。失敗率25%は許容できないリスクになり得ます。

セキュリティ面のリスクはどうなの?AIに画面を見せることに不安を感じるんだけど。

9to5Macも触れていますが、オープンソースのAIエージェントエコシステムでは、スキルレジストリの約20%に悪意あるコンテンツが含まれていたという監査結果があります。Anthropicの公式製品ではサンドボックスで対策していますが、業界全体の課題として残っています。

ちなみに、「89%のチームがすでにAIエージェントを使っている」という調査結果(2025年末時点)がある一方で、実際のMAU(月間アクティブユーザー)は期待値に追いついていない現状があります。Perplexity Cometが280万WAU、OpenAI ChatGPT Agentが100万WAU以下という数字が示すように、「使っているチームが多い」と「日常的に多くの人が使っている」はまったく別の話なんですよ。

失敗率と普及率の実態を踏まえた上で、それでも「AIがPCを操る」という変化が構造的に何を意味するのかを考えてみたいと思います。

「AIがPCを使う」が普及したとき、静かに消えるものは何か

ここからは僕の見方を話します。事実の話は終わりで、ここからは分析です。

Computer Useが「普通の機能」として定着したとき、いちばん静かに消えるのはソフトウェアの「使い方を覚える」という行為じゃないかと思っています。

今、僕たちはツールを使うたびに「このボタンはどこ」「この機能はどこにある」という学習コストを払っています。Excelの関数を覚えたり、Slackのショートカットキーを習得したり。でも、AIが画面を見て操作できるなら、「ツールの使い方を覚える」必要性が根本から消える可能性があります。

裏を返せば、「ツールの使い方に精通していること」が専門性の根拠になっていた人にとっては、その根拠が薄れていきます。Excelのマクロ、PhotoshopのUI操作、Salesforceの設定——こういった「ツール習熟」系のスキルは、AIエージェントの普及とともに競争優位性が下がっていくと見ています。

もう一つ、構造的に面白いなと思うのがAnthropicの「3トラック戦略」です。Computer Use API(開発者向け)・Claude Code(エンジニア向け)・Claude Cowork(一般ユーザー向け)という三層構造は、単なる製品ラインナップではなく「AIに何をどこまで委ねるか」という信頼の段階設計です。

開発者はサンドボックスで自由に実験できる。エンジニアはターミナルで構造化された操作を指示できる。一般ユーザーはGUIを通じてClaudeと「一緒に仕事をする」感覚で使える。これはAIが人間の仕事に入り込む際の「摩擦のグラデーション」を意図的に設計しているとも読めます。

さて、2100年の研究者がこの時代を振り返るとしたら、どう評価するでしょうか。おそらく彼らは2026年を「AIがツールを使う側に回った年」とは呼ばないと思います。

むしろ「人間がソフトウェアのUIを学習する義務から解放された最初の年」として記録するのではないかと。「プログラミングを学ぶ」「Excelを覚える」という行為は現代では当たり前ですが、それは人間がコンピュータの言語に歩み寄ってきた歴史でした。Computer Useはその方向を逆転させ始めた技術だ、と。

もっとも、現時点での25%の失敗率や実際のMAUの低さを見れば、「逆転」はまだ始まったばかりです。でも技術の変化は、普及の直前まで誰も気づかないものですよね。

まとめ:ClaudeのComputer Useから見えるAIエージェントの現在地

改めてClaude Computer Useのポイントを整理しておきますね。

この記事のまとめ

Claude Computer Useとは:Anthropicが2026年3月23日にClaude Pro/Maxユーザーへ提供開始した、MacのデスクトップをAIが「見て・操作する」機能。
対応製品と精度:Claude CoworkとClaude Codeが対象。OSWorldスコアは72.5%で人間専門家水準に到達。
競合との比較:OpenAI(75.0%)・Google Mariner(WebVoyager 83.5%)が先行。Anthropicは3トラック戦略でConsumer普及を図る。
25%の失敗率:重要な操作に使う場合は人間の確認が不可欠。セキュリティリスクも業界全体の課題として残っている。
構造的な変化:「ツールの使い方を覚える」という行為が根本から変わる入り口が開いた。

このテクノロジーを「便利なツールが増えた」という視点で見るか、「人間とソフトウェアの関係が構造的に変わる入り口が開いた」と見るかで、使い方も備え方もまったく変わってきます。

実際に試してみながら、「何が委ねられて何が委ねられないか」を自分で確かめてみることをおすすめしますよ。

AIエージェントについてもっと体系的に学びたい方には、こちらの本が入門として読みやすいです。

Amazonで見る「60分でわかる! AIエージェント 超入門」

より実践的に動かしてみたい方はこちらもどうぞ。

Amazonで見る「現場で活用するためのAIエージェント実践入門」

参考資料
Anthropic is giving Claude the ability to use your Mac for you | 9to5Mac
Claude Code and Cowork can now use your computer | Engadget
Anthropic acquires Vercept | Anthropic
Agent Arms Race: OpenAI vs Anthropic vs Google | bosio.digital

コメント

コメントする

目次