近年、ビジネスにおける自動化の波は急速に進化しており、その中でも特に注目を集めているのが「AIエージェント」です。
自然言語を理解し、自律的にタスクを遂行するAIエージェントは、これまでの自動化の可能性を大きく広げる存在として期待されています。
RPAのリーディングカンパニーであるUiPathも、このAIエージェントの分野に力を入れています。
それが「UiPathエージェント」です。
本記事では、このUiPathエージェントの基礎から簡単なエージェントの開発方法まで、ハンズオン形式で詳しく解説していきます。
この記事を読めば、UiPathエージェントがどのようなものか、そしてそれがビジネスの現場でどのように役立つのかが理解できるはずです。
ぜひ最後までお読みいただき、自動化の幅を大きく広げましょう。
目次
AIエージェントとUiPathエージェント
まずは、AIエージェントの一般的な概念から、UiPathエージェントがどのようなものなのかを見ていきましょう。
AIエージェントとは?
AIエージェントとは、「自然言語の指示を理解し、達成するために、自律的に思考し”行動”するAI」のことです。
これまでの多くのシステムは、事前に定義されたルールやシナリオに基づいてのみ動作しました。しかし、AIエージェントは、生成AIを活用することで、曖昧な指示や複雑な状況にも対応し、最適な手順を自分で考えて実行しようとします。
AIエージェントは、インターネット検索、外部ツール(API、ソフトウェア)の操作、情報の分析など、様々な「ツール」を使い分けることで、多様なタスクをこなす能力を持ちます。
まるで、人間の優秀なアシスタントのように、依頼された業務を自律的に遂行することを目指し、今まさに各ツールが進化を続けています。
UiPathエージェントとは?
UiPathエージェントは、このようなAIエージェントの概念を、UiPathが提供する強力な自動化プラットフォーム上で実現したものです。
UiPathエージェントは、「ビジネスユーザーが自然言語で指示するだけで、UiPathプラットフォーム上の次のような自動化機能を組み合わせて、複雑な業務プロセスをエンドツーエンドで実行できる存在」です。
- RPAワークフロー
- 他のAIツールやAIエージェント
UiPathエージェントの登場により、これまでのRPAや特定のAI機能だけでは難しかった、より複雑で非定型な業務の自動化を実現できるようになりました。
例えば、「メールの内容から判断して、マニュアルを参照して情報を取得し、基幹システムに登録する」といった、複数のステップや判断を含む業務を自動化することができます。
UiPathエージェントの強み
世の中には様々なAIエージェントが登場していますが、UiPathエージェントには他にはない独自の強みがあります。
最も顕著な強みは、UiPathのRPAワークフローとのシームレスな連携です。
多くのAIエージェントがAPI連携や簡単なスクリプト実行に留まる中、UiPathエージェントは、UiPathプラットフォームで開発された既存のRPAワークフローを「ツール」として呼び出すことができます。
これにより、ウェブサイト操作、デスクトップアプリケーション操作、基幹システムへのデータ入力など、RPAが得意とする確実なUI操作を含む複雑なタスクを、AIエージェントの判断で実行することが可能になります。
これは、AIエージェントが単なる情報処理だけでなく、実際のシステム操作を伴う業務を高い精度で自動化できることを意味します。
また、UiPathプラットフォームは、RPAだけでなく、次のような様々なAI機能やツールを提供しています。
- Document Understanding(非定型データ抽出)
- Communication Mining(メール・チャット分析)
- Action Center(ユーザーによるレビュー)
UiPathエージェントは、これらの豊富な機能を活用し、非常に多様なアクションを実行できます。
さらに、エンタープライズ向けに設計されたUiPathプラットフォーム上で動作するため、セキュリティ、ガバナンス、スケーラビリティ、集中管理といった面でも優位性があります。
特に、企業での生成AI活用において非常に重要なセキュリティを対策できる点は大きなメリットといえます。
これは、実際の基幹業務にAIエージェントを導入する上で非常に重要な要素となります。
料金・ライセンスについて
UiPathエージェントを使用するには、Agent Unitsという新しいライセンスが必要です。
デバック実行・本番実行を問わず、エージェントからLLMを呼んだ回数分Agent Unitsを消費する仕組みとなっています。
(エージェントでLLMを5回呼び出した場合、5Agent Units消費)
Agent Unitsのライセンス費用は公開されておりませんので、UiPathライセンス契約されている営業の方や、詳しくは弊社までお問い合わせください。
なお、Enterpriseライセンスでは、Agent Unitsを購入していなくても、1日数10回エージェント実行が行える無償枠が用意されています。
残念ながらCommunityライセンスでは利用できませんが、Enterpriseのアカウントをお持ちであれば、無償枠を用いてUiPathエージェントの検証を行うことができます。
UiPathエージェントを構成する4つのコンポーネント
UiPathエージェントを開発・設定するために理解しておくべき主要なコンポーネントが4つあります。
これらは、AIエージェントがユーザーの指示を理解し、自律的に動作するために不可欠な要素です。
プロンプト:自然言語の指示
「プロンプト」は、AIエージェントの脳となる部分であり、「何をさせたいか」「どのような役割を演じさせたいか」「どのような制約の中で動作させるか」などを自然言語で指示するものです。
AIエージェントは、このプロンプトの内容をもとに、ユーザーからの入力に対してどのように応答し、どのようなツールを選択して実行するかを決定します。
プロンプトには、以下のような要素を含めると良いでしょう。
- 役割:(例)「あなたは、お客様からの問い合わせに対応するベテランのサポート担当者です。」
- 目的:(例)「お客様の質問に正確に答え、必要な手続きを案内してください。」
- 守るべきルール/制約:(例)「個人的な情報や機密情報は決して開示しないでください。」「不明な点がある場合は、必ず人間に確認を求めてください。」
- 使用できるツールと使用条件:(例)「ユーザーが『注文状況を知りたい』と言ったら、必ず『注文確認システム検索ツール』を使って調べてください。」
- 出力形式:(例)「回答はお客様が理解しやすい丁寧な言葉遣いにしてください。」
プロンプトは、AIエージェントの「思考プロセス」を規定する最も重要な設定項目と言えます。
コンテキスト:適切な判断を導くための情報源
AIエージェントが正確な判断を下し、適切な応答やアクションを行うためには、関連する情報が必要です。
この情報源となるのが「コンテキスト」です。
コンテキストとは、エージェントが参照できる外部データやナレッジベースなどを指します。
UiPath AIエージェントでは、例えば社内規定集、FAQドキュメント、過去の対応履歴、顧客データベースなど、参照すべき情報ソースを設定できます。
ユーザーからの指示やプロンプトだけでは判断が難しい場合、これらのコンテキスト情報を参照し、より正確で状況に応じた応答やアクションを選択します。
コンテキストを適切に設定することで、AIエージェントは表面的なやり取りだけでなく、背景情報や専門知識に基づいた深い理解を示すことが可能になります。
これにより回答の質が向上し、より複雑な業務にも対応できるようになります。
ツール:AIエージェントが実行できる具体的なアクション
AIエージェントは、自律的に思考するだけでなく、実際に何らかの「行動」を起こす必要があります。
この「行動」を実行するための手段が「ツール」です。
ツールは、AIエージェントが利用できる特定の機能や外部システムへの連携ポイントを定義します。
UiPathエージェントにおけるツールとして代表的なものは、以下のようなものが挙げられます。
- RPAワークフロー:UiPathで開発したRPAロボットを実行します。これがUiPathエージェントの最大の強みです。
ウェブサイトからの情報取得、システムへのデータ入力、ファイル操作など、RPAが得意とするあらゆる操作をAIエージェントの判断で実行できます。 - アクティビティ:外部システムと連携することができます。
- エージェント:ほかのエージェントを呼び出して使用することができます。
AIエージェントは、ユーザーからの指示とプロンプト、そしてコンテキストを参照し、目的に最も合致するツールを判断して実行します。
ツールの種類と品質が、AIエージェントが実行できるタスクの範囲と精度を決定します。
エスカレーションパス:人間との連携を組み込む
AIエージェントは自律的に動作しますが、すべての状況に完璧に対応できるわけではありません。
判断に迷う場合、情報が不足している場合、あるいは承認が必要な場合など、人間の判断や介入が必要となる状況が必ず発生します。
このような場合に備えて設定するのが「エスカレーションパス」、つまり人間との連携フローです。
エスカレーションパスを設定することで、AIエージェントは自分で解決できない問題を検知した際に、適切な担当者に通知したり、確認を求めたりすることができます。
例えば、「お客様の問い合わせ内容が複雑すぎて適切なFAQが見つからない場合、担当部署のチャネルに通知する」「この処理を実行するにはマネージャーの承認が必要です」といった連携を組み込むことができます。
これにより、AIエージェントは単独でタスクを完遂するだけでなく、人間と協調しながら業務を進めることが可能になり、自動化の範囲を広げつつも、重要な判断やイレギュラー対応は人間が行うといった柔軟な運用が可能になります。
UiPathエージェントで何ができる?具体的なユースケース
UiPathエージェントは、その柔軟性とUiPathプラットフォームとの連携により、様々なビジネスシーンで活用が期待されています。ここでは、代表的なユースケースをいくつかご紹介します。
顧客問い合わせの自動分類と対応
カスタマーサポート部門には、日々多数の問い合わせがメールやチャットで寄せられます。
UiPathエージェントを活用することで、これらの一次対応を自動化できます。
- メールやチャットツールからAIエージェントが問い合わせ内容を取得
- AIエージェントは問い合わせ内容を自然言語で理解し、その意図(例:注文状況の確認、製品の使い方、返品希望など)を特定し、コンテキスト(FAQ、製品マニュアル)を参照
- 特定した意図に基づき、AIエージェントは適切なツール(例:注文状況確認RPA、FAQ検索エージェント)を選択
- 注文状況であればRPAが基幹システムから情報を取得し、AIエージェントがそれを分かりやすくまとめて回答案を作成
- エスカレーションパスを通じて回答案を担当者に通知し、担当者の修正・承認を得る。
- 承認された回答を顧客へ送付
これにより、一次対応の迅速化、担当者の負荷軽減、対応品質の均一化が図れます。
複数システムからの情報収集と分析
様々なシステム(CRM、ERP、SaaS、スプレッドシートなど)に情報が分散しています。
特定の業務を行うためには、これらのシステムから必要な情報を収集し、統合・分析する必要があります。
- ユーザーが「〇〇案件に関する最新情報をまとめて」と指示
- プロンプトとコンテキスト(どのシステムにどのような情報があるか)を基に、情報収集が必要なシステムを特定
- 特定したシステムから情報を取得するために、RPAワークフローを実行
(例)CRMから顧客情報、ERPから販売情報、SaaSから利用状況データを取得する - 収集した複数のシステムからのデータを統合・分析し、ユーザーが求める形式(サマリー、レポート、特定の指標など)にまとめる
- まとめた結果をユーザーに提示
これにより、手作業での情報収集・分析にかかる時間を大幅に削減し、より迅速な意思決定を支援できます。
ドキュメント内容の理解とデータ抽出
契約書、請求書、注文書、レポートなど、非定型のドキュメントから特定の情報を読み取り、システムに入力したり、データとして活用したりする業務は多くの企業に存在します。
UiPathエージェントは、UiPathのDocument Understandingなどの機能を活用し、これを自動化できます。
- 特定のフォルダに新しいドキュメント(例:PDF形式の請求書)が格納されたことをトリガーに、ドキュメントを取得
- Document Understandingなどのツールを実行し、請求書番号、日付、金額、会社名といった必要な情報を抽出
- 抽出されたデータに誤りがないか、あるいは特定の条件を満たすかなどをAIエージェントが判断
- 必要に応じて、エスカレーションパスを通じて担当者に確認
- 確定した抽出データを使って、AIエージェントは後続のシステム連携フローを実行
これにより、手作業でのデータ入力やチェック業務を削減し、処理速度と精度を向上させることができます。
【ハンズオン】UiPathエージェントを使ってみよう
それでは、実際にUiPath Studio Webを使って簡単なAIエージェントを作成する手順を見ていきましょう。
UiPath Studio Webへアクセスし、エージェントを作成する
Automation CloudやOrchestratorの画面から、Studio Webにアクセスします。
「新規作成」の右側のプルダウン(▼)から、「エージェント」を選択します。
Autopilotにプロンプトを入力する画面が開きます。
ここにどのようなエージェントを作りたいか入力するだけで、「プロンプト」や「必要なユーザー入力(変数)」を提案してくれます。
簡単なプロンプトを書き、「エージェントを生成」をクリックします。
少し待つと、画面左側に表示されるAutopilotが、必要な設定をいくつか提案してくれます。
「提案を確認」をクリックし、内容を確認します。
プロンプトなどの提案内容が表示されるので、確認し「提案を受け入れる」をクリックします。
他の提案も確認し受け入れてみましょう。
エージェント開発画面の構成
主な画面構成を確認していきます。
- データマネージャー:入力変数・出力変数を管理する
- システムプロンプト:エージェントの役割、目的、ルールや制約を指示する
- ユーザープロンプト:実行するタスクを指示する
下にスクロールすると、「プロンプト」以外のコンポーネント「ツール」「コンテキスト」「エスカレーション」の設定画面があります。
エージェントをテストする
テスト実行するには、「クラウドでテスト」をクリックします。
テスト用の入力引数を設定する画面が開きます。
今回は簡単なミーティング設定依頼のメール文を設定し、「実行」をクリックします。
エージェントが実行され、テスト結果が表示されます。
どのようなアクションが実行されたか、どのような出力が得られたか確認することができます。
この機能を活用し、安定した出力が得られるまで検証・修正を繰り返します。
RPAワークフローからエージェントを実行する
RPAワークフローからエージェントを実行するため、次のようなステップが必要です。
- エージェントに名前を付ける
- パブリッシュし、Orchestratorにデプロイする
- RPAワークフローから呼び出す
順に確認していきましょう。
エージェントに名前を付ける
エージェント作成した際は、エージェント名が「Agent(連番)」となり管理しづらいので、事前に変更しておきます。
また、エージェントはソリューションという箱の中に入る仕様になっているので、あわせて変更しておくとよいでしょう。
これらはいずれも「エクスプローラー」画面で設定します。
画面左上のフォルダーアイコンから「エクスプローラー」を開きます。
「Solution」と「Agent」をそれぞれ右クリックし、「名前を変更」をクリックします。
「create_mail_solution」や「create_mail_agent」といった名前を付けます。
日本語で設定することも可能ですが、この後の手順を進めた際に、日本語名が反映されない箇所が登場するので、あらかじめ英語で設定しておくとスムーズです。
パブリッシュし、Orchestratorにデプロイする
RPAから呼び出す前に、テナントへのパブリッシュとデプロイが必要です。
画面右上の「パブリッシュ」をクリックします。
場所(テナントもしくはマイワークスペース)を選択の上、「パブリッシュ」をクリックします。
少し待つと、「 ソリューション パッケージが作成されました」というメッセージが表示されるので、「パッケージを確認」をクリックします。
※ このメッセージを逃してしまった場合は、 Orchestrater > テナント > ソリューションから、作成したソリューションを右クリックして「パッケージのバージョン」をクリックすることで、同様の画面が開きます。
パブリッシュしたソリューションの「⋯」をクリックし、「パッケージをデプロイ」をクリックします。
デプロイ先を指定します。
ソリューションは、既存のフォルダ内に子フォルダーを作成してデプロイされます。
「ターゲットフォルダー」から既存フォルダを選択し、「ソリューションのルート フォルダー名」はそのまま、もしくはわかりやすい名前をつけて「続行」をクリックします。
そのまま「デプロイ」をクリックします。
デプロイが成功すると、指定したターゲットフォルダー内にフォルダーが作成され、作成したエージェントが含まれていることを確認できます。
※ すでに存在するフォルダー名を付けた場合、既存フォルダーに格納されるのではなく、「フォルダー名(連番)」という形で新しいフォルダーが生成されます。
RPAワークフローから呼び出す
詳細なワークフローの構築については省略し、Studio WebのRPAワークフローからエージェントを実行する方法を紹介します。
エージェントを実行するには、「エージェントを実行」アクティビティを用います。
※ アクティビティを選択するアクティビティ名が「ジョブに実行」に変化しますが、問題ありません。
「Orchestrater フォルダー パス」にエージェントをデプロイしたフォルダを選択すると、「プロセス名」としてエージェントを指定することができます。
「入力引数」をクリックすると、入力値を設定することができます。
任意の値(ここでは受信メールの本文)を設定し「保存」をクリックすれば、設定完了です。
エージェントの出力を後続の処理で使用するには、ジョブを実行 > 出力引数から引数名を選択します。
実用には不完全なフローではありますが、全体フローとしては次のようになっています。
指定メールフォルダーのメールへ返信メールの下書きを作成します。
ツールを使用する
エージェントは、「自然言語の指示を理解し、達成するために、自律的に思考し”行動”するAI」です。
行動するための要素である「ツール」について紹介します。
エージェントの開発画面に戻り「ツールを追加」からツールの追加を行うことができます。
ツールとして、次のようなものを選択できます。
- オートメーション(構築済みのRPAワークフロー)
- エージェント
- アクティビティ(一部サービスとの連携を行うもの)
エージェントが判断して構築したオートメーションを実行できることが、やはりUiPathエージェントとしての大きな強みといえます。
なお、アクティビティは以下のサービスに関するものが提供されています。(執筆時点)
エスカレーション パスを使用する
エージェントの実行結果の確認や、エージェントの持つ情報で判断できない内容は、担当者へエスカレーションを行います。
エスカレーション パスは、Action Center上にエスカレーションします。
このAction CenterはUiPath Appsで構築した画面を用います。
そのため、エスカレーション パスを設定する際は、UiPath Appsで次のようなアプリを作成し、そのアプリを指定します。
まとめ
本記事では、UiPathエージェントの概要から、その構成要素、具体的なユースケース、そして簡単な作成手順までを解説しました。
UiPathエージェントは、生成AIとRPAをはじめとする強力な自動化機能を組み合わせることで、より人間的な対話を通じて複雑な業務プロセスを自律的に実行することができます。
ビジネスユーザーにとって自動化がより身近で使いやすいものになり、自動化の対象範囲を大きく広げる可能性を持っています。
ぜひこの機会にUiPathエージェントに触れ、自動化の幅を広げるきっかけにしてください。
UiPathエージェントをはじめとするAIエージェントの導入や検証を進めたい方は、Peaceful MorningのサービスRobo Runnerをご活用ください。
Robo Runnerは、RPA・AI開発経験が豊富なプロが開発を伴走サポートするサービスです。
UiPathエージェントの導入・検証における「こんなことってできるの?」「どうやって開発するの?」といった疑問を解決します。
コメントを残す