MMMブログ

Amazon ConnectにAIサービス(Comprehend / Transcribe)を組み合わせたクラウドコンタクトセンターの検証

このエントリーをはてなブックマークに追加

新型コロナウイルス感染症に関連する様々な問題を一つの契機としてAWSのコンタクトセンターサービス Amazon Connect を活用し「テレワーク(在宅勤務)環境でもコンタクトセンターを運営できるようにしたい」というご相談をいただく機会が弊社でも増え始めています。

昨今、コンタクトセンター(PBX)市場においても、クラウド化の流れが急激に進んでおり Amazon Connect でも

  • いつでも、どこでも、アクセスが可能なクラウド方式
  • 電話とチャットを統合したコンタクトセンター
  • スキルベースルーティング
  • チャット・電話の全録音
  • 高品質の日本語ボイス機能
  • グラフィカルでわかりやすいコールフロー制御
  • データ分析

これら機能が搭載され、大規模コンタクトセンター運営にも十分耐えうるレベルまで進化を遂げていますが、Amazon Connectの一番の強みは、多種多様なAWSサービスとの連携によって、コンタクトセンター業務にクラウドのテクノロジーを投入し、ビジネス競争力を強化できる(デジタル・トランスフォーメーション支援が可能な)点であると考えています。

そこで、今回は弊社で先日検証した、AWSのAIサービスである「Amazon Comprehend」と「Amazon Transcribe」をAmazon Connectと組み合わせることで実現できる、AI連携型のクラウドコンタクトセンターをご紹介します。

目次

ビジネス上の想定要件

コンタクトセンターに日々蓄積される「お客様の声」をデータ化し、会話の分析・可視化を進めることで、各メンバーのナレッジを形式知化し、最終的に顧客満足度とロイヤリティの向上につなげていきたい。

これらの実現に向け

  • 音声通話の全録音
  • 録音データのテキスト化
  • 会話の分析
  • 解析データの可視化

このようなシステム基盤が必要となります。

利用するAWSサービス

今回のクラウドコンタクトセンター検証では、下記5つのサービスを活用します。

サービス名 検証での主な用途
Amazon Connect コンタクトセンターでの音声通話・録音とコールフロー制御
Amazon Comprehend 会話から感情分析とエンティティの抽出
Amazon Transcribe 録音された音声のテキスト変換
AWS Lambda ビジネスロジックと各コンポーネントの連携
Amazon QuickSight 解析データの可視化(グラフ化)


AWSではデータを準備するだけでAPIから機械学習を簡単に利用できるAIサービスが多数あり、その中で今回はAmazon Comprehend、そしてAmazon Transcribeを利用します。

Amazon Comprehendとは?

機械学習によってインプットされたテキストから有用な情報を分析・発見する自然言語処理サービスであり、データから「キーフレーズ」「構文」「エンティティ」「言語情報」「感情分析」を抽出できます。(2019年11月から日本語にも対応)

Amazon Transcribeとは?

音声をテキストデータに変換するサービスであり、音声ファイルからの変換はもちろん、言語によってはリアルタイム変換も可能。(2020年4月時点では日本語はリアルタイム変換には未対応)

クラウドコンタクトセンター検証の構成

Amazon Connectで生成した会話録音ファイルをAmazon Transcribeによってテキスト化、その後Amazon Comprehendで解析していきます。

連携にはAWS Lambdaを用いてAWSマネージドサービスのみでサーバーレスな構成を組みました。加えてAmazon Comprehendでの解析結果はBIサービスであるAmazon QuickSightを使い、可視化します。

検証の進め方

コンタクトセンターで発生する会話ケースとして

  • ケース1. オンラインショップでの商品購入者に対して電話アンケートを実施
  • ケース2. 新商品キャンペーンに関するコンタクトセンターへの問い合わせ対応

の2つを準備しました。

それぞれトークスクリプトを使い「コールセンター担当役」「お客様役」を切り替えて、Amazon Connectに準備されたコールセンターへ架電・会話し、録音から解析までの一連の流れを実行します。

トークスクリプトの内容について

「ケース1.」は、コールセンターからの電話を受けた顧客は “迷惑だな…” と感じながらも、最後まで回答するパターンを想定。

「ケース2.」は、新商品キャンペーンに興味を持った顧客が、コールセンターへ問い合わせし、淡々と回答していく。というパターンです。

少し長い文面ですが全文を確認したい方向けに掲載します。

ケース1.トークスクリプト全文

担当者「突然のお電話にて、申し訳ございません。私、MMMショップの佐々木と申します。こちらは、国本様のお電話でお間違いないでしょうか?」

お客様「はい、国本です。どういったご用件でしょうか?」

担当者「このたびは、当店でパソコンをご購入下さり誠にありがとうございます。実際に使った感想などをうかがいたく、お電話した次第です。ただ今、お時間1~2分程度、よろしいでしょうか?」

お客様「いま、忙しいんですが、本当に1分くらいなら大丈夫ですけど….」

担当者「有難うございます。では、いくつか質問させていただきます。まず、パソコンを買い替えられた理由は何でしょうか?」

お客様「重くて、外出時の持ち運びが不便だったからです」

担当者「持ち運びに手間がかかると、大変ですものね。お気持ちは、よく分かります。新しいパソコンは、問題ありませんか?」

お客様「はい!とても軽いので、移動が疲れず助かっています」

担当者「ほかに気に入っている点はございますか?」

お客様「もう、時間がないんで、いい加減にしてもらえますか?迷惑です!」

担当者「申し訳ございません。大変失礼しました。アンケートにご協力下さり、感謝いたします。最後にお客様からご質問があれば、おうかがいします」

お客様「特に、ないです…..。」

担当者「ありがとうございます。これからも引き続き当ショップをご利用下さい。では、失礼いたします」

ケース2.トークスクリプト全文

担当者「お電話、ありがとうございます。株式会社MMM キャンペーン事業部です」

お客様「今、そちらで開催している新商品の販促キャンペーンはいつまで行っていますか?」

担当者「キャンペーンの実施期間に関するお問い合わせですね。今回は、4月1日から4月14日までの2週間にわたって実施しています」

お客様「開催場所についても、聞きたいのですが・・・」

担当者「キャンペーン会場は、国際センターです」

お客様「その辺りはよく知らないので、最寄り駅とかも教えてもらえますか?」

担当者「最寄り駅は山の手線の高田馬場駅です。南口の改札を出ると、そこから直通の連絡通路で会場までつながっています。現地には案内地図も出ているので、そちらも確認していただければ迷わずに到着できると思います」

お客様「駅からは遠いですか?」

担当者「徒歩5分くらいの距離ですが、キャンペーン中は混雑するため入場するまでに30分ほどお待ちいただく場合もあります。ご不便をおかけして、申し訳ございません」

お客様「あと、入場料はいくらですか?」

担当者「大人の方もお子様も、無料で入場していただけます」

お客様「分かりました。いろいろ、ありがとうございます」

担当者「恐れ入ります。もしほかにも不明点がありましたら、弊社のホームページもご確認下さい。では、失礼いたします」

音声テキスト化と会話分析の検証結果

2つの会話ケースで実施した検証結果から

  1. 通話データをAmazon Transcribeでテキスト化した精度
  2. テキスト会話をAmazon Comprehendで分析したデータ

に焦点を当て見てみます。

1. Amazon Transcribeによる音声テキスト化の精度

実際にAmazon Transcribeでテキスト化された結果を全文記載します。

ケース1.のテキスト化結果

Speaker 0:
はい もしもし

Speaker 1:
突然 電話 し て 申し訳 ござい ませ ん 私 ショップ の 佐々木 と 申し ます
Speaker 1:
こちら 栗本 様 の お 間違い ない でしょ う か

Speaker 0:
はい 国本 です どう いっ た ご 用件 でしょ か

Speaker 1:
この たび 当店 パソコン ご 購入 ください 誠 に ありがとう ござい ます 実際 に 使っ た 感想 など を お 伺い し たく て 電話 し た 次第 です
Speaker 1:
ただいま お 時間 一 二 分 程度 よろしい でしょ

Speaker 0:
う か?
Speaker 0:
今、 忙しい です けど 本当 に 一 分 ぐらい だっ たら 大丈夫 です けど

Speaker 1:
ありがとう ござい ます
Speaker 1:
で は いく つ か 質問 さ せ て いただき ます まず パソコン を 買い換え られ た 理由 は 何 でしょ う

Speaker 0:
か 重く て! 外出 時 の 持ち運び が すごく 不便 だっ た から です ね

Speaker 1:
持ち運び に 手間 が かかる の かかる と 大変 です ね はい ええ
Speaker 1:
お 気持ち は よく わかり ます 新しい パソコン 問題 あり ませ ん か

Speaker 0:
はい とても 軽い で 移動 が 疲れ ず に 助かっ て ます

Speaker 1:
他 に 気 に 入っ て いる よう で ござい ます か

Speaker 0:
もう 時間 が ない ん で 本当 に ちょっと もう いい 加減 に し て 貰っ て いい です か 結構 迷惑 です

Speaker 1:
申し訳 ござい ませ ん 大変 失礼 し まし た アンケート に ご 協力 ください 感謝 いたし ます 最後 に お 客 様 から ご 質問 が あれ ば お 願い いたし ます か

Speaker 0:
いや 特に ない です

Speaker 1:
ありがとう ござい ます これ から も 引き続き 当 ショップ を ご 利用 ください じゃあ 失礼 いたし ます

Speaker 0:
おい

ケース2.のテキスト化結果

Speaker 0:
俺 も ありがとう ござい ます 株式 会社 メール キャンペーン 事業 部 です

Speaker 1:
今 そちら で 開催 する 新 商品 の 販促 キャンペーン
Speaker 1:
で 行なっ て ます か

Speaker 0:
キャンペーン 実施 期間 に 関する お 問合せ です ね 今回 は です ね 四 月 二 日 から 四 月 十 四 日 まで の 二 週間 に 渡っ て 実施 し て い ます

Speaker 1:
開催 場所 に つい て も 聞き たい! ん です けど あ

Speaker 0:
処置 し まし た キャンペーン 会場 は です ね か 国際 センター で ござい ます

Speaker 1:
そう なっ たら よく 知ら ない んで あの 最寄り 駅 と か 教え て もらえ ます か

Speaker 0:
承知 いたし まし た 最寄り駅 は です ね 山手 線 高田馬場 駅 で ござい ます 南口 の 開発 札 を 出る と そっ から 直通 の 連絡 通路 で 会場 まで 繋がっ て おり ます の で 現地 に は 案内 地図 も 出 て いる の で そちら を ご 確認 し て 頂けれ ば まず 到着 できる と 思い ます

Speaker 1:
駅 から 遠い です ね

Speaker 0:
徒歩 五 分 くらい の 距離 です が キャンペーン 中 は 混雑 する ため に 利用 する まで 三 十 分 ほど 待ち いただく こと も ござい ます ご 不便 を お 掛け し て 申し訳 ござい ませ ん

Speaker 1:
うん

Speaker 1:
あと に 重量 いくら です か

Speaker 0:
大人 の 方 も お 子 様 無料 で 入場 し て いただけ ます

Speaker 1:
分かり まし た 色々 ありがとう ござい ます

Speaker 0:
恐れ入り ます もし 他 に も 不明 点 ござい まし たら 弊社 の ホーム ページ を! ご 確認 ください で は 失礼 いたし ます
Speaker 0:
うん

誤変換・誤用があった箇所

Amazon Transcribeによるテキスト化で、明らかな誤変換や誤用があった箇所を目検チェックすると

対象 誤変換・誤用・文脈誤り
会話ケース1. 4箇所
会話ケース2. 6箇所

このような結果となりました。

Amazon Connectでの通話時の発声ボリューム、抑揚、発音により、結果は変動するとは思いますが、本検証ではテキスト化を意識してゆっくり話すという考慮はせずプレーンな会話状況から考えると、用途によっては十分実用に耐えうるレベルではないでしょうか。
※余談ですが弊社「MMM(エムエムエム)」の社名はすべてテキスト時に欠落していました… _| ̄|○

2. Amazon Comprehendでの感情・エンティティ分析

Amazon Transcribeでテキスト化した会話を、Amazon Comprehendによる自然言語処理で「感情」と「エンティティ(固有名詞)」分析を実施した結果を見てみます。

感情分析の結果

Amazon Comprehendでの感情分析は

  • 中立: Neutral
  • 肯定的: Positive
  • 否定的: Negative
  • 混在: Mixed

この4分類でスコア表示され、2つの会話ケースは下記結果となりました。

対象 中立 肯定的 否定的 混在
ケース1. 0.42 0.55 0.01 0.00
ケース2. 0.83 0.16 0.00 0.00

ケース2.については、新商品キャンペーンの問い合わせに対して淡々と回答するという内容であったため「中立」スコアが高いという納得感があるものの、ケース1.については「肯定的」スコアが高く「否定的」なやりとりが考慮されていない点が気に掛かりました。

今回の検証では両ケースとも「テキスト全文を一括に」感情分析しましたが、より細かく文脈や行単位で解析を進めることで、結果も大きく変動すると考えられます。

エンティティ(固有名詞)分析の結果

Amazon Comprehendでは、テキストの内容を分析し、Detect Entities として定義されている単語・分類を検出することが可能です。

検出できる分類
タイプ 説明
COMMERCIAL_ITEM 商品やブランド名称
DATE 日付・時刻
EVENT フェスティバル、コンサートなどのイベント
LOCATION 国、都市などの特定場所
ORGANIZATION 政府、企業などの大規模組織
OTHER 他のカテゴリのいずれにもあたらないエンティティ
PERSON 個人、集団、ニックネーム
QUANTITY 通貨、パーセント、数値、バイトなどの数量・金額
TITLE 映画、本、歌、などの作品名

エンティティ分類された生データでは視覚的に把握しづらいため、今回はAWSのBIサービスである、Amazon QuickSightに解析結果を投入しグラフ化しました。

ユースケース1.のエンティティグラフ化


ユースケース2.のエンティティグラフ化


「ございます」といった言い回しが DATE EVENT LOCATION に分類されている箇所がありますが、コールセンター対応における感情可視化や、対話の主要なキーフレーズ、エンティティのデータ蓄積とインデックス化を進めることで、ビジネス用途に即した様々なデータ活用が考えられるのではないでしょうか。

今後の展望とまとめ

Amazon Transcribeの今後のアップデートによって、多言語同様に日本語もリアルタイムテキスト化をサポートした場合は、Amazon Connectでの会話をストリーミングデータとして取り扱い、リアルタイムで音声会話をテキスト化・解析が可能となり、即時性の高い判断が求められるコンタクトセンタービジネスにも、よりAI活用の範囲が進むのではないかと期待しています。

弊社では今回ご紹介したAmazon Connectはもちろん、AWSクラウドを徹底的に活用した企業のデジタルトランスフォーメーション(DX)を全方位で支援できる実績とナレッジがあります。

Amazon Connectやサーバーレス、その他AWSを活用したビジネスアプリケーション開発に関して相談をしたい方は、ぜひお気軽に株式会社MMMお問合せページからご連絡ください!

お問い合わせ

見積もり依頼や詳しいご相談など、クラウド・AWSに関する困りごとをお気軽にご相談ください。
以下のお問い合わせ先から受け付けています。

お問合わせはこちら

※通常1営業日内にご回答いたします。