AI活用のテキストマイニングとは
AI活用の幅が広がっています。AIは自然言語処理でも利用されてきており、文字データ処理に対する期待も高まっています。ここでは、従来の統計解析で難しいとされている定性データについて、テキストマイニングの現状をAI活用の可能性とともに解説していきます。
そもそもテキストマイニングとは
テキストマイニングとは、大量のテキストデータ(文字データ)から有益な情報を取り出し(マイニング=採掘する)活用することを指します。
テキストデータは、顧客の声としてSNSやWebに多く見られます。その文字列から得られる情報も、数多く集めて眺めるとそれぞれの関係や傾向を掴むことができます。そのデータ群から価値あるものを取り出すことを、テキストマイニングと言います。
定量データと定性データの違い
ビッグデータで、あらゆるデータが蓄積され価値ある情報として活用が試みられています。
データの分析というと統計解析が思い浮かぶ人も多いでしょう。統計解析では、数値化された定量データの分析を得意とします。ここで言う「定量データ」とは、あらかじめ決まった売り上げや利益・販売数など、数値として比較できるデータを指します。
この定量データを時系列に蓄積し、前年度比較や今後の販売予測などに利用します。
テキストデータは、人が感じる印象や感情など数値がしにくいものです。このような数値化しにくいデータを、「定性データ」と言います。アンケートの自由記入欄を考えると、その欄には多様な意見が記述されていますが、同じような回答の傾向がみられる場合は、対策が必要となります。
分かりやすく言うと、「定量データ」は数値化されたデータ、「定性データ」は数値化しにくいデータと覚えておくと良いでしょう。
テキストマイニングで扱うデータ
テキストマイニングで扱うデータは、どこから得られるでしょうか?理解しやすいようにいくつかの分類で解説していきます。以下は、企業が対象とするテキストデータの入手経路です。
・直接の顧客 直接の顧客は、自社の問い合わせ窓口のデータを活用します。コールセンターを解説している場合は、問い合わせの電話や電子メールなどが挙げられます。また、ウェブの問い合わせフォームなども該当します。チャットボットを導入している場合は、そのやり取りも利用します。
近年ではSNSに感想を投稿する場面も多いので、TwitterやInstagram・Facebookなどもデータとして活用するのが良いでしょう。
・将来の見込み客 リーチできていない顧客や新製品開発などの意見は、アンケートなどを実施し、集計します。SNSや口コミ・商品比較サイトの投稿、ブログなどが対象となります。自社の競合する商品やサービスに関しても得られる情報は活用対象とします。
・社内業務や社内作業 社内打合せのメモや議事録、あるいは営業活動の報告書は見過ごさず活用できる情報はテキストマイニングで抽出すると良いでしょう。営業の日報などは、社内と顧客を結ぶ接点でもありますので、有効活用が望まれます。
テキストマイニングの利用メリット
利用メリットとしては、顧客の真のニーズを把握できることが挙げられます。データを抽出することにより、商品の改善が促進され、ニーズに合う商品開発や訴求のためのプロモーションなどに活用することができます。
競合との差別化や、自社の価値を高めるブランド戦略にも有効です。将来の事業戦略を立案するうえでも、経営判断を手助けする情報となるでしょう。社内においても業務改善が促進し、結果として顧客にプラスとなる仕組みを設けることができます。
AIを活用したテキストマイニングの特徴
テキストマイニングは定性データが対象であるため、人手で集計するのは大変な労力を要します。抽出手順を決めるのも一苦労です。エクセル集計も不可能ではありませんが、AIや集計ツールを活用することで、労力を大幅に削減することが期待できます。
集計ツールにより、単語の出現頻度の表示や、スコアが高い単語を大きいサイズで表示するワードクラウドが、より簡単に実現できるようになります。*
特にAIの活用は、蓄積されているビッグデータ全体を対象とした分析も可能になりますので、単語同士のつながりが分かる共起ネットワークの表示など、幅広い情報の関係性や優先付けなどが可能になります。*
AIベースのテキストマイニングのツールと事例
テキストマイニングは、いかに大量のデータから効率的に有効な情報を抽出し可視化できるかが重要です。そのためには深層学習や機械学習など、AI技術を用いて広範囲な情報が活用できれば、意思決定や意思統一などにも有効です。ここでは、良く利用されるツールと活用事例を解説していきます。
AIテキストマイニング by ユーザーローカル
「AIテキストマイニング」は、ユーザーローカルが提供するAI活用のテキストマイニングサービスです。アンケートの自由回答やコールセンターの音声ログ、クチコミなどの分析、感情認識など、AIを活用して価値ある分析結果が得られます。
使い方は簡単で、ウェブのフォーム欄に張り付けたり、ファイルをアップロードしたりするだけで利用できます。誰もが利用可能な無料版に加えて、企業向けに機能拡張したビジネス版も提供されています。利用実績が多く、手軽に始めることができます。
【参考】:AIテキストマイニング by ユーザーローカル 【参考】:AIテキストマイニング ビジネス版
KH Coder
「KH Coder」は、テキストデータの内容分析・テキストマイニングを行うフリーソフトウェアです。日本語と英語に対応しており、アンケートの自由回答やインタビューの記録・新聞記事などに対応します。
内部ではR言語を用いており、研究用途の分析の実績も多数あります。プログラム開発不要で、多変量解析による分析を行うことができます。AI・機械学習にも対応します。Windows版は、手間なくインストールが可能です。
【参考】:KH Coder 【参考】:KH Coder 3 ダウンロード
R言語+RMeCab
「R言語」は、統計解析で用いるオープンソース・フリーソフトウェアのプログラミング言語です。定量データの分析のみならず、定性データ分析にも活用できます。ここで「RMeCab」などの日本語テキストマイニングパッケージを導入すると、目的のテキストマイニング環境が構築できます。
使用するには、ベースとなる日本語形態素解析器MeCabとともに導入します。R言語をお使いの方であれば、戸惑うことはないでしょう。
【参考】:The R Project for Statistical Computing 【参考】:GitHub RMeCab 【参考】:アールメカブ 【参考】:GitHub MeCab
AIテキストマイニングの事例
テキストマイニングは、ツールやサービスを利用することで手間なく始めることができます。アンケート集計や、意見の集約、授業での活用などのニーズも増えていますが、オンラインで集計するフォームを活用することもできます。以下が、具体的なフォームの例です。
・Microsoft Forms Microsoft Formsは、Microsoft 365の機能でExcelやSharePoint・Teamsなどから利用することもできます。回答の可視化やExcelでエクスポートしたデータを活用することもできます。AI技術により作業の支援や提案が行われます。
【参考】:Microsoft Forms 【参考】:Microsoft Forms: アンケート データに関するより多くの洞察を得る
・Google Forms Google Formsは、Googleが提供するオンラインフォームです。フォームの作成や自動集計などに使用します。おすすめするのは、ユーザーローカルの「AIテキストマイニング」との併用です。Google Formsで簡単に作成したフォームデータは、スプレッドシートに保存することができます。
そのスプレッドシートは「AIテキストマイニング」の入力データに利用できます。
この手法は、学校教育でも着目されています。クラスのワークショップでリアルタイムに活用したり、学級通信で結果を共有したりして、生徒が感じていることを簡単に可視化することができます。
【参考】:Google Forms
AI活用のテキストマイニングは見えない要求を可視化します
従来のように人手によるテキストデータの集計作業は、非常に労力を伴います。特に情報源が多様化され、顧客のニーズも多岐に渡る現代では、真のニーズを把握するのは容易ではありません。見えない要求や隠れた問題は、時間の経過により大きな障害となり得ます。AI活用のテキストマイニングは、定性データの分析方法としておすすめの方法です。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから