リクルートテクノロジーズ、機械学習による画像検索を実現。色やデザインをもとに直感的に検索、精度は80%超に ~機械学習ロジックをフル活用、新たなユーザー価値を創造~

株式会社リクルートテクノロジーズ(本社:東京都千代田区、代表取締役社長:中尾隆一郎、以下:リクルートテクノロジーズ)は、人工知能の実現技術として注目を集めるDeep Learningをビジネスに適用する取組みの一環として、画像検索システムを構築し、サービスに実装しました。
「Deep Learningによる画像解析」と「Active Learningによるモデル改善」を組み合わせることによって、継続的に検索精度を上げることができる仕組みを実現しています。システム導入の結果、複数のWebサービスにおいて検索精度が向上したり、ユーザーの平均閲覧数が向上する結果となっています。

①非構造データ解析への挑戦 ~「人と同じ判断ができる」人工知能によって、眠れる大量の画像データを有効活用~

リクルートテクノロジーズは、人工知能の実現技術として注目を集めるDeep Learningを活用した非構造化データ(※)解析の一環として、独自の画像解析システムを開発しました。“人と同様の判断ができるようになる”ことによって、色やデザインなどに応じた直感的な検索を実現しています。
本技術の導入により、リクルートグループのサービスが抱える大量の「画像情報」を有効に活用し、サービスクオリティやユーザーの体験価値を今まで以上に向上させることを目的としています。
※画像やテキストなど、構造定義されないデータ。数値やトラフィック情報など、データベース上で管理されてきた「構造化データ」と対比される。

②Deep LearningとActive Learningによる機械学習ロジックを活用 ~精度向上に加え、継続的なモデル改善が可能に~

以下のような流れで、画像認識機能を実装しています。人間の脳の構造を模倣した学習モデルであるDeep Learningや、精度向上に必要な情報を自動推薦してくれるActive Learningなど、世界でも実用例の少ない機械学習ロジックを組み合せることによって、画像から物体を認識する精度を高めています。

 

画像中の物体認識に使われる技術
【特徴を定量化】:Deep Learning
└脳の構造を模倣したニューラルネットワークの一種です。画像などのデータを細かく分解し、特徴点を自動で抽出することによって、人間が関与することなく学習を進めることができます。DeepLearningのパラメータチューニングを繰り返し行うことによって、物体の認識精度は約80%となり、従来の技術Sparse Codingのみを活用した場合に比べ、2倍以上に向上しました。
【機械学習によるデータ識別】:Support Vector Machine(SVM)
└パターン認識モデルの一つで、事前に蓄積したデータを元に、与えられたデータを分類し、識別することが可能です。

精度向上や、システム運用をサポートする技術
【継続的な精度チューニング】:Active Learning
└Deep LearningやSVMによるデータ識別の精度向上のために、追加で加えるべき学習データを自動推薦してくれるシステムです。人手をかけることなく、継続的に画像解析の精度を向上させることが可能です。
【専門家でなくとも、容易に活用】:独自のAPI
└Webサービスの提供者が画像をinputとして送信し、ラベル付き結果を受け取るのみで運用できる仕組みを構築しました。専門的な知識を持たずとも、簡単に上記の画像解析システムを活用することが可能です。

③直感的な画像検索を実現、ユーザーがアクションしやすい環境に ~サイト閲覧数やクリック率が向上~

「ホットペッパービューティー」スマートフォンアプリ ネイル検索事例
株式会社リクルートライフスタイル(本社:東京都千代田区、代表取締役社長:淺野健、以下、リクルートライフスタイル)が運営するホットペッパービューティーのスマートフォンアプリにおいて、
 A.ネイルデザインのカラー検索(39色から選択)
 B.ネイルの類似デザイン検索
という2種類の画像検索システムを実装しました。登録された1枚1枚の画像に対し、AIがネイルの位置を自動判別し、カラーヒストグラムやデザインを識別。検索結果へと反映されます。人手で入力されたカラーやデザイン情報をベースに検索していた従来の画像検索に比べ、正確かつ詳細な解析を行い、直感通りの結果を表示可能になりました。
結果、「A.カラー検索」においては検索結果のクリック率が大幅に向上し、「B.類似デザイン検索」においても平均閲覧画像数が増えるなど、ユーザーのアクション増加につながっています。

 

「ギャザリー」 不適切画像の検出事例
キュレーションマガジン「ギャザリー」において、運営元のリクルートライフスタイルとの連携のもと、“不適切画像を検出し、排除するシステム”を試験的に導入しました。解析を複数段階に分けて重み付けを行うことによって、約95%の精度を実現しています。

~技術の概要~
・DeepLearningを活用し、画像を定量化するロジックを用いて、Safe/Sexual/Glotesqueをラベル分け。
・2段階の判別を採用。最初の判別でラベルの想定結果を重み付けする機能(※)により、精度が約95%まで向上。
・3万300枚/時以上の速度で、画像のラベル分けが可能に。
※二段階の想定結果重み付けロジックは、現在特許出願中。

上記の他にも、将来的には「画像に何が写っているかを検出する技術」を高めることによって、“画像を登録するだけでテキスト情報が入力される”機能や、逆に“テキストを入力することによって、関連する画像が精度高く表示される”といった世界を実現できると考えています。
画像や文書など、複雑なデータの意味を人力ではなくAIで判別できれば、これまで見落とされていた大量のデータを、もっと有効かつ直感的に活用することができるようになります。また、言語の違いにより海外展開に壁があるテキストデータに比べ、画像から受ける印象は国に関わらず、普遍的であることが多いため、将来的には画像データをデータハブにすることで海外におけるデータ解析のさらなる推進を行いたいと考えています。そのような未来を見据え、リクルートテクノロジーズは今後も、画像認識やテキスト分析等、非構造化データの解析を進めてまいります。

◇これまでにない体験価値の提供を目指す、リクルートテクノロジーズの取組み

リクルートテクノロジーズは、これまでにない体験価値をユーザーへ提供することを目指し、先進的な技術をリクルートグループのサービスに実装する取組みを行っています。ビッグデータ活用や機械学習に関連した取組みを、以下に紹介します。

ビッグデータに関連した講演実績
◆システム管理者のための夏期講習(2015年7月10日)
『リクルートのビッグデータ活用基盤とデータ活用に向けた取組み』

リクルートのビジネスを支えるビッグデータ活用基盤とメタデータ管理システム【METALOOKING(メタルキング)】について紹介。複数サービスを事業ごとに運営する中、データの定義情報が企画/開発間で分散管理されるなどしてデータを十分に活用できないという課題が顕在化。システム管理者の視点から、データ定義(=「メタデータ」)の統合管理システムを開発し、分析者目線で必要な機能を見極めて常に情報更新される運用の定常化までを一気通貫で実施。分析プロセスの効率化に成功しました。

◆2015年度人工知能学会全国大会(2015年5月31日)
『ユーザーとの長期伴走を考慮したブライダル・ウェディング情報の情報推薦システムの構築』

短時間で効率良くマッチングしアクションに結びつける一般的なレコメンドに対し、「一定期間(数ヶ月~1年)、継続的にサービスを利用する」型のサービスにおける、「伴走型レコメンドアルゴリズム」を独自に開発。
機械学習の手法の一つ、「転移学習」を用い、アプリの一部におけるユーザーの行動から、アプリ全体をパーソナライズ。これによって各フェーズで最適なタイミングで適切な情報をレコメンドし、ユーザー心理を初期段階から育成することで、ユーザーのタイムシェアの獲得と、CV向上を実現した事例を発表しました。

◆Hadoopソースコードリーディング 第19回(2015年5月21日)
『レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証』

蓄積データ量の増加に伴うバッチの長時間化を背景に、次世代のデータ分析処理基盤として、Sparkの実用可能性をアプリ面から検証した際の検証方法と結果を発表。現状の基盤からレコメンド精度を損なうことなく、実行時間を大幅に短縮する結果となり、スケール性も同等であることから、次世代のレコメンド処理基盤としてのSparkの有用性が確認できました。

◆日経ビッグデータラボ 特別セミナー(2015年2月25日)
『マーケティング視点のBIGDATA活用について』

集客から実際のアクションまでの各フェーズにおけるビッグデータ活用事例に触れながら、リクルートにおけるビッグデータ活用の勝ちパターンについて言及。リクルートテクノロジーズにおけるビッグデータ組織立ち上げ時の経緯や拡大のポイントを振り返り、基盤担当と活用担当に組織を二分して運営するなど、組織運営のノウハウについても紹介しました。


URLを発信するビーコンデバイスと専用アプリを開発
IoT技術を有効活用するための一手として2015年3月、Bluetooth LEでURLを発信するビーコンデバイス(※)、および専用のスマートフォンアプリを開発し、実証実験を実施しました。
バス停やレストランにビーコンデバイスを設置することにより、近づいた人のスマートフォンが、バスの時刻表や残り待ち時間、レストランのメニューといった「今ここで必要な情報」を自動で取得・表示可能になります。
※グーグルが2014年10月3日に発表したPhysicalWebプロジェクトに おいて定義されているUriBeaconの仕様に準拠しています。

お問い合わせ先

株式会社リクルートテクノロジーズ PR事務局 池田(イケダ)・大澤(オオサワ)・大畑(オオハタ)
TEL:03-5545-3888 FAX:03-5545-3887 MAIL:https://www.recruit.co.jp/support/form/
〒107-0052 東京都港区赤坂1-7-1 赤坂榎坂森ビル5F

PDFダウンロード

(c) Recruit Co., Ltd.