発表セッション:[G31] セキュリティ・プライバシ② (3月3日(水) 10:00-11:40 ルームG) 会議ページ プログラムページ
LINEでは,プライバシファーストなデータ基盤を構築すべく,先端技術の研究開発に取り組んでいます.本技術報告では,ICDE2021に採択された差分プライベートな深層生成モデルの研究事例をご紹介します.差分プライバシの保証には,ノイズの加算が必要となり,生成モデルにおいては品質劣化が生じます.我々の研究では,このノイズに頑健な学習手法を提案し,これまで困難であった高次元データにおいても高い品質と高いプライバシ要求の両立を実現しました.本手法を用いることで,生成モデルの共有によるプライバシに配慮したデータの流通が期待されます.生成モデル以外にもクエリ応答やデータ収集における差分プライバシの実用化に向けた取り組みについてご紹介します.
招待講演1(3月1日(月) 17:00-17:50)の開始前にご紹介
発表セッション:[H24] 自然言語処理① (3月2日(火) 15:00-16:40 ルームH) 会議ページ プログラムページ
世界はこの一年で,今まで経験したことが無いほどの大きな変化に直面しています.リクルートでは,こうした世界の変化に適応する新しい価値を見据え,現在,世界で注目されている技術要素をいち早く発見するための研究に取り組んでいます.今回,論文公開サイト「arXiv」のデータを集計し,独自のスコアリング手法を用いて,技術要素や関連する論文リストを抽出,技術要素の類似度を可視化する手法を考案しました.実際に本手法を用いて,我々自身が次に取り組むべき研究テーマの検討を開始しています.本セッションでは,当該研究内容についてご紹介致します.
DBSJアワー(3月2日(火) 13:00-14:40)の開始前にご紹介
発表セッション:[F25] 情報検索・情報推薦⑥ (3月2日(火) 17:00-18:40 ルームF) 会議ページ プログラムページ
Yahoo! JAPANでは100を超えるサービスを運営しており,その多くでサービス内コンテンツの推薦システムが導入されている.推薦の用途や扱うデータがサービスによって異なることを背景として,Yahoo! JAPANでは汎用レコメンデーションエンジンを構築している.本発表では,この汎用エンジンでどのようにスケーラブルなモデル学習を実現しているかを説明する.またレコメンデーションを異なるコンテンツの集合にまたがって利用するためのロジック改善施策についても紹介する.
招待講演2(3月3日(水)15:00-15:50)の開始前にご紹介
発表セッション:[F21] 情報検索・情報推薦④ (3月2日(火) 10:00-11:40 ルームF) 会議ページ プログラムページ
本技術報告では,会社訪問アプリ「Wantedly Visit」の実データに対して相互推薦システムの手法を適用した評価実験についてその概要を紹介する.ウォンテッドリー株式会社が運営する会社訪問アプリ「Wantedly Visit」は,企業とユーザ(ビジネスパーソン)をマッチングする採用プラットフォームである.ユーザに対しては企業(または企業の募集)が推薦され,ユーザは「話を聞きに行きたい」ボタンを押すことで気になる企業へのアプローチが可能である.一方で,企業に対してはユーザが推薦され,「スカウト」機能を利用することで気になるユーザへのアプローチが可能である.このようにサービス内のユーザを互いに推薦するシステムを RRSs(Reciprocal Recommender Systems; 相互推薦システム)と呼ぶ.アイテムをユーザに推薦する形式の従来の推薦システムにおいては,基本的にユーザからアイテムへの嗜好(評価)のみに基づいて推薦が行われる.一方で RRSs においては,ユーザどうしの相互の嗜好に基づいて推薦が行われるという大きな特徴がある.このため,従来の推薦システムにおける手法をそのまま RRSs に適応するのみでは十分ではない場合があり,RRSs 独自の手法が提案されてきている.そこで我々は,3.6万社以上の企業と270万人以上のユーザが登録する会社訪問アプリ「Wantedly Visit」の実データに対して RRSs 独自の手法を適用する評価実験を実施しその性能の検証を行った.
招待講演1(3月1日(月) 17:00-17:50)の終了後にご紹介
発表セッション:[J33] 地理情報② (3月3日(水) 13:00-14:40 ルームJ) 会議ページ プログラムページ
近年EC需要の発展に伴い物流業界ではドライバー不足や労働環境の悪化などが課題が多く散見され,この背景からラストワンマイル配送を必要とする企業における物流戦略が見直されている.弊社においても,実世界の複雑な業務を加味した計算困難問題に対する数理最適化の適用と,顧客の課題解消と物流業務改革を多く担ってきた.本セッションでは,ラストワンマイル最適化での最適化検討の論点や,業務適用上の留意点,量子コンピューティングを含めた次世代技術の可能性について,弊社事例を交えご紹介します.
DBSJアワー(3月2日(火) 13:00-14:40)の終了後にご紹介
発表セッション:[H31] 自然言語処理② (3月3日(水) 10:00-11:40 ルームH) 会議ページ プログラムページ
株式会社LegalForceでは,企業の法務部門や弁護士事務所向けに契約書検索システムを提供している.本技術報告では,企業法務ドメインに特化したエンタープライズ検索システムの設計と実装について報告する.また,専門性の高いプライベートデータ検索における課題と,ドメイン特有の課題について検討し,最後に,今後の展望について触れる.
招待講演2(3月3日(水)15:00-15:50)の終了後にご紹介
発表セッション:[J14] 地理情報① (3月1日(月) 15:00-16:40 ルームJ) 会議ページ プログラムページ
不動産業界では,Web広告,不動産物件の参考価格算出,オンライン物件見学など,生産性の向上や利用者の利便性向上にテクノロジーを活用する動きが盛んになっている.その裏側には,情報学・コンピュータ科学分野におけるデータベース・機械学習・画像処理・自然言語処理・GISはもちろんのこと,経済学・建築学・都市学・行動心理学など,広範にわたる学術分野の研究の知見が活用されている.本発表では,LIFULLにおけるWebマーケティング,不動産参考価格算出サービス,間取り図解析,物件情報の「名寄せ」などの事例を取り上げ,上記の学術分野の知見がどのように活用されているかを報告する.
発表セッション:[J24] IOTとストリーム処理 (3月2日(火) 15:00-16:40 ルームJ) 会議ページ プログラムページ
富士通研究所では,コネクテッドカーなどの大量IoTデバイスから高頻度でデータセンター/クラウドへ送られてくるイベントデータを高スループットかつリアルタイムに処理するストリーム処理基盤技術「Dracena」を開発しています.Dracenaはステートフルで,たとえば実世界の自動車等のデバイス1台1台に対応する仮想的なオブジェクトをシステム上に作成し,そこに実世界から送られてくるイベントデータの内容をステートとして保持しています.このようなステートフルなシステムを,パッチ適用などのためにシステムA→システムBと切り替えるためには,従来はストリーム処理を一旦停止する必要性がありました.本発表では,ストリーム処理を止めないままにシームレスに切り替える新技術について発表します.本技術はメンテナンスで便利に使えるだけではなく,システムAが元々4台構成な場合にシステムBを8台構成とすることによって動的スケールアウトがダウンタイム無しで可能となり,これはステートフルなストリーム処理システムでは今まで実現できていませんでした.
発表セッション:[E13] 機械学習② (3月1日(月) 13:00-14:40 ルームE) 会議ページ プログラムページ
楽天のデータサイエンスグループでは,ツリーベースのアンサンブル学習モデルを解釈可能にし,より多くの人から信頼を得ることで,こうした機械学習モデルの社会実装を促進する,というプロジェクトに取り組んでいます.本発表では,①SHAPやLIMEのような幅広い分野で活用が進んでいるアルゴリズムから,ICMLなどの学会でここ数年発表された新しいアルゴリズムまで,これらのアルゴリズムをどのように活用することでモデルの社会実装を促進しているのか,②オープンソースソフトウェア等のコミュニティにどのように価値還元しているのか,をお話しします.
発表セッション:[E11] 機械学習① (3月1日(月) 10:00-11:40 ルームE) 会議ページ プログラムページ
機械学習モデルの再現性を担保するためには学習に利用したデータセットや処理の内容,データセットの生成過程を管理する必要がある.特に,そのデータセットが他の機械学習システムの出力である場合には開発する機械学習モデルとその機械学習システム間に依存関係が発生する.このような機械学習モデルの開発に関連する依存関係の整理を自動化するために我々は機械学習モデル管理基盤Etnaを開発した.Etnaは抽象化された機械学習のデータフローに基づき,モデルのバージョン管理およびデータの依存関係の管理を行う.本発表ではデータフローの抽象化の方法やその機能について紹介する.
発表セッション:[H13] 情報要約 (3月1日(月) 13:00-14:40 ルームH) 会議ページ プログラムページ
ニュースアプリケーションにおいて,推薦対象となるニュース記事は更新の頻度が高く,推薦システムにおいて様々な課題が存在する.本発表では,このような推薦対象の更新頻度が高いニュースアプリケーションにおいて,推薦システムを構築し,システムの良し悪しを評価する際の課題と,研究開発チームにおける取り組みについて発表する.