技術に密着 - 安全で没入感のあるボイスチャットを実現するには

「技術に密着」はテックトーク・ポッドキャストと連動したブログシリーズ。 第20回のテーマは「Robloxアバターの進化」でした。CEOのデイビッド・バシュッキがエンジニアリング部門のシニアディレクター、キラン・バート、製品部門のシニアディレクター、マヘシュ・ラマスブラマニアン、製品統括マネージャーのエフィー・ゴナワンと対談。アバターやRobloxの技術的挑戦を取り上げながら没入型コミュニケーションの未来について探ります。 今回はシニアエンジニアリングマネージャーのアンドリュー・ポートナーさんをゲストに迎え、没入感のあるボイスチャットの安全性という技術的課題について取り上げます。安全でマナーあるデジタル環境の実現にチームはどのように貢献してきたのでしょうか。

第20回

Robloxアバターの進化

エンジニアリング部門のシニアディレクター、キラン・バートの プロダクト部門のシニアディレクター、マヘシュ・ラマスブラマニアン、プロダクトマネージャーのエフィー・ゴーナワン
エンジニアリング部門のシニアディレクター、キラン・バート(Kiran Bhat)の プロダクト部門のシニアディレクター、マヘシュ・ラマスブラマニアン(Mahesh Ramasubramanian)、プロダクトマネージャーのエフィー・ゴーナワン(Effie Goenawan)が当社CEOのデヴィッド・バズーキとアバターを使った没入型コミュニケーションの未来と、その実現のために取り組んでいる技術的な課題について語ります。 ネット上での自己表現ができるようになるだけでなく、アバターを使って音声や顔の表情、身振り手振りを交えて没入型の空間でコミュニケーションもできるかについて語り合います。

チームにとって最大の挑戦は何でしたか?

重要なのは安全でポジティブな体験を保証すること。 安全とマナーはいつも念頭に置いてることだけど、リアルタイムの管理となると技術的な挑戦になる。 問題があれば確認して措置をとるというのをリアルタイムでやりたかったんだ。Roblox規模でそれをやるのは困難だ。 効率的に処理するには自動化された安全システムの活用が必要だろう。

それに審査をする時も精度も問題だ。乗り越えるべき壁になった。 ポリシー違反を指摘するときのアプローチは2種類あって、正確なフィードバックをリアルタイムで送る必要がある。リアクティブな審査とプロアクティブな審査だ。 リアクティブな審査には、機械学習モデルを開発して各種ポリシー違反を分類できるようにした。ユーザーからの通報を受けて対処する形になる。 プロアクティブな審査の方は、リアルタイム検知システムで潜在的なポリシー違反を見つけ出し、ユーザーに注意を送る。 音質を向上させて話し言葉を理解させるのは複雑なプロセスになった。 開発は進んでるけど、究極の目標はポリシー違反をリアルタイムで検知できる高精度のモデルだ。

どんな革新的なやり方で技術的挑戦に取り組んだんですか?

エンドツーエンドの機械学習モデルを開発したんだ。音声データを分析して、ポリシー違反の分類(いじめ、暴言など)に応じてCL(信頼水準)を出力させる。 このモデルのおかげで、特定の通報があった際に自動で対処できる機会がすごく増えた。 モデルが間違いないと判断すれば措置をとる。確実に人間をしのぐ性能を持ってるんだ。 実装からたった数か月で、英語のボイスチャットについての通報はほとんどこのモデルで審査できるようになった。 モデルの開発は内部で行われた。多くのオープンソース技術とRobloxの頑張りが実を結んで、この仕組みを支えているんだ。

リアルタイムで適切な判断を下すのは複雑そうですよね。 どういう仕組みなんですか?

システムが文脈を把握できるよう、いろんなアイデアを詰め込んだよ。 措置をとる前にパターンも確認する。これにより正当な措置だったか確かめることができる。 ユーザーの年齢や、場がどれだけプライベートかといった要素など、状況によってポリシーの適用の形が変わってくる。 これを念頭に置いて、機械学習を活用し、リアルタイムでマナーを啓発する新しい方法を模索しているんだ。 最近では、自動でポリシーに関するプッシュ通知を送る機能が追加された。 声のトーンなども考慮して発言の意図を判断できないか試してみてるところだ。ただの冗談なのか、傷つける意図があったのか区別するんだ。 複数の言語を話す人もいるし、文の途中で混ざってくることもあるから、多言語モデルについても開発中だよ。 いずれにせよモデルには正確性が求められる。

典型的な違反行為であるハラスメント、差別、暴言が現在注力している分野だ。 そういったものに関する通報が大部分だからね。 この分野に有効なインパクトを与えて、マナーあるオンライン会話とはいかなるものか、業界の基準を打ち立てるのが狙いだ。 機械学習のリアルタイム活用には可能性を感じるよ。誰もが安全でマナーある体験を送れるようになるだろう。

Robloxの挑戦はどこが特別だと思いますか? 何が取り組みの原点となったんでしょうか。

Robloxのスペーシャルボイスチャット技術は、リアルで没入感があるコミュニケーションを可能にした。 例えば、誰かの左で話すとその人の左耳から声が聞こえるようになる。 現実の会話を再現しようとしているんだ。これが挑戦の始まりだった。

ゲーマーとして、嫌がらせやいじめの現場はオンラインで何度も見てきた。 曖昧に終わることが多いから見逃されがちな問題だ。ユーザーの匿名性もある。 だけど、この技術的チャレンジは他のプラットフォームとは一線を画している。チームメイトとしかやり取りが発生しない環境もあるからね。 Robloxの場合、現実と同じようにソーシャルな場を提供している。交流のやり方もいろいろだ。 ただリアルな環境というだけでなく、誰もが安心してやり取りできる環境にしないといけないからね。機械学習とリアルタイム信号処理の進歩のおかげで、効率的に悪質な行動を検知して対処できる。 Robloxのテクノロジー、そして没入感のあるプラットフォーム。さらにポリシーをユーザーに広めていく義務もある。全部が組み合わさって、挑戦に立ち向かっていかないといけないんだ。

この技術的挑戦から得られた重要な学びは?

すごい学びがあったと思うよ。 機械学習は専門じゃないんだ。 普段はゲームのフロントエンドを担当してる。自分の能力を超えてモデルを活躍させることになったわけだ。 オンラインの場では共感が不足してることが多い。マナー啓発の動きによって、思いやりの水準を引き上げたいという思いがある。

何より、学習データがすべてを左右するという学びがあった。 データは正確で、人間が納得できるラベルでポリシー違反的な発言を分類する必要がある。 誰もが納得する品質のデータで学習させることが大切なんだ。 なかなか厄介な問題だけどね。 機械学習は革新的だけど、まだまだ発展途上の分野だ。 機械学習にはまだまだ向上の余地がある。だから現段階での限界を把握しておくことが大切になる。

Robloxの価値観のうちチームが特に重視したものは?

コミュニティの尊重が基本になったかな。 まず、マナーの向上とポリシー違反の防止に集中しなければいけなかった。 ユーザー体験全体に影響するところだからね。 新機能をどう展開していくかも、慎重に考えないといけなかった。 モデルが誤って違反を検出しないよう気をつける必要もある。無実のユーザーにペナルティが発生してはいけないからね。 モデルのパフォーマンスやユーザーエンゲージメントへの影響を監視することも欠かせない。

Robloxとチームの未来について楽しみなことを教えてください。

公の場でのボイスチャットをより良くできたと思う。順調だけどやるべきことはまだまだ残ってる。 プライベートな場での会話も興味深い分野だ。 プライベートな会話をより良くする余地はたくさんあるはずだ。近しい友人と自分を表現し合ったり、バーチャル空間を越えて通話したり、同じバーチャル空間で交流しながら会話したりできるようになる。 コミュニティの交流を促進する便利なツールを提供するのもいい。コンテンツやアイデアを共有したり、コミュニティに加入したり、自分の手で管理する際に役立つ。

拡大を続けるコミュニティを支えるため、チャット技術をどう広げていくべきだろうか? やれることはまだまだあるし、まだ表面をなぞっただけだ。オンライン交流全体のマナー改善、これまでにない業界をまたいだ連携も可能かもしれない。 適切なテクノロジーと機械学習のパワーを手にしているRobloxは特別な立場にある。オンライン交流の未来を担っているんだ。