Skip to content

테크 인사이드 - 몰입형 음성 커뮤니케이션 내 안전성 해결하기

테크 인사이드(Inside the Tech)는 저희의 Tech Talks 팟캐스트와 연관되는 블로그 시리즈입니다. 팟캐스트의 에피소드 20, Roblox 아바타의 진화(The Evolution of Roblox Avatars)에서 David Baszucki Roblox CEO가 엔지니어링 부문 시니어 디렉터 Kiran Bhat, 프로덕트 부문 시니어 디렉터 Mahesh Ramasubramanian, 프린시플 프로덕트 매니저 Effie Goenawan과 함께 아바타를 통한 몰입형 커뮤니케이션의 미래와 이를 위해 저희가 해결하고자 하는 기술적 과제에 대해 이야기했습니다. 테크 인사이드의 이번 편에서는 시니어 엔지니어링 매니저 Andrew Portner와 함께 이러한 기술적 과제, 몰입형 음성 커뮤니케이션에서의 안전성, 그리고 어떤 노력을 통해 Roblox에서 모두에게 안전하고 시민성을 지키는 디지털 환경을 조성할 수 있을지에 대해 이야기합니다.

팀에서 마주하는 가장 큰 기술적 과제는 무엇인가요?

저희는 사용자 분들께 안전하고 긍정적인 경험을 제공하는 것을 최우선으로 생각합니다. 안전성과 시민성은 항상 우선 순위로 여기는 요소이지만, 이를 실시간으로 관리하는 것은 기술적으로 큰 도전 과제입니다. 문제가 발생할 때 즉시 검토하고 조치를 취하고 싶지만, Roblox의 규모를 고려하면 쉽지 않은 일입니다. 이 정도 규모를 효과적으로 관리하려면 자동화된 안전 시스템을 활용해야 합니다.

저희가 초점을 맞추는 또 다른 기술적 과제는 안전성 조치의 정확성을 높이는 것입니다. 정책 위반을 감지하고 실시간으로 정확한 피드백을 제공하기 위해 두 가지 콘텐츠 관리 접근 방식을 도입했습니다. 바로 반응형 관리와 사전 예방적 관리입니다. 반응형 관리에서는 머신러닝(ML) 모델을 개발하여 사람들이 플랫폼에서 신고한 사항에 응답해 다양한 정책 위반 유형을 정확하게 식별할 수 있도록 합니다. 사전 예방적 관리에서는 정책을 위반할 가능성이 있는 콘텐츠를 실시간으로 감지하고, 사용자에게 행동 관련 교육을 제공하는 것을 목표로 하고 있습니다. 음성 언어를 이해하고 오디오 품질을 향상시키는 것은 매우 복잡한 과정입니다. 이미 개선되고 있기는 하나 궁극적인 목표는 실시간으로 정책 위반 행동을 정확하게 감지하는 정밀한 모델을 개발하는 것입니다.

기술적 과제를 해결하기 위한 혁신적 방식이나 해결책에는 무엇이 있을까요?

오디오 데이터를 분석하고 정책 위반 유형에 따라 신뢰 수준을 제공하는 엔드투엔드 ML 모델을 개발했습니다. 예를 들어, 특정 음성이 괴롭힘, 욕설 등의 정책을 위반할 가능성이 얼마나 높은지를 평가할 수 있습니다. 이 모델 덕분에 특정 신고를 자동으로 처리하는 능력이 크게 향상되었습니다. 저희는 모델의 신뢰 수준이 높으며 인간보다 우수한 성능을 발휘할 수 있다고 확실히 판단될 때에 조치를 취합니다. 출시 후 불과 몇 달 만에 이 모델을 활용하여 거의 모든 영어 음성 오남용 신고를 관리할 수 있게 되었습니다. 내부에서 개발한 이 모델은 다양한 오픈 소스 기술과 그 이면의 기술을 개발하고자 노력한 성과가 힘을 합친 산물입니다.

실시간으로 적합성을 판단하는 작업은 복잡할 것 같습니다. 어떻게 작동하는 건가요?

시스템이 문맥을 인식할 수 있도록 설계하는 데에 정말 많은 고려를 하고 있습니다. 또한 조치를 취하기 전에 시간에 따른 패턴을 분석하여, 저희가 취하는 대응이 정당한지 확신할 수 있도록 합니다. 정책의 경우 사용자의 연령, 공공 공간인지 사적 대화인지 여부, 그 외 여러 요인을 고려하여 세밀하게 조정됩니다. 저희는 실시간으로 시민성을 고취할 수 있는 새로운 방법을 모색하고 있으며, 그 중심에는 ML이 있습니다. 최근에는 자동 푸시 알림("넛지") 기능을 도입하여, 사용자에게 정책을 상기시키는 시스템을 구축했습니다. 또한 음성 톤 분석 등 다른 요소를 통해 사용자의 의도를 더 정확하게 파악하고, 풍자나 농담과 같은 표현을 구별하는 연구도 진행 중입니다. 마지막으로 다중 언어 모델 또한 개발하고 있습니다. 어떤 사용자들은 여러 언어를 사용하거나 심지어는 한 문장 안에서 언어를 전환하기도 합니다. 이를 효과적으로 감지하려면 정확한 모델이 필수적입니다.

현재 저희는 가장 심각한 유형의 오남용 문제, 즉 괴롭힘, 차별, 욕설을 우선적으로 해결하는 데 집중하고 있습니다. 이는 전체 신고 중 가장 많은 비중을 차지하는 요소들이며, 이러한 부분에서 의미 있는 변화를 일구어 온라인 대화에서 시민성을 고취하고 지켜 나가는 업계 표준을 정립하는 것이 Roblox의 목표입니다. 실시간 ML 기술을 활용하여 더욱 효과적으로 안전하고 예의 바른 온라인 환경을 조성해 나갈 수 있기를 기대합니다.

Roblox에서 해결하고 있는 문제가 어떤 점에서 특별한 것인가요? 먼저 해결한다는 것이 어떤 의미를 지니나요?

Roblox의 공간 음성 기능 채팅 기술이 현실 세계의 의사소통을 모방하여 더욱 몰입감 있는 경험을 제공합니다. 예를 들어 내가 누군가의 왼쪽에 서 있다면, 그 사람은 내 목소리를 왼쪽 귀로 듣게 되는 겁니다. 이러한 기술을 통해 현실과 유사한 커뮤니케이션 방식을 구현하고 있으며, 이는 저희가 선도적으로 해결할 수 있는 과제라 할 수 있습니다.

저 또한 게이머로서 온라인 게임에서 괴롭힘과 따돌림 등을 자주 목격해왔습니다. 이러한 문제는 사용자 익명성과 처벌 부재로 인해 종종 방치되곤 합니다 하지만 저희가 해결하려는 기술적 과제는 다른 플랫폼이 직면한 문제들과는 몇 가지 부분에서 다른 점이 있습니다. 어떤 게임 플랫폼에서는 팀원들끼리만 상호작용을 할 수 있는 경우도 있죠. Roblox는 거의 현실을 본뜬 사회적 환경에서 어울릴 수 있는 다양한 방식을 제공합니다. 저희는 ML 및 실시간 신호 처리 기술을 발전시켜 위반 행위를 효과적으로 감지하고 대응할 수 있도록 하고 있습니다. 이를 통해 현실적인 커뮤니케이션 환경을 조성하는 것뿐만 아니라, 모두가 안전하게 교류하고 소통할 수 있는 공간을 만들어 가고 있습니다. 이처럼 첨단 기술, 몰입형 플랫폼, 정책에 대한 사용자 교육의 노력을 결합함으로써, Roblox는 이러한 도전 과제를 정면으로 해결할 수 있는 위치에 섰습니다.

이러한 기술 작업을 통해 어떤 중요한 점을 알게 되었나요?

정말 많은 것을 배운 것 같습니다. 저는 ML 엔지니어가 아닙니다. 주로 게임의 프론트엔드 개발 작업을 해 왔죠. 따라서 이러한 모델이 작동하는 방식에 대해 깊이 이해할 수 있었던 것 자체에 큰 의미가 있었습니다. 제가 바라는 것은 시민성을 이끌어내기 위한 조치들이 궁극적으로 온라인에서 더 높은 수준의 공감을 형성하는 것입니다. 온라인 커뮤니티에는 아직 공감이 부족한 경우가 많으니까요.

마지막으로 깨달은 것은 모든 것이 투입되는 학습 데이터에 달려 있다는 점입니다. 그리고 데이터가 정확하려면 어떤 행동이 정책 위반인지에 대한 레이블링에 있어 사람들의 합의가 필요합니다. 결국 모두가 동의할 수 있는 고품질 데이터를 학습시키는 것이 아주 중요합니다. 하지만 이 문제를 해결하는 것은 쉽지 않습니다. 이 과정에서 ML이 다른 기술보다 훨씬 앞서 있는 영역도 있지만, 여전히 초기 단계에 머물러 있는 부분도 많다는 것을 알게 되었습니다. ML이 성장해야 할 영역이 많으며, 현재 기술의 한계를 인식하는 것이 매우 중요하다는 점을 다시 한번 실감했습니다.

Roblox에서 중요시하는 가치 중 팀에 가장 잘 맞는 것은 무엇인가요?

프로세스를 진행해 나가며 저희가 지침으로 삼는 가치는 '커뮤니티 존중'입니다. 첫째로, Roblox 플랫폼에서는 예의를 증진하고 정책 위반을 줄이는 것에 집중해야 합니다. 이는 전체적인 사용자 경험에 큰 영향을 미칩니다. 둘째로, 새로운 기능을 도입할 때는 신중한 태도를 갖춰야만 합니다. 모델이 위양성(위반 사항이 아닌 것을 그렇다고 잘못 표시하는 경우 등)을 생성하여 사용자들이 부당하게 제재받지 않도록 주의해야 합니다. 따라서 모델 성능을 지속적으로 모니터링하고 사용자 참여에 미치는 영향을 분석하는 것이 필수적입니다.

Roblox, 그리고 팀이 향하는 방향에서 어떤 부분이 가장 기대되나요?

공개 음성 커뮤니케이션 개선에서 상당한 진전을 이루었지만, 아직 해야 할 일이 많습니다. 특히 개인 간 소통은 매우 흥미로운 영역입니다. 개인 소통 개선에 큰 기회가 있다고 생각합니다. 사용자들이 가까운 친구들과 자유롭게 소통하고, 다양한 경험 속에서 실시간 음성 통화를 유지하며, 친구들과 상호작용하는 방식을 발전시키도록 하는 겁니다. 또한 사용자들에게 더 좋은 도구를 제공해 자율적으로 조직을 구성하고 커뮤니티에 참여하며, 콘텐츠를 공유하고 아이디어를 나눌 수 있도록 할 수도 있겠죠.

커뮤니티가 계속 성장하는데 Roblox의 채팅 기술 규모를 어떻게 키워서 지원할 수 있을까요? 아직 할 수 있는 것 중 표면만 살짝 건드려 본 정도입니다. 온라인 커뮤니케이션과 협업에서 시민성을 개선할 수 있는 새로운 방식을 찾을 수 있을 것이라 믿습니다. 올바른 기술과 ML 역량을 활용하여, 저희는 시민 의식 있는 온라인 소통의 미래를 만들어 나갈 독보적인 위치에 있다고 할 수 있습니다.