はじめに
私たちは今、スマートフォン、タブレット、テレビ、職場、電車の中、歩きながらなど、さまざまな場面で動画を視聴しています。配信サービスが複数のデバイス向けにより多くのコンテンツを提供するようになるにつれ、その動画を配信するためのストレージや帯域幅のコストが増大しています。Brightcove では、多種多様なデバイスへ高品質な動画を効率的に大規模配信することが中核となっています。Context Aware Encoding を使用することで、ストレージや配信コストを大幅に削減しつつ、視聴者にとっての再生品質を向上させることが可能です。Context Aware Encoding は、高度なコンテンツ分析アルゴリズムを活用し、各動画に必要なレンディションの数と品質を決定します。多くの場合、視覚的な品質を維持しながら、動画ファイルサイズ(および CDN のコスト)を小さく抑えることができます。
Context Aware Encoding の申し込み
Context Aware Encoding のご利用には追加料金が必要です。動画に最適なレンディション構成を取得するため、弊社営業までご相談ください。
アダプティブ ビットレート ストリーミングの進化
現在、インターネットを通じて配信される動画の多くは、HLS や MPEG-DASH といったアダプティブ ビットレート(ABR)ストリーミング技術を用いて再生が最適化されています。ABR ストリームには、異なる解像度とビットレートでエンコードされた複数の「レンディション」(動画のコピー)が含まれています。ユーザーが再生ボタンを押すと、プレーヤーは利用可能なレンディションを記載したマニフェストを受信します。プレーヤーは、現在の帯域幅、バッファの充足度、再生ウィンドウのサイズなどの要因を基に、最適なレンディションを選択します。再生中にこれらの条件が変化すると、プレーヤーはより高品質または低品質のレンディションに切り替えることで、最小限のバッファリングで最高の映像体験を提供します。
ストリーミング サービスでは通常、すべてのコンテンツに対して単一のエンコード設定 — いわゆる「ラダー」と呼ばれる、事前定義された ABR レンディションセット — を作成します。ABR ラダーにどの解像度とビットレートを含めるかの決定は正確な科学ではありません。場合によっては、アニメーションのようにコンテンツの複雑さが少ないジャンルに特化して、ABR ラダーを低ビットレート向けに調整することも可能です。
静的 ABR の課題
幅広い視聴者に対応するため、配信者はすべてのコンテンツとエンドユーザーのデバイスに対して、単一のビットレート ラダーを使用する一律対応のアプローチを取らざるを得ません。多くの場合、単一の ABR ラダーが、テレビでの HD スポーツ視聴と、スマートフォンでのアニメ視聴の両方に使用されています。
問題は?単一のビットレートラダーを使用すると、コンテンツの種類ごとに画質がばらついてしまいます。スポーツのような複雑な動画では、満足のいく視聴体験を得るためにより多くのビットが必要です。たとえば、スポーツ動画の品質を確保するために ABR ラダーを高ビットレート寄りに調整すると、同じ設定でアニメをエンコードした場合、ストレージや帯域幅を無駄に消費することになります。この無駄なストレージと帯域幅は、実際のコスト増につながります。
Context Aware Encoding による ABR ストリームの最適化
そこで登場するのが、Brightcove の Context Aware Encoding 技術です。すべてのコンテンツに単一の ABR ラダーを使用する代わりに、Context Aware Encoding は各ソース動画を分析し、個別に最適化されたビットレート ラダー(レンディションのセット)を作成します。さらに、コンテンツを視聴する際の配信ネットワークやデバイスの制約も考慮されます。必要なレンディション数や、それぞれの解像度・ビットレートを決定し、すべてのタイトルで一貫した品質を維持します。これにより、ストレージおよび帯域幅のコストを大幅に削減し、ユーザーの再生体験も向上します。
下の図は、一般的な静的 ABR ラダーと、典型的なニュース映像に対して Context Aware Encoding で生成されたラダーの比較です。

Context Aware Encoding は、静的 ABR ラダーと同等の品質を、半分のレンディション数で実現し、各レンディションではより低いビットレートまたは高い解像度で配信しています。これは、再生性能とコスト効率の両面で大きな効果をもたらします。
低ビットレートでも優れた再生性能
静的 ABR ラダーでは、持続的に 1,000kbps の帯域幅しか持たないモバイル 3G ユーザーは、最大で 900kbps の 360p レンディションしか利用できません。一方、Context Aware Encoding では、より高解像度でありながら、低ビットレートの 432p(777kbps)レンディションを作成できると判断されました。このレンディションは 13% ビット数が少なく、それでいて解像度と品質は高くなっています。下の比較画像では、Context Aware クリップの方が、画面下部のテキストや男性の髪の毛などにおいて、より鮮明なディテールを確認できます。

同様に、3,000kbps の帯域幅を持つ安価な家庭用インターネットプランを使用しているユーザーは、静的 ABR ラダーでは 720p が上限ですが、Context Aware Encoding では 1080p でのストリーミングが可能となり、フル HD の視聴体験を提供できます。
ストレージと帯域幅コストの削減
静的 ABR ラダーで 8つのレンディションすべてにエンコードした場合、合計 14,750kbps のデータが生成されます。1分間の動画では、885MB になります。一方、Context Aware ラダーではわずか 4,950kbps となり、1分間の動画で 297MB です。これはストレージ コストで 66% の削減に相当します。帯域幅の使用量は視聴者数と視聴時間に依存するため、帯域幅の削減効果はストレージよりもさらに大きくなる可能性があります。Brightcove は、ストレージと帯域幅のコストを最大で 50% 削減できると見込んでいます。レンディションのビットレートを、画質を維持するために必要な最小限に調整することで、視聴者は通常、1回の視聴でより少ない帯域幅しか消費せず、さらなるコスト削減が可能になります。
Context Aware Encoding と Dynamic Delivery
Context Aware Encoding は、Dynamic Delivery の機能の一つです。Context Aware Encoding は各ソース動画を分析し、それぞれに最適化されたビットレート ラダー(レンディションのセット)をインテリジェントに構築します。視聴者が再生ボタンを押すと、Video Cloud はリクエストしているデバイスを特定し、求められるメディア形式(コーデック、配信用のパッケージ形式、DRM の種類、必要な字幕、音声言語など)を把握します。Dynamic Delivery はこの情報を用いて、再生デバイスに適したフォーマットで各品質レベルをリアルタイムに処理します。
以下の図は Dynamic Delivery のアーキテクチャを示しています。Dynamic Delivery の詳細については、Dynamic Delivery の概要 をご覧ください。

Video Cloud での Context Aware Encoding の使用
動画の公開作業において、Video Cloud Studio 内でいくつかの違いが見られます。まず、Upload モジュールで動画をアップロードする際、トランスコードプロファイルを選択するときに CONTEXT AWARE ENCODING セクションが表示されます。

Media モジュールでは、Dynamic Delivery または Context Aware トランスコードプロファイルを使用して取り込まれた動画タイトルの横に、緑色のクラウドアイコン()が表示されます。従来のトランスコードプロファイルを使用して取り込まれた動画には、灰色のアイコン(
)が表示されます。
