オーディオディスクリプション

このトピックでは、動画のオーディオディスクリプション(音声解説)トラックを生成する Brightcove オーディオディスクリプション機能の使い方を説明します。

はじめに

オーディオディスクリプション機能は、AI を使用して動画用のオーディオディスクリプション(音声解説)トラックを生成します。オーディオディスクリプションは、アクション、シーンの切り替え、画面上のテキストなどの視覚要素をナレーションし、視覚障害者や弱視の視聴者にとってコンテンツをより利用しやすくします。この機能は標準オーディオディスクリプションを生成します。つまり、動画の自然な間(ポーズ)に解説を挿入します。

Video Cloud Studio では、次の 3 つのエントリポイントからオーディオディスクリプションを生成できます。

  • アップロードモジュール – アップロードワークフロー中または完了後にオーディオディスクリプションを生成します。
  • メディアモジュール – 2 つの方法:
    • 一括生成 – 複数の動画をまとめてオーディオディスクリプションを生成します。
    • 動画単位の生成 – 動画の詳細ページから 1 本の動画用にオーディオディスクリプションを生成します。

管理設定

デフォルト言語

アップロードモジュールまたはメディアモジュールからオーディオディスクリプションを生成する際に事前選択されるよう、デフォルトのオーディオディスクリプション言語を設定します。これは設定のみの手順で、生成は実行されません。

  1. 管理 モジュールを開き、Upload Settings を選択します。
  2. Captions and Languages セクションで Default Audio Description Languages を探し、事前選択したい言語を追加します。

    管理モジュール - オーディオディスクリプションのデフォルト言語
  3. 設定を保存するために Save をクリックします。

AI 透明性ラベル

生成されたオーディオディスクリプショントラックに AI 透明性ラベルを付けるかどうかを選択できます。

  1. 管理 モジュールで Captions and Audio を選択します。
  2. AI Transparency Labels セクションで Audio Description をオンに切り替えると、生成されたオーディオディスクリプショントラックに AI ラベルが追加されます。

アップロードモジュール

アップロードワークフローの一環として、アップロードモジュールからオーディオディスクリプションを生成します。

  1. アップロードモジュールに移動します。
  2. 左側のオーディオディスクリプションフィールドで、オーディオディスクリプションを生成する言語を選択します。

    アップロードモジュール - オーディオディスクリプションオプション
  3. アップロードを完了します。処理が完了すると、オーディオディスクリプショントラックは動画の詳細のオーディオトラックとして、バリアントDescriptive(解説)で表示されます(オーディオディスクリプションの表示場所を参照)。

メディアモジュール:一括生成

メディアモジュールから複数の動画をまとめてオーディオディスクリプションを生成します。

  1. メディアモジュールで、処理する動画を選択します。
  2. ...メニューをクリックし、キャプションとオーディオを選択します。

    メディアモジュール - キャプションとオーディオの一括メニューオプション
  3. ダイアログで左側のオーディオディスクリプションセクションに移動し、右側の追加ボタンで言語を設定します。選択した言語を保存します。

    一括オーディオディスクリプションダイアログ - 設定
    一括オーディオディスクリプションダイアログ - オプション
  4. 生成をクリックしてオーディオディスクリプションの生成を開始します。

    一括オーディオディスクリプションダイアログ - 確認
  5. 処理が完了すると、各動画の動画の詳細ページの言語セクションにオーディオディスクリプショントラックが表示されます(オーディオディスクリプションの表示場所を参照)。必要に応じて確認して公開します。

メディアモジュール:動画単位の生成

動画の詳細ページから 1 本の動画用にオーディオディスクリプションを生成します。

  1. メディアモジュールで動画を開き、言語セクションを探します。
  2. オーディオトラックの横の追加ボタンをクリックし、オーディオディスクリプションを生成をクリックします。

    動画の詳細 - 言語セクション
  3. 言語を選択して生成をクリックします。言語を選択しない場合、デフォルトが適用されます。

    動画の詳細 - オーディオディスクリプションの生成
  4. 処理が完了すると、新しいオーディオディスクリプショントラックが言語セクションに表示されます(オーディオディスクリプションの表示場所を参照)。必要に応じて確認して公開します。

オーディオディスクリプションの表示場所

生成後、オーディオディスクリプションは動画の詳細ページの言語セクションに表示されます。オーディオトラックとして、バリアントDescriptive(解説)と表示されます。

オーディオディスクリプションの編集

  1. オーディオディスクリプションを編集するには、種類がdescriptions(解説)に設定されている対応するテキストトラックを編集する必要があります。
  2. テキストエディタで変更を加えて保存します。保存後、更新したテキストがオーディオトラックに反映されるよう、オーディオディスクリプションを再生成します(オーディオディスクリプションを生成ボタンを使用)。

API アクセス

オーディオディスクリプション機能は Ingest API で利用できます。すべてのエンドポイントで、スコープ video-cloud/video/read 付きの OAuth が必要です。

オーディオディスクリプションジョブの作成/取得(動画単位)

エンドポイント:

POST | GET https://ingest.api.brightcove.com/v1/accounts/{account_id}/videos/{video_id}/ai/audio-descriptions
Scope: video-cloud/video/read

POST – オーディオディスクリプションジョブの作成

動画のオーディオディスクリプション生成を開始します。リクエストボディ:

  • languages: 必須。文字列の配列。少なくとも 1 つの言語コード(例:["en-US", "es-ES"])。言語ごとに 1 トラックが生成され、レート制限は言語ごとにカウントされます。
  • ai_transparency_label(任意、文字列):対応する場合、生成されるオーディオディスクリプショントラック用の AI トランスペアレンシー ラベル。

Dynamic Ingest: transcriptions の各要素に、同じ languages(および任意の ai_transparency_label)を持つ audio_descriptions を含めます。トランスクリプトファイルの取り込み — 取り込み時のオーディオディスクリプションを参照してください。

レスポンス:job_id(文字列)、job_status(例:processing)。

GET – 動画のジョブ一覧の取得

指定したアカウントおよび動画のオーディオディスクリプションジョブをすべて返します。レスポンス:ジョブオブジェクトの配列。各ジョブには以下が含まれます:

  • account_idvideo_id: 文字列
  • job_id: 文字列(ワークフロー実行 ID)
  • languages: 文字列の配列(例:["en-US"]
  • status: processing | finished | failed
  • error: 文字列(statusfailed の場合に存在)
  • input: 文字列(ジョブ作成時に使用したワークフロー入力の JSON)

ステータスはワークフローから更新されます。statusfinished の場合、オーディオディスクリプショントラックは動画の言語セクションで、バリアントDescriptive(解説)オーディオトラックとして利用可能になります(オーディオディスクリプションの表示場所を参照)。

オーディオディスクリプションジョブ一覧の取得(アカウント単位)

GET https://ingest.api.brightcove.com/v1/accounts/{account_id}/ai/audio-descriptions/jobs
Scope: video-cloud/video/read
Response: ジョブオブジェクトの配列(動画単位 GET と同じ形式)

サポートされる言語

オーディオディスクリプションは次の言語で生成できます。

オーディオディスクリプションでサポートされる言語とコード(その 1)
言語 コード
アフリカース語af
アラビア語ar
アルメニア語hy
アッサム語as
アゼルバイジャン語az
ベラルーシ語be
ベンガル語bn
ボスニア語bs
ブルガリア語bg
中国語zh
クロアチア語hr
チェコ語cs
デンマーク語da
オランダ語nl
英語en
エストニア語et
フィンランド語fi
フランス語fr
ドイツ語de
ギリシャ語el
ヒンディー語hi
ハンガリー語hu
アイスランド語is
オーディオディスクリプションでサポートされる言語とコード(その 2)
言語 コード
インドネシア語id
アイルランド語ga
イタリア語it
日本語ja
韓国語ko
リトアニア語lt
マレー語ms
ノルウェー語no
ペルシア語fa
ポーランド語pl
ポルトガル語pt
ルーマニア語ro
ロシア語ru
セルビア語sr
スロバキア語sk
スロベニア語sl
スペイン語es
スウェーデン語sv
タガログ語tl
タミル語ta
トルコ語tr
ウクライナ語uk
ウェールズ語cy

よくある質問

  • 処理にはどのくらい時間がかかりますか?
    動画の長さによって数分かかることがあります。準備ができると、オーディオディスクリプショントラックは動画の詳細ページの言語セクションに、バリアントDescriptive(解説)のオーディオトラックとして表示されます。
  • クレジット消費はどのように計算されますか?
    処理した動画の分数に基づいて計算されます。詳細はアカウント担当者にお問い合わせください。