はじめに
オーディオディスクリプション機能は、AI を使用して動画用のオーディオディスクリプション(音声解説)トラックを生成します。オーディオディスクリプションは、アクション、シーンの切り替え、画面上のテキストなどの視覚要素をナレーションし、視覚障害者や弱視の視聴者にとってコンテンツをより利用しやすくします。この機能は標準オーディオディスクリプションを生成します。つまり、動画の自然な間(ポーズ)に解説を挿入します。
Video Cloud Studio では、次の 3 つのエントリポイントからオーディオディスクリプションを生成できます。
- アップロードモジュール – アップロードワークフロー中または完了後にオーディオディスクリプションを生成します。
- メディアモジュール – 2 つの方法:
- 一括生成 – 複数の動画をまとめてオーディオディスクリプションを生成します。
- 動画単位の生成 – 動画の詳細ページから 1 本の動画用にオーディオディスクリプションを生成します。
管理設定
デフォルト言語
アップロードモジュールまたはメディアモジュールからオーディオディスクリプションを生成する際に事前選択されるよう、デフォルトのオーディオディスクリプション言語を設定します。これは設定のみの手順で、生成は実行されません。
- 管理 モジュールを開き、Upload Settings を選択します。
- Captions and Languages セクションで Default Audio Description Languages を探し、事前選択したい言語を追加します。
- 設定を保存するために Save をクリックします。
AI 透明性ラベル
生成されたオーディオディスクリプショントラックに AI 透明性ラベルを付けるかどうかを選択できます。
- 管理 モジュールで Captions and Audio を選択します。
- AI Transparency Labels セクションで Audio Description をオンに切り替えると、生成されたオーディオディスクリプショントラックに AI ラベルが追加されます。
アップロードモジュール
アップロードワークフローの一環として、アップロードモジュールからオーディオディスクリプションを生成します。
- アップロードモジュールに移動します。
- 左側のオーディオディスクリプションフィールドで、オーディオディスクリプションを生成する言語を選択します。
- アップロードを完了します。処理が完了すると、オーディオディスクリプショントラックは動画の詳細のオーディオトラックとして、バリアントDescriptive(解説)で表示されます(オーディオディスクリプションの表示場所を参照)。
メディアモジュール:一括生成
メディアモジュールから複数の動画をまとめてオーディオディスクリプションを生成します。
- メディアモジュールで、処理する動画を選択します。
- ...メニューをクリックし、キャプションとオーディオを選択します。
- ダイアログで左側のオーディオディスクリプションセクションに移動し、右側の追加ボタンで言語を設定します。選択した言語を保存します。
- 生成をクリックしてオーディオディスクリプションの生成を開始します。
- 処理が完了すると、各動画の動画の詳細ページの言語セクションにオーディオディスクリプショントラックが表示されます(オーディオディスクリプションの表示場所を参照)。必要に応じて確認して公開します。
メディアモジュール:動画単位の生成
動画の詳細ページから 1 本の動画用にオーディオディスクリプションを生成します。
- メディアモジュールで動画を開き、言語セクションを探します。
- オーディオトラックの横の追加ボタンをクリックし、オーディオディスクリプションを生成をクリックします。
- 言語を選択して生成をクリックします。言語を選択しない場合、デフォルトが適用されます。
- 処理が完了すると、新しいオーディオディスクリプショントラックが言語セクションに表示されます(オーディオディスクリプションの表示場所を参照)。必要に応じて確認して公開します。
オーディオディスクリプションの表示場所
生成後、オーディオディスクリプションは動画の詳細ページの言語セクションに表示されます。オーディオトラックとして、バリアントDescriptive(解説)と表示されます。
オーディオディスクリプションの編集
- オーディオディスクリプションを編集するには、種類がdescriptions(解説)に設定されている対応するテキストトラックを編集する必要があります。
- テキストエディタで変更を加えて保存します。保存後、更新したテキストがオーディオトラックに反映されるよう、オーディオディスクリプションを再生成します(オーディオディスクリプションを生成ボタンを使用)。
API アクセス
オーディオディスクリプション機能は Ingest API で利用できます。すべてのエンドポイントで、スコープ video-cloud/video/read 付きの OAuth が必要です。
オーディオディスクリプションジョブの作成/取得(動画単位)
エンドポイント:
POST | GET https://ingest.api.brightcove.com/v1/accounts/{account_id}/videos/{video_id}/ai/audio-descriptions
Scope: video-cloud/video/read
POST – オーディオディスクリプションジョブの作成
動画のオーディオディスクリプション生成を開始します。リクエストボディ:
languages: 必須。文字列の配列。少なくとも 1 つの言語コード(例:["en-US", "es-ES"])。言語ごとに 1 トラックが生成され、レート制限は言語ごとにカウントされます。ai_transparency_label(任意、文字列):対応する場合、生成されるオーディオディスクリプショントラック用の AI トランスペアレンシー ラベル。
Dynamic Ingest: transcriptions の各要素に、同じ languages(および任意の ai_transparency_label)を持つ audio_descriptions を含めます。トランスクリプトファイルの取り込み — 取り込み時のオーディオディスクリプションを参照してください。
レスポンス:job_id(文字列)、job_status(例:processing)。
GET – 動画のジョブ一覧の取得
指定したアカウントおよび動画のオーディオディスクリプションジョブをすべて返します。レスポンス:ジョブオブジェクトの配列。各ジョブには以下が含まれます:
account_id、video_id: 文字列job_id: 文字列(ワークフロー実行 ID)languages: 文字列の配列(例:["en-US"])status:processing|finished|failederror: 文字列(statusがfailedの場合に存在)input: 文字列(ジョブ作成時に使用したワークフロー入力の JSON)
ステータスはワークフローから更新されます。status が finished の場合、オーディオディスクリプショントラックは動画の言語セクションで、バリアントDescriptive(解説)のオーディオトラックとして利用可能になります(オーディオディスクリプションの表示場所を参照)。
オーディオディスクリプションジョブ一覧の取得(アカウント単位)
GET https://ingest.api.brightcove.com/v1/accounts/{account_id}/ai/audio-descriptions/jobs
Scope: video-cloud/video/read
Response: ジョブオブジェクトの配列(動画単位 GET と同じ形式)
サポートされる言語
オーディオディスクリプションは次の言語で生成できます。
| 言語 | コード |
|---|---|
| アフリカース語 | af |
| アラビア語 | ar |
| アルメニア語 | hy |
| アッサム語 | as |
| アゼルバイジャン語 | az |
| ベラルーシ語 | be |
| ベンガル語 | bn |
| ボスニア語 | bs |
| ブルガリア語 | bg |
| 中国語 | zh |
| クロアチア語 | hr |
| チェコ語 | cs |
| デンマーク語 | da |
| オランダ語 | nl |
| 英語 | en |
| エストニア語 | et |
| フィンランド語 | fi |
| フランス語 | fr |
| ドイツ語 | de |
| ギリシャ語 | el |
| ヒンディー語 | hi |
| ハンガリー語 | hu |
| アイスランド語 | is |
| 言語 | コード |
|---|---|
| インドネシア語 | id |
| アイルランド語 | ga |
| イタリア語 | it |
| 日本語 | ja |
| 韓国語 | ko |
| リトアニア語 | lt |
| マレー語 | ms |
| ノルウェー語 | no |
| ペルシア語 | fa |
| ポーランド語 | pl |
| ポルトガル語 | pt |
| ルーマニア語 | ro |
| ロシア語 | ru |
| セルビア語 | sr |
| スロバキア語 | sk |
| スロベニア語 | sl |
| スペイン語 | es |
| スウェーデン語 | sv |
| タガログ語 | tl |
| タミル語 | ta |
| トルコ語 | tr |
| ウクライナ語 | uk |
| ウェールズ語 | cy |
よくある質問
- 処理にはどのくらい時間がかかりますか?
動画の長さによって数分かかることがあります。準備ができると、オーディオディスクリプショントラックは動画の詳細ページの言語セクションに、バリアントDescriptive(解説)のオーディオトラックとして表示されます。 - クレジット消費はどのように計算されますか?
処理した動画の分数に基づいて計算されます。詳細はアカウント担当者にお問い合わせください。