技術 | ACRCloud

音声フィンガープリントとは?

音声フィンガープリントとは、それぞれのコンテンツが持つ固有の特性のことで、ちょうど、個人を特定できる人間の指紋と似ています。音声フィンガープリントは、コンテンツの数秒間の音声から抽出され、そのコンテンツの独自性を識別するのに使われます。さらに、フレーム単位の画像による映像識別技術もあります。これらを用いた弊社独自のソリューションを利用すれば、数百万時間におよぶコンテンツを管理可能かつ効果的な方法で識別できます。ACRのフィンガープリントライブラリには5,000万もの音声トラックが保存されていますが、これは世界でも最大規模です。

自動コンテンツ認識 (ACR) の仕組み

特許認定済みである自動コンテンツ認識 (ACR) 技術は、主にテレビなどのファーストスクリーンで放送される音声や映像からリアルタイムに生成されるフィンガープリントから、そのコンテンツを識別することができ、何らかのアクションを実行するのに用いられます。さらに、ACRCloudの技術によって、コンテンツの音声やそれぞれのメタデータの特性、ファイルのハッシュ値、ウォーターマーク、さらにはファイル形式、コーデック、ビットレート、圧縮技術といった情報を、独自の方法で数秒以内に正確に特定できます。

セカンドスクリーン同期

これは、音声や動画のストリーム、テレビ放送やライブイベントなどに連動して起こる、セカンドデバイスの活動のことです。連動して起こる活動とは、投票などの相互作用や、コンテンツに関する情報の表示、コンテンツに関するソーシャルメディアのフィード、そして広告などです。