Microsoftは、人工知能(AI)搭載の無料カメラアプリ「Microsoft Pix カメラ」をアップデートし、撮影中の動画の音声を認識し、リアルタイムで字幕を作成する機能を追加しました。
動画に自動で字幕を追加
無音で写真撮影できることでも人気の「Microsoft Pix カメラ」は、バージョン2.2へのアップデートにより、撮影中のビデオ内の音声を認識し、字幕が追加できるようになりました。
アップデート後に起動すると、ビデオの最長時間は10分であること、音声認識はMicrosoftのクラウドで行われることについての案内が表示されます。
字幕を追加するには、ビデオ撮影モードで「CC」のアイコンをタップし、斜線のない状態にして撮影するだけです。
字幕の追加は、背面カメラ、インカメラ、同時に2つのカメラで録画するマルチカメラのすべてに対応しています。
初期設定では、字幕が追加された動画だけが保存されますが、歯車アイコンの設定メニューから「ビデオ キャプション」で、「元のビデオの保持」をオン(緑)にすると、字幕の追加された動画と字幕付きの動画の両方を保存することができます。
認識精度はかなり高い、字幕の編集には非対応
筆者が試したところ、固有名詞などで誤認識もあるものの、きちんと前後の文脈を踏まえて認識内容を修正するほか、文の切れ目で句点(。)を打つなど、認識精度はかなり高いと感じました。
なお、動画に追加される字幕のフォントを変更したり、文字を編集することはできません。
また、自動文字起こししてできる言語は、iPhoneで設定されている言語に依存しており、外国語の音声を文字起こしさせるには、iPhoneの言語設定を変更する必要があります。
試しにiPhoneの言語設定を英語にして、ティム・クック最高経営責任者(CEO)が先日、業績を発表した際の音声を録画したところ、正確に文字化していました。
Microsoftは文字起こし専用アプリも公開
Microsoftは先日、無料の文字起こしアプリ「Group Transcribe」をリリースしています。
「Group Transcribe」は、アプリ内で言語の切り替えができ、文字起こししたテキストを編集・共有することも可能です。
Source:Microsoft
(hato)
- Original:https://iphone-mania.jp/news-358697/
- Source:iPhone Mania
- Author:iPhone Mania