Speech Studioは、Azure Cognitive Services Speechサービスの機能を構築してアプリケーションに統合するためのツール群です。プロジェクトを作成するためのノーコードアプローチを提供し、リアルタイム音声テキスト化、カスタム音声認識モデル、発音評価、音声ギャラリー、カスタム音声、音声コンテンツ作成、カスタムキーワード、カスタムコマンドなどの機能へのアクセスを提供します。
Speech Studio
使いやすさ - 9.2
コスパ - 4.3
感動度 - 8.4
専門性 - 7.8
完成度 - 9.5
7.8
Great
目次
使ってみた
音声データまたはボイス録音による音声をテキスト化することができる。
吹き込んだ音声をリアルタイムでテキスト化することが可能。
多言語対応だが同時に複数言語認識は不可。(日本語と英語を使って話をする等)
言語選択
同じ言語でも地域別に出てくるのでかなり幅広く選べます。
所有のオーディオファイルの読み取りまたはリアルタイムで録音⇒テキスト化
無料版だと1分までと制限あり
出力結果の表示
こちらリアルタイムで録音したものです。
タイムラグもほとんどないし言い方を早め遅めでやってみたんですが漢字変換までやってくれます。
具体的なアウトプット
ビジネス
- 会議の議事録に
- 文字起こしの仕事に
一般的
- 文字起こしに