
2026 年 3 月 4 日 | ファラー・アブデル・アジズ、エマ・ルブラン
マスク着用が義務付けられている病院や臨床現場では、聴覚障がいのある方々は視覚的な手がかりがないため、依然として更なる障壁に直面しています。同様に、大規模な対面会議、バーチャルセッション、教室、講義などでは、発言者が遠く離れていたり、背を向けていたり、マイクの品質が悪かったりすると、会話を進めるのが難しくなることがあります。このような状況において、音声テキスト変換アプリは効果的でアクセスしやすいソリューションを提供します。
2020年にキャロリン・フォールズとクリス・コールソンがTech Reviewに掲載した記事では、いくつかの音声テキスト変換アプリの利点について考察しました[1]。その後、人工知能(AI)の急速な進歩により、これらのプラットフォームの精度と使いやすさは大きく変化し、新たなレビューが必要となりました。この記事では、増え続ける音声テキスト変換アプリの中から、3つのアプリを取り上げます。
オッター.ai
Otter.aiはAIメモ作成アプリとして販売されていますが、音声テキスト変換アプリとしても効果的に機能します。ZoomやMicrosoft Teamsなどのバーチャルプラットフォームとシームレスに統合し、ライブキャプションや会議後の議事録を生成します。
Otter.aiを開くと、会話(音声テキスト変換機能)、カレンダー(仮想会議の文字起こし)、アクションアイテムの3つのタブが表示されます。画面下部のマイクアイコンを使うと、ライブ会話を簡単に録音・文字起こしできます。録音が完了すると、音声は会話として保存されます。保存した会話を開くと、概要、文字起こし、AIチャット、コメントの4つのタブが表示されます(図1参照)。

図 1: Otter.ai – 患者の診察中にどのような決定が下されたかを伝えるために使用されるライブ録音の文字起こしと AI チャット。
「概要」タブでは録音の概要が表示され、アクションアイテムを作成して割り当てることができます。「トランスクリプト」タブでは会話の書き起こしが表示されます。AIチャットでは、ユーザーはトランスクリプトについて質問したり、追加の洞察を得たりすることができます。「コメント」セクションでは、メモを追加したり、他のアプリユーザーと共同作業したりできます。
真に包括的な体験を求めるなら、Otter.ai はまさにそのすべてを備えています。この記事でレビューしたアプリの中で、ユーザーにタスクを割り当てられるのはOtter.aiだけです。また、会話を録音するので、書き起こしに間違いや懸念点があれば、戻って聞き直すことができます。最大の欠点は、週に1、2回以上の会話にこのアプリを使用する場合、十分な書き起こし時間を得るために月額料金を支払う必要があることです。
価格: 使用制限付きで無料、または無制限で月額 16.99 米ドル。
アヴァ
聴覚障がい者向けに特別に設計されたAvaは、対面での会話、バーチャル会議、動画における高品質なリアルタイム字幕表示に重点を置いています(図2)。字幕表示は、ユーザーのデバイスに内蔵されたマイク、または話者に装着されたBluetoothマイクを使用して行うことができます。また、AvaはAI(Ava Scribe)を活用した人間による字幕表示も提供しており、複雑な会話でも信頼性の高い字幕を提供します。

図 2: Ava – ユーザーが選択できるさまざまなリスニング状況。
アプリを開くと、マイクをタップして文字起こしを開始できます。Avaでは、ユーザーが入力した回答をアプリが読み上げることもできます。QRコードを共有することで、複数の参加者が会話に参加でき、発言者ごとに色分けされた字幕が表示されます。
Avaはシンプルで魅力的な使いやすいインターフェースを備えており、難聴者が学校、社会、職場で効果的にコミュニケーションをとるために必要な機能をすべて備えています。難聴者向けに設計されているため、便利なコミュニケーションツールや、Ava推奨のマイクを注文するためのリンクも用意されています。Avaには生産性向上ツールは含まれておらず、トランスクリプトのエラーは発生しませんでしたが、無料版では10語に1語程度のエラーが発生していました。精度を重視する場合は、プレミアムサブスクリプションにアップグレードするか、Ava Scribeを使用すると、ほとんどのエラーを解決できます。
価格: 限定使用で無料、またはプレミアム AI 字幕が月額 9 ドル。
ノッタ
NottaはAIを搭載したメモ作成ツールで、文字起こし、自動翻訳、AI生成のメモや会議要約、会議レコーダーなどの機能を備えています。Nottaは、ライブ音声と録音音声を50以上の言語に文字起こし、さらには翻訳することも可能です。このアプリは、リアルタイム翻訳によって言語の壁を越えたコミュニケーションをサポートする多言語環境で特に役立ちます。

図 3: Notta – 文字起こしの 3 つのオプション: ファイルのアップロード、音声とオンライン会議の録音。
Nottaを開くと、プラスアイコンを選択して、ファイルのアップロード、音声録音、オンライン会議の録音を行うことができます。それぞれの操作において、希望する文字起こし言語を選択できます。
Nottaは、リアルタイム翻訳が必要な人にとって素晴らしいツールです。3つの主要な文字起こしタイプ(ファイル、ライブ音声、会議)の操作は簡単ですが、初めて使用する私にとっては、アプリのその他の機能を見つけるのが難しく、使いこなすのも非常に困難でした。
価格: 限定使用の場合は無料、個人サブスクリプションの場合は月額 10.50 カナダドル。
結論
あらゆるものがますますデジタル化され、AIが活用される世界において、Otter.ai、Ava、Nottaといった音声テキスト変換アプリケーションは、革新性と難聴者への実用的なサポートを兼ね備えています。これらのアプリはもともとコミュニケーションの課題に対処するために設計されたものではありませんが、AIが音声テキスト変換技術をコミュニケーションアクセスのための有意義なツールへと変革したことを象徴しています。
参照
1. Falls C, Coulson C. 「ユニバーサルマスキング時代のコミュニケーション:音声テキスト変換アプリが救世主」 ENT & Audiology News 2020; 29(3) :60.
寄稿者

ファラ・アブデル・アジズ
高度聴覚・平衡感覚検査センター、大学保健ネットワーク、トロント総合病院、トロント、カナダ。

エマ・ルブラン
トロント総合病院耳鼻咽喉科・頭頸部外科、AuD、トロント大学、University Health Network 講師、カナダ、トロント。
リンク先はENT&audiologynewsというサイトの記事になります。(原文:英語)
