目で聞く:ライブキャプショングラスのレビューと、誰にとっても会話をもっと簡単にするというビジョン

目で聞く:ライブキャプショングラスのレビューと、誰にとっても会話をもっと簡単にするというビジョン

AR ライブ キャプション グラスで新しいコミュニケーションの時代へ。リアルタイムの文字起こしと AI により、目の前で会話が生き生きと表現されます。

著者:カーリー・シグローブ
更新日:2025年6月10日

ARグラスをかける女性

聴覚障害のせいで、バー、レストラン、仕事の会議など、社交の場でコミュニケーションに苦労したことはありませんか? 現実世界に字幕が付いて、会話の記録が目の前でリアルタイムに見られたとしたら、素晴らしいと思いませんか? 実は、これはもはや未来の話ではなく、拡張現実(AR)グラスによって実現されつつあるのです。

今日の世界では、自動字幕はどこにでもあります。YouTube、ソーシャルメディアプラットフォーム、Google Meet、Zoom、FaceTimeなどのビデオコミュニケーションサービスなど、あらゆる場所で見かけます。聴覚に障がいのある方がテレビ番組の内容を理解したり、ビデオ通話の内容を理解したりしたい場合、字幕は大きな助けとなります。


ARの力で日常のコミュニケーションをより簡単に


ARとは、デジタルの視覚要素、音、その他の感覚刺激を用いて現実の環境を拡張した表現です。ライブキャプショングラスは、AR技術を用いてグラスに映像を投影し、リアルタイムで目立たない字幕サービスを現実世界に提供します。

AR字幕メガネは、日常のコミュニケーションをサポートします。会話の中でキーワードが足りない時に、ボディランゲージや音声認識に頼る必要がなくなり、比較的簡単にコミュニケーションを楽しむことができます。字幕メガネを装着するだけで、視界の中で繰り広げられる会話を「見る」ことができます。まるで字幕付きのテレビを見ているかのようです。

字幕表示グラスは数年前から登場していますが、初期のプロトタイプは見た目が「ゴツゴツ」していて、長時間の装着には適していませんでした。しかし、近年は軽量化が進み、字幕表示以外の革新的な機能を搭載したものも登場しています。これにより、会話、映画館、劇場、講義、会議、自宅でのテレビ視聴など、様々な場面で着用できるようになりました。

ここでは、成長を続ける字幕メガネの分野における最も有望な消費者向け製品のいくつかを簡単にまとめた表と、各製品のより詳細な情報を紹介します。

市場に新しい企業やモデルが登場するたびにこのページを更新していきますので、このページをブックマークしてください。


字幕メガネのハードウェアに関するメモ

字幕付きスマートグラスの開発において、多くの企業はハードウェアを自社で開発していません。代わりに、大手メーカーのARグラス(元々はエンターテインメントや生産性向上のために設計されたもの)を改造し、独自のソフトウェアを追加することで、リアルタイムの音声テキスト変換を実現しています。この記事で紹介したVuzix、XREAL、LLVISION、MICROOLED、MYVUといったブランドは、これらのアクセシビリティツールの基盤となる軽量で高性能なプラットフォームを提供しています。このアプローチにより、開発者はハードウェアを再開発する必要がなく、ソフトウェアの開発に集中できます。このアプローチは、この記事全体を通して見ていくことになります。

次に、字幕メガネ技術の先駆者であるいくつかの企業と、それらの企業がアクセシブルなコミュニケーションの未来をどのように形作っているのかを詳しく見ていきます。

Hearing Trackerの聴覚専門医、マシュー・オールソップ氏がXRAI Glassとアプリのレビューをお届けします。この動画では字幕をご利用いただけます。スマートフォンをご利用の場合は、歯車アイコンをクリックして字幕をオンにしてください。


XRAIガラス


880ドル(プレセール価格750ドル)+アプリサブスクリプション

XRAIは、ダン・スカーフ氏によって設立された米国企業です。最近、妻のララ氏も経営に加わりました。XRAI(エックスレイと発音)という社名は、XR(複合現実)とAI(人工知能)を組み合わせたものです。XRAI Glass ARスマートグラスのアイデアは、あるクリスマスの日に、スカーフ氏が96歳の祖父が難聴のため食卓を挟んでコミュニケーションをとるのに苦労していることに気づいたことがきっかけでした。これが、スカーフ氏が「コミュニケーションの障壁を打ち破り、すべての人のコミュニケーションを促進する」というミッションを掲げ始めたきっかけです。

XRAI

XRAI Glass と互換性のあるスマート グラスには、(左上から時計回りに) XRAI AR2、RayNeo X3 Pro (近日発売)、QONOQ Mirza、XReal One などがあります。


AndroidとiOSで利用可能なXRAI Glassアプリは、対応するスマートグラスの有無にかかわらず動作します。つまり、XRAIソフトウェアを搭載した字幕グラスを使用するか、スマートフォンやタブレットに無料でダウンロードできるXRAIアプリを使用するだけで、音声のライブ字幕表示を利用できます。有料プランにご加入いただくと、スピーカーID、拡張会話履歴、リアルタイム翻訳、AIアシスタントなどの追加機能がご利用いただけます。

スカーフ氏によると、このメガネは880ドルだが、現在プレセールで750ドル(250ドルのデポジットが必要)で購入できる。アプリは現在、プレミアムパッケージとアルティメットパッケージのどちらを選択するかによって月額15ドルまたは30ドルで提供されており、プレミアムパッケージでは600分(10時間)または1,800分以上(30時間)の「クラウド強化」文字起こしや翻訳などの高度な機能が利用できる。無料アプリでは、精度は低下するが20言語に対応し、オフライン字幕作成が可能だ。

XRAIソフトウェアの最初のバージョンは2022年11月にリリースされ、XRAI Glassの字幕表示グラスに対応しました。最新のアップデートでは、ワイヤレスのXRAI AR Oneを含む複数のスタイルをサポートするようになりました。これらのグラスは、Leion Heyグラス(詳細は後述)と同じハードウェアであるLLVISION G35デバイスを使用しています。

グラスに搭載された指向性マイクが、最小限の遅延で話者の音声を拾い、グラス内にリアルタイムのトランスクリプトを投影します。これは装着者だけが見ることができます。アプリのAIは、複数の話者が同時に話している場合でも、それらを識別してラベル付けします。

この技術は急速に進歩し続けており、XRAI AR One グラスは、LLVISION の新しい G36 デバイスをベースにした次世代のXRAI AR 2にすでに追い抜かれる予定です

AR 2は2025年6月に先行販売が開始され、8月に出荷される予定です。「この製品の設計目標は、普通のメガネのように見えながら、一日中使えるようにすることでした」とスカーフ氏はHearingTrackerに語りました。

人生。字幕付き。XRAI-glassが制作した製品紹介ビデオ。


AR 2は最大8時間の使用が可能で、ハイブリッドなアプローチを採用しています。つまり、独立型でワイヤレスでありながら、Bluetooth経由でペアリングされたスマートフォンに処理をオフロードします。これにより、完全に独立したグラスの重量とケーブル接続型のデザインの限界をバランスさせ、40g未満という軽量で、快適かつ高性能を実現しています。

XRAI GlassはLensologyと提携し、度付きレンズの互換性を確保しています。Lensologyにスタイルと処方箋を送信すると、同社からカスタムインサートが郵送されます。以前のモデルではレンズインサートをクリップで留めていましたが、新しいAR 2sでは度付きレンズがフレームに直接組み込まれているため、よりシームレスなフィット感を実現しています。

完全ワイヤレスグラスの人気が高まっている一方で、XREALのような有線接続型のオプションも依然として市場で重要な役割を果たしています。XREAL Air 2Air 2 Pro(72gと75g)は有線ケーブルで接続するため、信頼性が高く低遅延のパフォーマンスを実現します。Scarfe氏はHearingTrackerに対し、「字幕表示など、様々な用途に使える多目的グラスをお探しなら、XREALが断然最適な選択肢です」と述べています。XREALグラスは字幕表示専用ではありませんが、XRAIアプリとの連携も良好で、手頃な価格で人気のある選択肢となっています。


XRAI ソフトウェアは以下も提供します。

  • 223 言語のリアルタイム翻訳。
  • 会話の記録を保存して後で使用できる会話レコーダー。(データはユーザーが管理し、XRAI は厳格なプライバシー ポリシーに従って運用されているため、データにアクセスしません。)
  • 正確な文字起こしとスマートな応答を実現する、Microsoft Azure、Amazon Web Services (AWS)、Deepgram、VOSK、OpenAI の ChatGPT などの AI エンジンのサポート。

XRAIソフトウェアは、XRAI Streamプラットフォームのリリースにより、従来の字幕表示グラスをはるかに超える機能を提供します。特別なハードウェアを必要とせず、Bluetooth経由でライブ字幕や翻訳などのオーディオ共有体験を提供します。Bluetooth LE AudioのAuracastと同様の考え方を持つXRAI Streamは、幅広いアクセシビリティを考慮して設計されており、劇場や公共施設での導入に最適です。このシステムは、ミキシングデスクなどのソースで音声を直接キャプチャし、最大223言語の字幕をスマートグラスなどのデバイスにリアルタイムでストリーミング配信します。

これを実現するため、XRAIはオランダ国立劇場およびオーディオテクノロジー企業Danteと提携し、演劇公演のライブ字幕配信を先駆的に開始します。これにより、聴覚障害者、難聴者、およびオランダ語を母国語としない観客のアクセシビリティが向上します。XRAI Streamのより広範な展開は、今年後半または来年初めに予定されています。

XRAIはまた、英国の国立交通アクセスセンターから資金提供を受け、その技術をバスや電車に導入し、乗客が自分の言語で運転手のアナウンスを読めるようにしている。

XRAI Glass は、SME IT Awards (2024) の最も革新的な補聴器ソリューション アプリ賞、Hearing Tech Innovator Awards (2023) のベスト キャプション テクノロジー賞、Global Business Tech Awards (2023) のテクノロジー フォー グッド賞など、数々の賞を受賞しています。


ザンダーグラス


価格は 1 ペアあたり 5,000 ドルで、箱から出してすぐに使用できるように必要なものがすべて含まれており、個人のニーズに基づいてカスタマイズできます。

Xanderは、共同創業者のアレックス・ウェストナーとマリリン・モーガン・ウェストナーが率いる、オーディオの専門家、エンジニア、研究者からなるチームです。アレックス・ウェストナーは、MITメディアラボで音響と音声処理の修士号を取得後、オーディオ業界で20年間を過ごし、業界をリードするギブソン、三菱総合研究所、iZotopeなどで経験を積みました。視覚障害と診断されたことをきっかけに、彼は感覚代行と「オーディオに関する最も根深い人間の問題」である、聴覚に問題を抱える人々の支援に強い関心を持つようになりました。

HearingTracker の聴覚専門家 Matthew Allsop が、2025 コンシューマーエレクトロニクスショー (CES 2025) 中に Xander の共同設立者である Alex Westner と会話を交わし、デモンストレーションを受けました。


同社は Vuzix と提携し、自社製品向けに半カスタマイズされたVuzix Shieldモデルの改良版であるXanderGlassesを使用しました。これは、聴覚障害やコミュニケーション障害のある人々のための補助装置として設計されています。

XanderGlassesはスタンドアロンのスマートグラスで、スマートフォンや外部デバイスとの接続を必要とせず、独立して動作します。人間工学に基づいたクッション性のあるデザインで、箱から出してすぐに使用できます。ボタンを押すだけで装着できます。複数のノイズキャンセリングマイクが周囲の音声を拾い、両方のレンズにリアルタイムの字幕を表示します。

XanderGlassesには、オフラインでも動作する音声テキスト変換機能が内蔵されており、Wi-Fiやクラウドサービスを必要とせずに信頼性の高い字幕を提供します。ただし、精度を高めるためにWi-Fiをオプションで利用することもできます。会話内容は一切保存されず、厳格なSOC 2プライバシー基準に準拠しています。

Vuzix 搭載の XanderGlasses は、他の人が話している内容をリアルタイムで字幕として表示します。

Vuzix 搭載の XanderGlasses は、他の人が話している内容をリアルタイムで字幕として表示します。


テストの結果、XanderGlassesは周囲の騒音レベルに応じて、オフラインで85%から95%の精度を達成しました。Wi-Fi接続時には、精度は最大97%まで向上します。このグラスは26言語を内蔵しており、Wi-Fi接続時には最大140言語にアクセスでき、言語間のリアルタイム翻訳が可能です。HearingTrackerエディターのKarl Strom氏と、ビデオコンテンツプロデューサー兼聴覚学者のMatthew Allsop氏は、2025年のコンシューマー・エレクトロニクス・ショー(CES 2025)でXanderGlassesに感銘を受け、非常に騒がしく反響の大きいコンベンションホールでもライブキャプションが良好に機能したことを高く評価しました。

重量は130グラムで、内蔵技術のため、市場に出回っている他の製品よりも重い。同社は将来的なバージョンをさらに軽量化すべく取り組んでいる。

XanderGlassには、iPhoneとAndroidの両方で動作する無料アプリが付属しています。このアプリを使って、字幕の位置、サイズ、明るさを調整できます。近日中にフォント変更も可能になり、ディスレクシア向けに最適化されたものも用意されます。メガネ自体は独立して動作するため、アプリはオプションです。

残念なことに、このメガネのバッテリー駆動時間は限られています。オフラインモードでは、約2.5~3時間の連続字幕表示が可能です。しかし、クラウドに接続すると、初期の推定ではバッテリー駆動時間が2倍になる可能性があるとされていますが、これはまだテスト段階です。さらに、使用していないときにメガネをスリープモードにすると、バッテリー駆動時間を最大4時間延長できます。嬉しいことに、このメガネはUSB-Cポート経由で約2時間でフル充電できます。

Xander の Alex Westner と Marilyn Morgan Westner によるデモンストレーションを通じて、ユーザーの視点から翻訳機能がどのように機能し、どのように見えるかをご覧ください。


このメガネには、サングラスクリップオン、ワイヤレスマイクとレシーバー、充電ケーブルと電源アダプター、そして必要に応じて度付きレンズなど、様々なアクセサリーが付属しています。Xanderは、メガネをご購入いただいた方からご質問があれば、いつでもお電話で対応いたします。 

XanderGlassesの価格は一般的な処方箋補聴器と同程度ですが、同社は製品の価格を引き下げ、より入手しやすくすることに尽力しています。現在、学校、雇用主、州の支援技術センター、職業リハビリテーションプログラムと提携し、米国難聴協会(HLAA)のウォーク・フォー・ヒアリングなどの募金活動にメガネを寄付しています

XanderGlassesは2023年8月にボストンで発売された後、2023年11月に販売が開始されました。現在は米国で販売されており、2025年後半までにカナダと英国での注文を処理する予定です。

この技術は、当社の幅広い使命と価値観のほんの一部に過ぎません。過去2年間、チームは退役軍人省(VA)の各医療センターや聴覚専門医と緊密に協力し、XanderGlassesの試験と改良に取り組んできました。彼らの使命は、難聴や会話の理解に困難を抱える退役軍人を支援し、コミュニケーションへの自信を取り戻し、家族、友人、そして地域社会とのつながりを感じられるよう支援することです。その結果、XanderGlassesは2024年9月以降、VAを通じて様々なコミュニケーション課題に対する承認済み介入として指定されています。

「聴覚障害の影響を特に受けている退役軍人の方々と協働できることを大変誇りに思っています。昨年10月には、VA(退役軍人省)による全国的な審査と承認を取得しました。これにより、全米のVA医療センターやクリニックは、資格を満たす退役軍人の方々にメガネを購入できるようになりました。つまり、退役軍人は、聴覚検査チームと連携すれば、米国内でXanderメガネを無料で入手できるということです」とアレックス・ウェストナーは説明します。

XanderGlasses は、アクセシビリティと高齢化の CES 2025 イノベーションアワード受賞者、実用的な消費者向けテクノロジーのイノベーションに対する 2025 TWICE Picks アワード、支援技術とソフトウェアに対する 2024 Hearing Technology イノベーションアワード、Reviewed (USA Today のレビュー出版物) の 2024 AccessABILITY アワード、アクセシビリティと高齢化の CES 2024 イノベーションアワード受賞者を受賞するなど、高い評価を得ています。

LEION Hey ARグラス。

LEION Hey ARグラス。


LEION Hey ARグラス

第一世代モデルは、メーカーのLLVISIONまたは正規販売店を通じてご注文いただければ入手可能です。価格は平均800ドル程度ですが、モデルや地域によって異なる場合があります。

北京LLVISION Technology Co., Ltd.のLeion Hey ARグラスは、リアルタイムの文字起こし、翻訳、そして統合型AIチャット機能を提供することで、聴覚に障がいのある方をサポートし、力づけるために設計されています。このワイヤレスARグラスは、人工知能と拡張現実(AR)を融合させ、両方のレンズで音声によるテキスト字幕を表示します。

通常の条件 (画面の明るさ 50%、信号良好、中程度の使用) では最大 2 時間のバッテリー寿命を提供し、USB-C 経由の同時充電をサポートし、外部バッテリー パックで電源を供給できます。

このグラスは、ノイズキャンセリング機能を備えたデュアルマイクを搭載し、音声認識の精度を高めています。静かな環境では、1メートル以内で92%以上の精度を達成しています。80dBのレストランなど、より騒がしい場所でも、精度は82%以上を維持します。

Leion Hey グラスは、主に 3 つのモードをサポートしています。

  • 会話モード: 音声のライブキャプションと保存されたトランスクリプトを後で確認できるようにします。
  • 翻訳モード: 最大 91 の言語でリアルタイム翻訳。
  • ChatGPT 統合: ディスプレイ上で直接回答を提供する AI アシスタントを内蔵。

Android 10以降およびiOS 11以降に対応しており、コンパニオンアプリを介してBluetoothとWi-Fi経由でスマートフォンに接続します。初期設定にはユーザー登録とデバイスのペアリングが必要で、これらは一度だけ行う必要があります。アプリでは、すべての機能の操作、モードの切り替え、ディスプレイのカスタマイズが可能です。

ネットワークが利用できない場合、内蔵の音声認識機能を使用して、メガネはオフラインモードでも動作します。ただし、最高の精度を得るにはオンラインでの使用をお勧めします。

Leion Hey AR グラスには、4 種類のスタイルの磁気サングラス アタッチメント、地元の眼鏡店でのフィッティング用の内部フレームによる処方レンズ サポート、複数のテンプル ガスケット サイズ (S/M/L)、USB-C 充電ケーブルなど、カスタマイズ可能なオプションがいくつか付属しています。

XRAI AR 2と同様に、2025年に発売予定のLeion Hey 2は、LLVISIONのG36プラットフォームを採用しています。重量は約40グラム、バッテリー駆動時間は8時間と予想されており、軽量な快適さと一日中使える機能性を兼ね備えています。

メーカー制作のLEION Hey 2 AIグラスをフィーチャーしたプロモーションビデオ。


「先月(2025年4月)、ベルリンで開催された世界障害者サミット(GDS)から戻ってきたばかりですが、多くの好意的なフィードバックを得ることができました」と、LLVISIONの最高執行責任者であるシェンチアン(ロイ)・ルー氏は、新世代のLeion HeyについてHearingTrackerに語った。

2022年4月、Leion HeyはユネスコNetexploイノベーションフォーラムでトップ10グローバル科学技術イノベーション賞を受賞しました。

最新バージョンの Transcribe Glass が、スタイリッシュなメガネに統合されました。

最新バージョンの Transcribe Glass が、スタイリッシュなメガネに統合されました。


トランスクリプグラス

価格は 1 ペアあたり 377 ドル + 月額 20 ドルです。

インドのニューデリー出身で、イェール大学コンピュータサイエンス科を卒業したばかりのマダブ・ラヴァカレさんは、友人がアクセシビリティ支援のための費用を捻出できず高校を中退したことから、字幕メガネのアイデアを思いつきました。ラヴァカレさんが友人に、なぜスマホの音声認識を使わないのかと尋ねると、彼は「スマホで読んでいると、唇の動きや表情、手振りが読み取れないから」と答えました。この会話が、あるプロジェクトへの着想のきっかけとなりました。

ラヴァカレ氏は2017年、自宅のガレージでクリップ式の字幕作成装置「TranscribeGlass」を立ち上げました。しかし、長年にわたるユーザーからのフィードバックと改良を経て、彼は限界に気づきました。クリップ式の装置は異なるフレームに固定するのが難しく、使い勝手も悪く、精度と信頼性にも欠けていたのです。

聴覚障害のある方のための低価格で手頃な価格の支援技術、TranscribeGlass の最初のバージョン。スマートフォン経由でお好みの音声テキスト変換ソフトウェアを使用し、メガネ(メガネをかけていない場合は空のフレーム)の前に設置された小さなスナップオンディスプレイに投影します。

聴覚障害のある方のための低価格で手頃な価格の支援技術、TranscribeGlass の最初のバージョン。スマートフォン経由でお好みの音声テキスト変換ソフトウェアを使用し、メガネ(メガネをかけていない場合は空のフレーム)の前に設置された小さなスナップオンディスプレイに投影します。


2024年までに、さまざまなスマートグラスをテストし、ユーザーにインタビューした後、彼は製品に対する5つの主要なニーズを特定しました。それは、快適性、精度、速度、美しさ、そして何よりも信頼性です。

2025年、1年間の開発期間を経て、TranscribeGlass 2.0が誕生しました。普通のメガネのようなデザインでありながら、完全に統合されたこの新しいバージョンは、レストランのような騒がしい場所や混雑した場所でも非常に正確な字幕を提供します。「このデバイスは本当に洗練されています」とラヴァカレ氏はHearingTrackerに語りました。「普通の老眼鏡とほとんど見分けがつきません。」

TranscribeGlass の創設者 Madhav Lavakare 氏が、製品の起源と最新のデザインの仕組みについて説明します。


ラヴァカレ氏はVuzixのUltraliteスマートグラスを調達し、現在iPhone版で利用可能で、近日中にAndroid版もリリース予定のTranscribeGlassアプリと連携させました。グラスはBluetooth経由でアプリに接続し、ユーザーは設定をカスタマイズできます。

TranscribeGlassは、スマートフォンの内蔵マイク(または接続済みの外付けマイク)を使って会話を拾います。リアルタイムの文字起こしは、右側のレンズに緑色の文字で表示されます。ソフトウェアは、それぞれに番号を割り当てることで、複数の人が話していることを識別します。この機能を利用して、短いサンプルを録音して友人の声を登録すると、字幕にその友人の名前が表示されます。さらに、自分自身を登録し、自分の発言を字幕から非表示にすることもできます。これは、グラスを装着しているときに自分の言葉が見えたくない場合に便利です。まだ実験的な機能ではありますが、これらの機能により、字幕はより明瞭でパーソナライズされたものになります。

彼らの転写プロセスは GDPR、SOC 2 タイプ 2、および HIPAA に準拠しており、重要なプライバシーおよびセキュリティ法に従って、データを慎重かつ安全に処理します。

月額サブスクリプションは、グラスが利用する文字起こしサービスの費用をカバーします。TranscribeGlassはオンラインでもオフラインでも動作しますが、インターネットに接続していない場合は精度が低下します。クラウドに接続すると、約93%の音声認識精度を誇り、静かな環境ではさらに高い精度を実現します。

本製品はマグネット式ポートで充電でき、約1時間でフル充電できます。1回の充電で、明るさレベルに応じて約6~8時間の連続字幕表示が可能です。通常の断続的な使用であれば、多くのユーザーは丸一日充電なしで使用できます。

同社は、ChatGPTのような機能を含むAIアシスタント機能の検討を進めており、ユーザーの邪魔にならずにメリットが得られる機能を慎重に検討しています。まだ標準製品には含まれていませんが、AIアシスタントを搭載したベータ版が利用可能です。ユーザーはグラスをダブルタップすることでAIアシスタントを起動でき、進行中の会話の文脈に基づいて質問に答えます。この機能はデフォルトでは含まれていませんが、顧客がAIアシスタントをリクエストした場合、TranscribeGlassはAIアシスタントを試用し、フィードバックを共有するためのアクセスを提供します。

TranscribeGlassのウェブサイトからご注文いただくと、クリップオンサングラス(20ドル)または単焦点レンズ(158ドル~)を追加できます。ご注文時に処方箋を入力すると、適合性が確認され、正確な価格が表示されます。

TranscribeGlassは、英語、スペイン語、フランス語、中国語、イタリア語、ドイツ語、ポルトガル語、韓国語、日本語、ベトナム語など、複数の言語をサポートしています。また、これらの言語のほとんど間でライブ翻訳も可能です。

TranscribeGlass は、2025 Startup Yale (Rothberg Catalyzer 賞)、Ben Daniels Venture Challenge、2025 Tulane Business Model Competition で第 3 位を獲得したほか、2021 Tech4Good Accessibility Award (高く評価) およびATF Labs Best Assistive Technology Startup for Innovationも受賞しました。


聴力 


*価格は1組あたり299.95ドル+ *アプリメンバーシッププラン

インディアナ州サウスベンドに拠点を置くHearSightは、アクセシビリティに重点を置いたテクノロジー系スタートアップ企業です。彼らの使命は明確です。それは、聴覚障がい者(d/Deaf & Hard of Hearing:HOH)の方々に、より優れた音声理解と生活の質の向上に貢献する革新的なソリューションを提供することです。 

Hearsightのアイデアは、COVID-19パンデミックの最中に生まれました。共同創業者のダニー・フリッツは、マスク着用によって唇の動きに頼っていた恋人とのコミュニケーションが困難になっていることに気づき、そのアイデアを思いつきました。映画の字幕にヒントを得て、フリッツは現実の会話にも同じように字幕を付けられないかと考えました。その後、ノートルダム大学のテクノロジー起業家育成プログラムを通じて、ライリー・エリングセンとチームを組み、このアイデアを実現しました。

Hearsightアプリはユーザーからのフィードバックに基づいて綿密にテストと改良を重ね、現在iOSとAndroidの両方で利用可能です。2024年6月には、OLEDマイクロディスプレイ技術のリーダーであるMICROOLEDと提携し、字幕表示グラスソリューションを一般公開しました。ActiveLookのENGO 2スマートグラスはHearsightアプリと連携し、共同創業者のFritz氏が当初構想していた通り、日常会話にリアルタイムの字幕を提供します。

ENGO 2グラスは、音声を拾うマイクを内蔵し、軽量で低消費電力設計により、さまざまな照明条件でもクリアで高コントラストの字幕を実現します。Hearsightアプリは単独でも動作しますが、ENGOグラスとペアリングすることで、ハンズフリーの字幕体験が得られます。

サードパーティ製アプリを使ってグラスを有効化する必要はありません。Bluetoothをオンにして、デバイス名をクリックするだけでペアリングできます。各セッションの終了後、会話は一時的に記録され、ユーザーは記録を保存するか破棄するかを選択できます。

ENGO 2は最大12時間のバッテリー駆動時間を備えており、頻繁な充電をすることなく長時間使用できます。充電はMicro USBケーブルで行います。

処方箋レンズは現在サポートされていませんが、太陽光に反応して自動的に暗くなるフォトクロミック バージョンのメガネが利用可能です。

Hearsightは、社会にプラスの影響を与える革新的なソリューションを提供するスタートアップ企業を表彰する2022年RISEアワードを受賞しました。CES 2025でも注目を集めました。

メガネを捕らえる。

メガネを捕らえる。


キャプチャ 

価格は1組499ドル+無料コンパニオンアプリ

新進気鋭のCaptifyグラスは、聴覚障害を抱え、かつて第一世代の TranscribeGlass の開発に携わった Tom Pritsky 氏と、スマート ウェアラブルのベテラン専門家 Jason Gui 氏によって共同設立されました。

このメガネは、コミュニケーションのギャップを埋め、よりインクルーシブな会話を可能にすることを目的としています。プリツキー氏は、個人的な使命感と、世界中で同様の障壁に直面している15億人の人々が直面する課題に取り組みたいという思いから、2016年にスタンフォード大学でこのメガネのアイデア開発に着手しました。CES 2025で発表されたCaptifyメガネは、アクセシビリティに特化して設計されています。

Captify が制作したビデオで、共同設立者の Tom Pritsky が新しい字幕メガネについて説明しています。


Captifyは、DreamSmart Groupが開発した軽量ARグラスブランドであるMYVUと提携しました。両社は協力し、Microsoft、Google、Amazonのクラウドベースの音声認識技術を活用したCaptify独自の字幕機能をサポートするハードウェアをカスタマイズしました。

Captifyグラスはデュアルビームフォーミングマイクを搭載し、目の前の話者に焦点を合わせながら、背景ノイズを最小限に抑えます。録音された音声はBluetooth経由でスマートフォンに送信され、無料のパートナーアプリ「MYVU AR」(iOSとAndroidの両方に対応)が文字起こしを行います。処理とディスプレイを分離することで、グラスの軽量化と省電力化を実現しています。アプリが音声を書き起こすと、緑色の文字で字幕がレンズに直接投影されます。Captifyは書き起こしをコンパニオンアプリに保存するため、ユーザーは会話の要点を見直して保存することができます。

アプリ内でフォントサイズ(標準、大、特大)を調整することもできます。今後のアップデートでは、Captifyアプリで字幕の位置を調整し、画面の上部、下部、または側面に表示できるオプションが追加される予定です。

字幕をご利用いただくには、スマートフォンがBluetoothの通信範囲内(10メートルまたは30フィート)にある必要があります。基本的な字幕表示にはインターネット接続は必要ありませんが、翻訳機能にはクラウドアクセスが必要なため、Wi-Fiまたはモバイルデータ通信回線が必要です。接続されたスマートフォンでのローカルでの文字起こしは無料です。

バッテリーは最大4時間の連続字幕表示、または48時間のスタンバイが可能で、わずか40分でフル充電できます。さらに、充電中でも字幕表示は継続できます。

人間工学に基づいて設計されたこのメガネは、幅広い頭のサイズに一日中快適にフィットします。単焦点レンズ、老眼鏡、累進レンズ、非矯正レンズなど、処方箋レンズがプリインストールされています。価格は99米ドルからで、レンズの種類によって異なります。チェックアウト時に処方箋をアップロードしてください。偏光サングラスのクリップオンも50米ドル追加でご用意しています。

Captify Glassesの現在のバージョンは、英語、スペイン語、フランス語、イタリア語、ドイツ語、中国語、日本語、ロシア語、ベトナム語、マレーシア語、インドネシア語、トルコ語、タイ語の13言語でリアルタイム翻訳をサポートしています。2025年7月にリリース予定のCaptify Proでは、サポート言語が40言語以上に拡大されます。

Captify Glassesには現在、ChatGPTやサードパーティ製のAIアシスタント機能は搭載されていませんが、翻訳、メディア再生、通話処理といったスマート機能が搭載されています。これらの機能はWi-Fi接続によって実現され、今後のアップデートで進化していく予定です。

ユーザーは、居住地および適用法に応じて、自身の情報にアクセス、更新、削除し、データ共有をオプトアウトすることができます。詳細は、プライバシーポリシーおよび利用規約をご覧ください。

購入はフレキシブル支出口座 (FSA) または健康貯蓄口座 (HSA) を使用して行うことができ、分割払いもサポートされています。


モジュラー代替品


上記のオプションはリアルタイム字幕表示に特化していますが、オープンソースのAugmentOSプラットフォームと組み合わせたEven Realities G1のような汎用スマートグラスの中には、オプションのアプリを通じてライブ字幕や文字起こし機能を提供するものもあります。これらのソリューションは、字幕表示に加えて、翻訳、ナビゲーション、生産性向上ツールなど、より幅広い機能を提供しており、追加の設定が必要になる場合があります。


大手企業の次なる動きは?


この記事で取り上げた字幕表示専用グラスはアクセシビリティに特化したデバイスですが、GoogleやAppleといったテクノロジー大手は、ウェアラブル技術とアクセシビリティに関する幅広い取り組みの一環として、リアルタイム文字起こしグラスの分野で大きな進歩を遂げています。厳密には字幕表示専用グラスではありませんが、これらの進歩により、近い将来、ライブ字幕機能がより幅広い機能に組み込まれる可能性があります。


Googleのスマートグラスへの取り組み


SamsungのProject HAEAN: TED2025での講演「次世代のコンピュータ? グラス」において、 GoogleのAR/XR部門責任者であるシャフラム・イザディ氏は、Samsungと共同開発したAI搭載スマートグラスを発表しました。Android XRとGemini AIを搭載し、リアルタイムの言語翻訳と文脈記憶の想起を実演しました。視覚記憶の想起やAIによるシーン分析といった機能により、このグラスは『ブラック・ミラー』のようなシーンを想起させます。ライブデモでは、レンズにペルシア語から英語への翻訳が表示され、ライブキャプション作成のための次世代音声テキスト変換グラスとしての可能性を示唆しました。

Googleが制作したYouTube動画で、Google翻訳に対応したメガネが紹介されています。この動画は字幕付きです。スマートフォンをご利用の場合は、歯車アイコンをクリックして字幕をオンにしてください。

XrealのProject Aura: Google I/O 2025で発表されたこのプロジェクトは、GoogleとXrealのパートナーシップによるものです。Project Auraは、GoogleのAndroid XRオペレーティングシステムを搭載し、Gemini AIを搭載した光学シースルー(OST)デバイスです。軽量でケーブル接続可能なデザインで、透明なレンズを通してデジタルコンテンツを現実世界に重ね合わせます。このグラスにはカメラ、マイク、スピーカーが搭載されており、リアルタイム翻訳や状況に応じた支援などの機能を実現します。 

どちらのプロジェクトも現在はプロトタイプ段階にあり、リリース日はまだ確定していない。 

Xreal と Google の Project Aura に関する TechAvid YouTube ビデオ。


AppleのVision Proと今後発売予定のスマートグラス


厳密にはメガネではないものの、 2024年に発売されたAppleのVision Proヘッドセットには、ライブ会話とアプリからの音声の両方をリアルタイムで文字起こしするライブキャプション機能が搭載されている。

今後の展望として、Appleは2026年に初のスマートグラスを発売する予定です。これらのグラスにはカメラ、マイク、スピーカー、そしてSiriとの連携機能が搭載され、通話、音楽再生、ライブ翻訳、ナビゲーションといった機能が可能になると予想されています。これらの開発状況から、Appleのスマートグラス製品にはライブキャプション機能が搭載される可能性が示唆されています。

Apple Vision Proヘッドセットは、ライブ会話やアプリからの音声をリアルタイムで書き起こす機能を提供しているが、同社は2026年に同様に便利なアクセシビリティ機能を備えた初のスマートグラスを発売する予定だと報じられている。

Apple Vision Proヘッドセットは、ライブ会話やアプリからの音声をリアルタイムで書き起こす機能を提供しているが、同社は2026年に同様に便利なアクセシビリティ機能を備えた初のスマートグラスを発売する予定だと報じられている。


字幕アプリも非常に便利です!

この記事ではリアルタイム字幕表示機能を備えたグラスに焦点を当てていますが、上記で紹介したアプリの中には、スマートフォンで単独で使用できるものもあります。また、音声テキスト変換による字幕作成アプリもいくつかあり、高速で信頼性の高い字幕作成が可能で、外出先でのライブ字幕作成に便利です。

チェックアウト:

HearingTracker は、難聴の人に最適なアプリに関する記事も公開しています。

聴覚アクセシビリティの技術は急速に進化しています。アイウェア関連(字幕付きではありません)としては、Nuance AudioのOTC補聴グラスを含む、新興カテゴリーの補聴グラスもご興味があるかもしれません。


プライバシーとデータの取り扱いに関する考慮事項


字幕メガネはリアルタイムの音声をキャプチャし、クラウドで処理する場合もあるため、当然ながらプライバシーに関する懸念が生じます。これらのデバイスはプライベートな会話を拾う可能性があり、プロバイダーによっては、文字起こしがローカルまたはオンラインで保存される可能性があります。

データがどこに保存され、どれくらいの期間保存され、誰がアクセスできるのかを知ることは重要です。一部のプロバイダーはデータを第三者と共有する場合もあるため、プライバシーポリシーを確認することが重要です。

ヒント:字幕メガネを使用する前に、プライバシー ポリシーを確認し、データが暗号化されているかどうかを確認し、クラウド機能を無効にしたり、データ共有をオプトアウトしたりできるかどうかを確認してください。


字幕メガネの未来


字幕メガネの世界は急速に進化しています。ハードウェアとソフトウェアのアップデートが定期的にリリースされ、これらのデバイスはますます多用途で使いやすくなっています。Xanderのアレックス・ウェストナー氏は、「字幕メガネは、ユーザーの多様なニーズ、使用目的、そして個々の感受性に対応するために、物理的に進化し続けると予想しています」と述べています。



カーリー・シグローブ
聴覚健康ライター

カーリー・シグローブは、  片側難聴を抱える 難聴コーチであり、聴覚健康ライターです。彼女は「My Hearing Loss Story」で難聴との生活について執筆し 、 難聴者のためのオンラインサポートグループを運営しています。また 、突発性難聴に苦しむ人々のための情報とサポートを提供するウェブサイト「Sudden Hearing Loss Support 」 の創設者でもあります 。


リンク先はアメリカのHearing Trackerというサイトの記事になります。(原文:英語)


 

ブログに戻る

コメントを残す