2025年4月28日
ボストン大学投稿

(クレジット:ゲッティイメージズ)
脳にヒントを得た新しいアルゴリズムは、補聴器が干渉を除去し、大勢の声の中から一人の話者を分離するのに役立つ可能性がある。
友人グループがバーに集まったり、親密なディナーに集まったりすると、さまざまなグループやペアが互いに話し合ったりして、会話が急速に増加したり混ざり合ったりすることがあります。
聴覚に何らかの障害を持つ人にとって、この活気に満ちた言葉の羅列を聞き分け、重要な言葉に集中することは特に困難です。たとえ補聴器を装着していても、背景の雑音を遮断するのに苦労することが多く、賑やかな会話は雑談の寄せ集めになってしまうことがあります。
これは「カクテルパーティー問題」として知られており、ボストン大学の研究者たちは解決策があるかもしれないと考えている。
研究者らはテストで、新しいアルゴリズムにより、現在の補聴器アルゴリズムに比べて単語認識精度が 40 パーセントポイント向上する可能性があることを発見した。
「パフォーマンスの向上の大きさに非常に驚き、興奮しています。これほど大きな向上が見られるのは非常に稀です」と、アルゴリズムの開発者でボストン大学工学部生物医学工学准教授のカマル・セン氏は語る。
ある推計によると、聴覚障害を持つアメリカ人の数は5,000万人近くに達し、世界保健機関によると、2050年までに世界で約25億人が何らかの聴覚障害を患うことが予想されている。
「難聴の人々が主に訴えるのは、騒がしい環境でのコミュニケーションが難しいことです」と、ボストン大学サージェント健康・リハビリテーション科学部の音声・言語・聴覚科学研究准教授で、共著者のバージニア・ベスト氏は言う。
「こうした環境は日常生活で非常に一般的であり、人々にとって非常に重要なものになりがちです。例えば、食卓での会話、社交の場、職場での会議などを考えてみてください。ですから、騒がしい場所でのコミュニケーションを促進できるソリューションは、大きな影響を与える可能性を秘めています。」
研究の一環として、研究者らは、カクテルパーティーの喧騒に現在の補聴器アルゴリズムが対応できる能力についてもテストしました。多くの補聴器には、ノイズ低減アルゴリズムと、前方からの音を強調するように設計された指向性マイク(ビームフォーマー)が既に搭載されています。
「私たちは、現在補聴器に搭載されている業界標準のアルゴリズムをベンチマークすることにしました」とセン氏は語る。「既存のアルゴリズムは性能を全く向上させません。むしろ、わずかに悪化させるだけです。今、私たちは補聴器を使っている人々から経験的に知られていることを示すデータを手に入れました。」
セン氏は、生物学的指向性音分離アルゴリズム(BOSSA)と呼ばれる新しいアルゴリズムの特許を取得しており、この技術のライセンス供与に関心を持つ企業との提携を模索している。アップルが補聴器市場に参入し、最新のAirPod Pro 2ヘッドホンは臨床グレードの補聴器機能を搭載していると宣伝されていることから、BUチームの画期的な発見はタイムリーだとセン氏は語る。「補聴器メーカーが迅速に革新を始めなければ、アップルなどのスタートアップ企業が市場に参入しているため、淘汰されてしまうでしょう。」
セン氏は過去20年間、脳がどのように音を符号化・復号化するかを研究し、カクテルパーティー効果を制御する回路を探ってきました。自然音・神経符号化研究室の研究者たちと共に、彼は聴覚経路の様々な段階で音波がどのように処理されるかを描き出し、耳から脳による音の解釈に至るまでの過程を追跡してきました。重要なメカニズムの一つは、特定の不要な音を抑制する脳細胞である抑制ニューロンです。
「これは一種の内部ノイズキャンセリングと考えることができます」と彼は言います。「特定の場所で音が聞こえると、これらの抑制ニューロンが活性化されます。」セン氏によると、ニューロンはそれぞれ異なる場所と周波数に調整されているそうです。
この新しいアルゴリズムは、脳のアプローチから着想を得たもので、音量や音のタイミングなどの空間的な手がかりを使って音に同調したり、同調を止めたりすることで、必要に応じて話し手の言葉を明瞭にしたり、くぐもらせたりします。
「これは基本的に、脳の働きを模倣した計算モデルです」とボストン大学の神経フォトニクスおよびシステム神経科学センターに所属するセン氏は言う。「そして実際に、音の入力に基づいて音源を分離します。」
「結局のところ、リスナーにとってメリットがあるかどうかを知る唯一の方法は、行動研究です」と空間認知と難聴の専門家であるベスト氏は言う。「そして、それには対象集団を理解している科学者と臨床医が必要です。」
オーストラリア国立音響研究所の元研究員であるベスト氏は、遺伝的要因や小児期の疾患が原因となることが多い感音性難聴の若年成人グループを対象とした研究の設計に携わりました。研究室では、参加者は近くの様々な場所から話している人の声をシミュレートするヘッドホンを装着しました。特定の話者を聞き取る能力は、新しいアルゴリズム、現在の標準アルゴリズム、そしてアルゴリズムなしの3つの条件でテストされました。ボイド氏は多くのデータ収集に協力し、論文の筆頭著者を務めました。
研究者らは、研究結果の中で、「生物学に着想を得たアルゴリズムは、標準的なビームフォーミング手法が効果を発揮しなかった状況下でも、明瞭度を大幅に向上させた」と述べている。この結果は、「カクテルパーティー」のような状況下で難聴者を支援するために、生物学に着想を得たアルゴリズムが持つ潜在的なメリットを強力に裏付けている。
現在、同社は、ユーザーがより効果的に聴くことに注意を向けることができるように視線追跡技術を組み込んだアップグレード版のテストの初期段階にある。
このアルゴリズムを支える科学は、難聴以外の影響も及ぼす可能性がある。
「私たちが研究している[神経]回路は、はるかに汎用的で、はるかに基本的なものです」とセン氏は言う。
「これは究極的には注意力、つまり集中したい場所に関係しています。この回路はまさにそのために作られたものです。長期的には、ADHDや自閉症など、複数の問題を抱える状況で非常に苦労する人々など、他の集団にもこの技術を適用したいと考えています。」
この研究結果はCommunications Engineeringに掲載されています。
この研究は、国立衛生研究所、国立科学財団、およびデマント財団から支援を受けました。
出典:ボストン大学
原著研究 DOI: 10.1038/s44172-025-00414-5
関連記事
周囲の騒音に困っている?脳細胞が活性化している可能性も
リンク先はFUTURITYというサイトの記事になります。(原文:英語)