エレナ・ベノッチ; アクセル・カルカス
JASAエクスプレスレター。 4、124401 (2024)
https://doi.org/10.1121/10.0034543
非言語的聴覚能力(例:ストリーム分離、音楽知覚能力)は、騒音下での音声知覚に寄与すると考えられている。それらの発達が騒音下での音声知覚の発達とどのように相互作用するかは不明である。ここで我々は、(i)騒音下での音声知覚とストリーム分離の発達を調査し、(ii)発達を通じて音楽能力、ストリーム分離、騒音下での音声知覚の関係を調査することを目的とした。我々の結果は、ストリーム分離と騒音下での音声知覚の両方の長期にわたる発達軌道を確認した。重要なことは、音楽知覚能力がストリーム分離の改善を通じて騒音下での音声知覚に間接的に寄与することを示唆している点である。
1. はじめに
カフェでの和気あいあいとした会合から混雑した講堂での大学の講義まで、聞き手は通常、騒がしい環境でコミュニケーションをとります。騒音下では、音声信号は周波数と時間が重なり合った音波の混合物の一部として耳に届きます。複数の競合する音声ストリームに直面した場合、聞き手は同時発生する音響イベントを聴覚ストリームに解析する必要があり、このプロセスはストリーム分離と呼ばれます ( Bregman、1990、2015 ) 。ここでは、典型的な発達を通じて、ストリーム分離と騒音下での音声知覚の関係の性質を調査することを目的としました。
1.1 騒音下での音声知覚の発達
成人の場合、雑音の音声知覚は、聴覚経路に沿って誘発される干渉の性質に大きく依存します (レビューについてはDurlach 、2003を参照)。音声形状雑音 (SSN) は主に末梢レベルで音声信号を妨害しますが (「エネルギーマスキング」)、背景音声は主に中枢レベルで聴覚処理に影響します (「情報マスキング」、Brungart 、2001 )。通常、干渉話者 ( n = 2~8)がいる背景では、 スペクトル的に同一の SSN がある場合よりも音声知覚が悪くなります ( Brungart 、2001、Simpson および Cooke、2005 )。これは、言語マスキングに固有の認知的寄与が追加されるためです ( Mattys 、2012 )。干渉話者が 1 人だけの場合は、スペクトル的に同一の SSN がある場合よりも音節識別が良くなる傾向があることに注意してください ( Wang および Xu、2024 )。この利点は、1 人の話者マスカーの短い低下を垣間見て、音声ターゲットの識別を向上させる能力から生まれます ( Simpson および Cooke、2005 )。
通常の聴力を持つ子供の場合、雑音の音声知覚は長期にわたる発達経路をたどり(レビューについては、Leibold and Buss、2019を参照)、雑音干渉の性質に依存するようです。SSNの音声知覚は7歳から11歳の間に成熟するようです(Cabrera、2019 ; Evans and Rosen、2021)。1人または2人の干渉する話者が存在する場合、音声知覚は13歳、さらには16歳になるまで徐々に改善します(Buss、2017 ; Calandruccio、2020)。複数の話者(8人から20人の話し手による雑談)がいる場合、一部の研究では、成熟が幼少期後期(Bonino、2013)または思春期(Elliott、1979)まで延長すると報告されていますが、5歳から16歳までは年齢の影響は報告されていないと報告されている研究もあります(Lewandowska、2023)。つまり、ノイズの中での音声知覚は、主にエネルギーマスキングを引き起こす状況ではより早く成熟したレベルのパフォーマンスに達し、情報マスキングを伴う状況ではより遅く成熟したレベルのパフォーマンスに達します。
1.2 聴覚ストリーム分離の発達
聴覚情景分析 (ASA) ( Bregman, 1990 ) は、同時発生する音響イベントを異なるストリームに割り当て、ストリーム分離を実行する能力に依存しています。簡単に言うと、ストリーム分離に関する初期の研究は、特に順次ストリーミングまたは同時ストリーミングに焦点を当てていました (例: Miller and Heise, 1950 ; Moore , 1986 )。しかし、生態学的設定では通常、リスナーは時間的に相関する重複する広帯域ストリームにわたって順次ストリーミングと同時ストリーミングの両方を実行する必要があります ( Elhilali , 2009 )。したがって、聴覚情景分析 (ASA) に関する最新の報告では、音響特性間の時間的一貫性がストリーム分離に重要な役割を果たすことが示唆されています ( Shamma , 2011 )。その結果、ランダムに変化する音色の背景に対して時間的に一貫性のある図形を聞き手が検出するという新しいパラダイムが提案されました。このタスクは「確率的図形地」弁別と呼ばれます ( Teki 、2013 )。実際、若者は確率的ノイズ背景でのそのような図形の出現に非常に敏感で、図形の一貫性が高まるにつれて弁別パフォーマンスも向上しました ( Teki 、2013 )。私たちの知る限り、同時ストリーミングと順次ストリーミングの両方を含むこのようなパラダイムで子供たちがどのようにパフォーマンスするかは未だ研究されていません。
乳児は、大人と同じ手がかりを使って同時かつ順次的なストリーム分離を実行しますが、効率は劣ります (レビューについては、Calcus、2024 を参照)。子供の分離能力は、大人に比べてまだ未熟であるように見えます。私たちが知る限り、研究の大部分は順次的なストリーミングに焦点を当てており、思春期の子供がストリーム分離を経験するには、大人よりも大きな周波数分離 (子供よりは小さい) が必要であることが一貫して示されています (例: Sussman および Steinschneider、2009 )。子供の同時ストリーミングに焦点を当てた研究は 1 つだけあり、13 歳の子供は、不調和な倍音に基づく音のストリーミングが大人よりも苦手であることを示しています ( Alain、2003 )。これらの結果を合わせると、ストリーム分離は思春期になって初めて完全に成熟することを示唆しています。
1.3 雑音下におけるストリーム分離と音声知覚の関係
ASA理論によれば、ストリーム分離は騒音下での音声知覚に寄与する(Bregman、1990)。成人におけるこの関係を調査した研究はほとんどない。行動的には、ストリーム分離能力は騒音下での音声知覚の変動の最大15%を説明する(Holmes and Griffiths、2019)。神経画像研究では、課題の難易度が上昇すると、ストリーム分離と騒音下での音声知覚の両方が聴覚皮質活動の同様の変化をもたらし、おそらく神経処理の共有を反映している(Holmes、2021)。これらの知見を合わせると、ストリーム分離と騒音下での音声知覚の間に関係があるという仮説が裏付けられるが、この関係の方向性は依然として不明である。
ストリーム分離に加えて、他の(たとえば個人)要因が騒音下での音声知覚に寄与している可能性があります。そのような要因の 1 つとして音楽の専門知識が挙げられ、これは騒音下での音声知覚を改善すると考えられています(たとえば、Başkent および Gaudrain、2016)。ただし、すべての研究で騒音下での音声知覚に関して音楽家の利点が見出されたわけではないことに注意してください(たとえば、Boebinger、2015 )。これは、 Coffey(2017)でレビューされているように、研究間で使用された素材が異なるためである可能性があります。研究間で音楽の専門知識を定義する方法の違いも、文献で報告されている矛盾する結果の一部に関係している可能性があります。実際、個人を音楽家と非音楽家に二分分類することは、集団内の音楽能力の範囲全体を反映しない可能性があります(Law and Zentner、2012)。したがって、連続的な尺度で音楽能力を測定すると、音楽と音声処理の関係をより正確に把握できる可能性があります(Zentner and Strauss、2017)。
実際、音楽的能力は騒音下での音声知覚に直接的にも(以前にレビューしたように)、また聴覚知覚に関連する他の要因を改善することによって間接的にも寄与している可能性がある。聴覚情景分析に関わる能力に対する音楽的専門知識の利点を示す研究は、この見解を支持している。例えば、同時発生する確率的背景から聴覚ターゲットを分離する必要がある情報マスキングパラダイムにおいて、音楽家は非音楽家よりも優れた成績を収めている(Oxenham、2003)。また、同時発生する音を弁別するために必要な周波数差が小さい(Zendel and Alain、2009)ことから、音楽家の方が非音楽家よりもストリーム分離能力が優れていることがわかる。したがって、音楽家であることはストリーム分離能力の向上につながり、それが騒音下での音声理解に有益となる可能性がある。この文献レビューで提示した知見を総合すると、図1に示す理論モデルが提案されることになる。
図1.

文献レビューに基づいた、発達過程における音楽能力、ストリーム分離、および騒音下での音声知覚の関係の理論モデル。
文献レビューに基づいた、発達過程における音楽能力、ストリーム分離、および騒音下での音声知覚の関係の理論モデル。
本研究の目的は 2 つあります。1 つ目は、同時および順次ストリーミングを必要とする確率的図形地課題を使用して、ストリーム分離の発達を調査することです。2 つ目は、発達過程を通じて、音楽能力、ストリーム分離、および雑音下での音声知覚の関係の性質を探ることです。そのために、私たちは、幅広い知覚的音楽能力を示す子供、青年、および若年成人を募集しました。参加者には、確率的図形地課題と、雑音下での音声知覚を調査する課題が与えられました。発達の影響は、雑音下でのストリーム分離と音声知覚について個別に調査されました。次に、構造方程式モデリングを使用して、発達過程を通じて、音楽能力、ストリーム分離、および雑音下での音声知覚の関係を調査しました。
2. 方法
2.1 参加者
音楽訓練という交絡因子なしで音楽知覚能力の影響を評価するために、音楽訓練を受けていないか、または限定的(定期的な練習が2年未満)であるという自己報告に基づいて、非音楽家の参加者のみが研究に含まれました。合計で153人の非音楽家の参加者がこの研究に含まれました。76人の子供(8〜12歳)、33人の青年(1〜17歳)、44人の成人(18〜22歳)です。すべての参加者はフランス語を母国語としていました。0.25〜8 kHzのオクターブ間隔で測定したところ、彼らの聴力閾値は正常でした[≤ 20 dB聴覚レベル(HL)]。聴覚、神経、発達障害の履歴はありませんでした。WISCまたはWAISの年齢標準化スコアで測定したところ、彼らの作業記憶は正常でした(平均値の±2標準偏差)。
2.2 刺激
2.2.1 聴覚ストリームの分離
ストリームの分離は、実験 1 で最高の識別スコアをもたらしたパラメータを用いて、確率的図形地タスク ( Teki 、2013 ) を使用して評価されました。試行は、179 Hz から 7246 Hz (対数分布) のランダムな周波数を持つ 50 ms の同時純音 5 ~ 15 個の 2 秒間のシーケンスで構成され、コード間間隔のない不協和音のコードを形成しました。2/3 のシーケンスでは、8 つの純音が 7 つのコードで繰り返され、背景から飛び出した聴覚オブジェクト (350 ms の図形) の知覚につながりました [信号対雑音比 (SNR) = 0 dB]。図形は、シーケンスの開始後 750 ms から 1 秒の間に現れました。試行の 3 分の 1 には図形が含まれず、背景のみに対応していました。全体として、シーケンスの強度は 70 dB の音圧レベル (SPL) に設定されました。
参加者は、各試行に図が含まれているかどうかを示すように求められました。タスクの開始時に、参加者には図の見本が提示され、その後 5 回の慣れ親しむための試行が行われました。各試行の後にフィードバックが提供されました。ヒット率 (つまり、図が含まれている試行でのターゲット検出確率) と誤報 (つまり、背景のみが含まれている試行での誤った図の報告確率) が計算され、d' 感度指数 (ヒット率と誤報の Z 変換の差として計算) に統合されました。
2.2.2 騒音下での音声知覚
刺激はCalcus (2018)で使用されたものと同一で、様々な聴覚背景における母音-子音-母音(VCV)のログアトムで構成されていました。被験者には、女性話者による16種類の/aCa/発声の2回の繰り返しからなる32個のログアトムが提示されました。/C/は、次の子音セットから選択されました:/p、t、k、b、d、g、f、s、∫、m、n、r、l、v、z、j/。ログアトムは、静かな環境と、1人の妨害話者(1-Talker)とSSNの2つの背景雑音条件で提示されました。妨害話者が 1 人だけの場合、音声知覚に最も支障をきたすわけではありませんが ( Simpson および Cooke、2005 )、これは、類似した音声の背景から対象の図を区別する確率的図地タスクに多少匹敵するため選択されました。
1 人の話し手によるノイズ条件では、参加者は男性の話者によって読み上げられたフランスの新聞からの抜粋を聴取しました。録音は、1 秒を超える沈黙、発音エラー、固有名詞を削除するように編集されました。サウンド ファイルは、共通の二乗平均平方根に正規化されました。SSN マスカーは、1 人の話し手条件から生成されました。高速フーリエ変換を使用して、元の信号のパワー スペクトルと位相スペクトルを計算しました。次に、同等のパワー スペクトルを持つが位相がランダム化された新しい信号が生成され、SSN を構成しました。
平均して、ターゲット ロガトームは約 500 ミリ秒続きました。両タイプのマスカーの持続時間は 2 秒でした。ターゲットとマスカーは混合され、ターゲットの開始はマスカーの開始から 200 ミリ秒から 1 秒以内にジッターしました。計算の便宜上、背景ノイズは各ロガトームの長時間マスカー セグメントからランダムに選択されましたが、すべての参加者で固定されました。ノイズ条件では、SNR は -5 dB に設定されました。刺激は 70 dB SPL で提示されました。ターゲットとマスカーは両耳に同時に (つまり、両耳に) 提示されました。パフォーマンスは、正しい子音識別のパーセンテージとして評価されました。
2.2.3 音楽的能力
参加者は、音楽知覚能力を客観的に評価するMICRO-PROMSバッテリーを完了しました(Strauss、2023)。MICRO-PROMSは、3間隔の強制選択手順を使用して、音楽の次元に沿った識別能力を評価します。アクセント、メロディー、ピッチ、リズム、テンポ、チューニング、音色の識別タスクの7つのサブテストが含まれ、合計18回の試行があります。このタスクからの刺激は70 dB SPLで提示されました。
2.3 手順
テストは、大学のキャンパスまたは学校の静かな部屋で行われました。まず、参加者は気導聴力検査を受けました。次に、子供と青少年には WISC-V ワーキング メモリ インデックス、成人には WAIS-IV を用いてワーキング メモリを測定しました。聴覚タスクでは、ヘッドフォン (Sennheiser モデル HD300、Sennheiser、ヴェーデマルク、ドイツ) から音が提示されました。音の強度は 70 dB SPL に設定されました。参加者は MICRO-PROMS で聴覚タスクを開始しました。その後、実験の残りの部分では Gorilla オンライン テスト プラットフォームに誘導されました。参加者は最初に聴覚ストリーム分離タスク、次に音声知覚タスクを受けました。
2.4 外れ値検出
データの品質を保証するために、2 つの外れ値検出アルゴリズムが実行されました。まず、外れ値検出アルゴリズムを個人の試行反応時間に適用しました。参加者と聴覚課題ごとに、反応時間が平均値より ±3 標準偏差上/下の試行を特定しました。これらの試行は参加者データセットから削除され、それ以上の分析は行われませんでした。拒否された試行の数は、年齢層と課題間で有意に異なりませんでした [ X 2 (6, N = 150) = 0.653, p = 0.995]。
2 番目のステップでは、年齢グループの平均パフォーマンス レベルに基づいて個々の外れ値を特定しました。第 1/第 3 四分位数の 1.5 倍を超えるデータ ポイントは外れ値とみなされ、以降の分析から除外されました。これにより、聴覚タスクで 25 のデータ ポイント、ストリーム分離タスクで 18 のデータ ポイント、ノイズ認識タスクで 7 のデータ ポイントが除外されました。外れ値の割合は、年齢グループ間で有意に異なりませんでした [ X 2 (4, N = 150) = 6.00 p = 0.199] (各年齢グループで 8% 未満のデータ ポイントが除外されました)。
3. 結果
図2は、聴覚課題全体のパフォーマンスの分布を示しています。まず、ストリーム分離課題でd′感度指数が偶然を上回ったかどうか、およびノイズ下での音声知覚課題でパフォーマンスが天井レベルを下回ったかどうかを判断するために、片側t検定を実施しました。3つの年齢グループすべてにおいて、参加者はストリーミング課題で偶然を有意に上回るパフォーマンスを示しました(すべてp s < 0.05)。パフォーマンスは、ノイズ下での音声知覚課題で有意に天井を下回りました(すべてp s < 0.05)。ただし、成人の静かな状況での音声知覚では、パフォーマンスは天井レベルと有意に異なりませんでした[ t(32)= 1、p = 0.324]。したがって、この条件はこれ以上分析されませんでした。
図2.

バイオリンのプロットは、各年齢層における (A) ストリーム分離タスク、(B) 音楽能力、(C) 1 人の話者がいる場合の音声知覚、(D) SSN タスクのパフォーマンスの分布を表しています。バイオリンの水平線は中央値、赤い点は平均を表しています。(E) 相関マトリックス。各セルは、2 つの変数間の (ピアソン) 相関係数を表しています。相関の強さは色の濃さで示されます。有意な相関は星印で示され、係数には下線が引かれています。
バイオリンのプロットは、各年齢層における (A) ストリーム分離タスク、(B) 音楽能力、(C) 1 人の話者がいる場合の音声知覚、(D) SSN タスクのパフォーマンスの分布を表しています。バイオリンの水平線は中央値、赤い点は平均を表しています。(E) 相関マトリックス。各セルは、2 つの変数間の (ピアソン) 相関係数を表しています。相関の強さは色の濃さで示されます。有意な相関は星印で示され、係数には下線が引かれています。
私たちの最初の目標は、幼少期から成人期にかけての騒音下でのストリーム分離と音声知覚の発達を調べることでした。この目標に取り組むために、従属変数の性質に合わせた統計的手法を採用しました。連続変数 (ストリーム分離と MICRO-PROMS) を伴うタスクでは、年齢層を被験者間因子として分散分析 (ANOVA) を実施しました。参加者が 16 子音混同行列から正しい答えを選択する騒音下での音声タスクでは、二項分布の一般化線形混合効果モデル (GLMM) を使用してリスナーのパフォーマンスを評価しました。年齢層と騒音の種類は固定効果として含められ、被験者はランダム効果として使用されました。
年齢層はストリーム分離に有意な主効果があった[ F (2, 144) = 31.14; p < 0.001]。具体的には、子供は青年よりも成績が悪く(p < 0.001)、青年のパフォーマンスは成人と有意に差がなかった(p = 0.372)ことが、Bonferroni補正事後t検定で示された。全体的に、1話者のパフォーマンスはSSN条件よりも優れていた[ F (1, 147) = 43.95、p < 0.001]。また、年齢層の有意な主効果[ F (2, 147) = 20.71、p < 0.001]と、年齢層と条件の相互作用[ F (2, 147) = 5.313、p = 0.03]もあった。 SSN条件では、子供の成績は青年よりも劣っていた(p <0.001)が、青年の成績は成人の成績と有意に差はなかった(p =0.356)。1人話者条件では、子供の成績は青年よりも有意に劣っていた(p <0.001)が、青年の成績は成人よりも有意に劣っていた(p =0.044)。年齢層による音楽能力への有意な影響はなかった[ F(2,133)=0.427、p =0.65]。
この研究の2つ目の目的は、発達過程を通じて音楽能力、ストリーム分離、および雑音下での音声知覚の関係を調べることでした。そのために、パス分析による構造方程式モデリング(SEM)を使用しました。パス分析は、変数間の関連の強さと方向の調査を容易にする統計手法です(Gunzler、2013)。これにより、1つの変数が別の変数に影響を与える経路と、この影響がシステムを通じてどのように伝達されるかを特定できます(Kline、2013)。この方法は、変数の因果関係と時間的順序の両方を前提としているため、媒介関係を説明するために広く使用されています(Gunzler、2013)。分析を開始するために、すべての測定変数を含むピアソン相関行列を計算しました[図2(E)を参照]。この行列は、変数間の関係の概要と、構造方程式モデルの構築方法の理解を提供します(OckeyおよびChoi、2015)。
年齢はストリーム分離課題および騒音下での音声知覚課題と有意に相関しており、これらは互いに有意に相関していました。音楽能力はストリーム分離と有意に相関しています。また、ストリーム分離と騒音下での音声知覚の間にも有意な相関が見られました。その他の有意な関係は観察されませんでした (すべてp > 0.05)。
SEM の利点の 1 つは、潜在変数を使用して観測変数と非観測変数の両方を組み込むことができることです ( Kline、2013 )。観測変数を潜在変数に整理することで、変数間の因果関係を簡潔に表すことができ、分析の解釈が簡素化されます ( Goodboy および Kline、2017 )。基準変数とは、潜在変数を予測するために使用される観測変数を指す用語です。したがって、モデルを簡素化するために、1-Talker タスクと SSN タスクの両方を「雑音下での音声」という潜在変数に整理しました (それぞれβ = 0.63、p < 0.001 およびβ = 0.77、p < 0.001)。
図1に示した理論モデルを調べたところ、近似値の二乗平均平方根誤差(RMSEA)に基づく全体的な適合度は中程度で、他の要因については良好な結果が得られました[SBS-v2(9) = 2.79、p = 0.248、比較適合指数(CFI)= 0.994、RMSEA = 0.051、標準化残差平均平方根(SRMR)= 0.021]。音楽能力と雑音下での音声知覚との関連(p = 0.284)を除き、すべてのパス係数は統計的に有意であることがわかりました。パスを排除することでモデルの適合度が向上するかどうかを評価するために、モデルトリミング手法を使用して有意でないパスを排除しました(Hair、2011)。さらに、音楽能力は1人話者またはSSN条件のいずれとも有意に相関していないことを考慮して、音楽能力と雑音下での音声との直接的な関係を排除しました。これにより、図3に示すように、適合性の高い構造モデルが得られました[SBS-v2(3) = 2.903、p = 0.407、CFI = 1、RMSEA < 0.001、SRMR = 0.022]。
図3.

音楽知覚能力、聴覚シーン分析、および騒音下での音声知覚の関係を表す SEM パス分析図。線は各変数の直接的な影響を表します。線に沿った係数は標準化された β 値を示します。円は潜在変数、四角は観測変数を表します。** p < 0.01、*** p < 0.001。
音楽知覚能力、聴覚シーン分析、および騒音下での音声知覚の関係を表す SEM パス分析図。線は各変数の直接的な影響を表します。線に沿った係数は標準化されたβ値を示します。円は潜在変数、四角は観測変数を表します。** p < 0.01、*** p < 0.001。
分析の結果、音楽能力とストリーム分離(β = 0.29、p = 0.001)の間には有意な直接的な経路があり、それが騒音下での音声知覚(β = 0.4、p = 0.001)を予測することが明らかになりました。また、年齢層とストリーム分離( β = 0.44、p < 0.001)および騒音下での音声知覚(β = 0.44、p < 0.001) の間にも 2 つの直接的な経路 がありました。
4. 議論
本研究の第一の目的は、小児期から成人期にかけての雑音下でのストリーム分離と音声知覚の発達を調べることであった。本研究の結果は、同時分離と逐次分離の両方を必要とする課題におけるパフォーマンスは小児期には未熟なままであり、青年期になって初めて成熟に達することを示唆している。これまでのストリーミングの発達研究は逐次分離または同時分離のいずれかに焦点を当てており、ストリーミングは少なくとも小児期後期までは未熟なままであることを示唆している ( Alain、2003年; SussmanおよびSteinschneider、2009年)。本サンプルでは、10代の若者 (13~17歳) は、聞き手がストリーム分離を実行するために時間的一貫性に頼ることを要求する課題において、成人のような検出パフォーマンスを示した。
SEM分析によって示されているように、ストリーム分離能力は騒がしい環境での音声知覚に寄与しているようです。年齢も騒音下での音声知覚に寄与しており、小児期から青年期(1人話者とSSNの両方で)、そして成人期(1人話者)にかけて実際に改善し続けました。言い換えれば、青年期(13~17歳)はSSNでは成人のようなパフォーマンスを示しましたが、1人の妨害話者が存在する場合のパフォーマンスは未熟なままでした。これは、音声知覚は情報マスキング( Buss、2017、Bonino、2013 )よりもエネルギーマスキング( Cabrera、2019、Buss、2017、LeiboldおよびBuss、2019)の状況でより早く成熟することを示唆する以前の文献と一致しています。パフォーマンスは1人話者の方がSSNよりも全体的に優れていましたが、その成熟はSSNよりも長いようです。これは、妨害する話者の存在によって引き起こされる情報マスキングに関連する(限定的だが存在しないわけではない)認知干渉によるものと考えられます(Buss、2017)。思春期に成熟すると、ストリーム分離は騒音下での音声知覚のさらなる発達の基礎を築く可能性があります。
ストリーム分離に加えて、他の要因が聴覚処理に影響を及ぼし、雑音下での音声知覚に寄与することが知られています。そのような要因の 1 つとして、知覚的な音楽能力が挙げられます。したがって、本研究の 2 つ目の目的は、発達過程を通じて音楽能力、ストリーム分離、雑音下での音声知覚の関係を探ることです。これまでのほとんどの研究とは異なり、私たちは正式な音楽教育を受けていない(つまり、非音楽家) 参加者を調査しましたが、MICRO-PROMS で測定すると、知覚的な音楽能力の範囲を示しました (スコアは幼少期から成人期まで安定していました)。このアプローチを使用して、音楽知覚能力がストリーム分離に直接寄与していることを観察しました。これは、音楽の専門知識が同時ストリーム分離の改善につながることを示した以前の結果 ( Zendel および Alain、2009 ) を拡張します。ここでは、ストリーム分離タスクは、音楽的であると見なすことができるコード検出に依存していました。音楽能力と同時音声ストリームの分離との間に関係が見られるかどうか疑問に思うかもしれません。成人の音楽家は、雑音下での音声検出タスクにおいて非音楽家よりも優れた成績を収めており(Morse-Fortier、2017)、これは音楽能力が音声ストリーミングに寄与する可能性を裏付けています。
知覚的音楽能力が強い人はストリーム分離において優れたパフォーマンスを示すが、我々の研究結果は、これらの能力が騒音下での音声識別の向上に直接結びつくわけではないことを示唆している。この観察結果は、このテーマに関する以前の研究の一部(Boebinger、2015年、Madsen、2017年)と一致しているが、すべて(BaşkentとGaudrain、2016年など)ではない。知覚的音楽能力はしたがって、ストリーム分離によって媒介される雑音下での音声知覚に間接的に寄与している可能性がある。言い換えれば、知覚的音楽能力が優れている非音楽家は、優れたストリーミング能力も持っており、それが今度は雑音下での音声の優れた理解につながる。自称音楽家では、逆の関係も観察されている。雑音下での音声知覚は、ストリーム分離(確率的図形地課題によって測定、Johns、2023年)を予測した。これは、自称非音楽家では当てはまらなかった。単なる知覚的な音楽能力と、積極的で正式な音楽訓練が聴覚処理のさまざまな側面にそれぞれどのような貢献をしているかをよりよく理解するには、さらなる研究が必要です。
本研究の限界は、確率的図地課題における子どもたちの成績が非常に低かった(d′ = 0.14)ことである。子どもたちの成績は偶然のレベルを有意に上回っていたが、シーケンスのパラメータ変化(図の構成要素の数、図の持続時間など)が発達全体を通じて成績にどのように影響するかを調査するには、今後の研究が必要である。もう 1 つの限界は、雑音下での音声課題の各ロガトームが、すべての参加者に対して同じ雑音背景とともに提示された(雑音抽出はロガトーム間で変化した)という事実である。これは、特に 1 人の話者条件において、参加者間で特定のロガトームの識別に系統的な影響をもたらした可能性がある。今後の研究では、より生態学的な設定(さまざまな SNR、空間的定位、干渉する話者の数などを含む)を使用して雑音下での音声知覚を調査することが有益である。
結論として、私たちの結果は、少なくとも幼少期後期までは、雑音下でのストリーム分離と音声知覚の長期にわたる発達を示す既存の文献と一致しています。さらに、知覚的音楽能力は、ストリーム分離能力を通じて、雑音下での音声知覚に間接的に寄与しています。これは、生態学的環境における音声知覚の改善を目的とした臨床ツールの設計に意味を持ちます。
謝辞
この研究は、AC に対する MSCA 個人フェローシップ (助成金番号 798093) および MIS FRS-FNRS 助成金 (番号 F.4508.22)、EB に対するベルギー小児研究基金からの助成金によって支援されました。データ収集にご協力いただいた Luna Leonardy 氏と Esperance Moutikila Kanama 氏に感謝いたします。
著者の宣言
利益相反
開示すべき利益相反はありません。
倫理承認
人間の参加者の参加は、ULB心理学部の倫理委員会(296/2021)によって審査され、承認されました。
データの可用性
データと R スクリプトは、OSF ( https://doi.org/10.17605/OSF.IO/5NDUT ) で公開されています。
参考文献
1. アラン、 C.、 テウニセン、 エル、 シュヴァリエ、 H.、 バティ、 M.、 そして テイラー、 MJ(2003)。 同時聴覚物体の識別における発達的変化」、認知脳研究 16(2)、210–218。https://doi.org/10.1016/S0926-6410(02)00275-6
Google 学術クロスレフ
2. バシュケント、 D.、 そして ゴードレイン、 E.(2016)。 スピーチ・オン・スピーチ知覚におけるミュージシャンの優位性」、J. Acoust. Soc. Am. 139(3)、EL51–EL56。https://doi.org/10.1121/1.4942628
Google 学術クロスレフ 出版元
3. ボービンガー、 D.、 エヴァンス、 S.、 ローゼン、 S.、 リマ、 CF、 男らしい、 T.、 そして スコット、 SK(2015)。 音楽家も非音楽家も、マスクされたスピーチを認識する能力は同等である」、J. Acoust. Soc. Am. 137(1)、378–387。https://doi.org/10.1121/1.4904537
Google 学術クロスレフ 出版元
4. ボニーノ、 A.、 ライボルド、 L.、 そして バス、 E.(2013)。 子どもと大人の知覚マスキングからの解放:キャリアフレーズの利点」、耳で聞く。 34、3–14。https://doi.org/10.1097/AUD.0b013e31825e2841
Google 学術クロスレフ 出版元
5. ブレグマン、 A.(1990)。聴覚シーン分析。音の知覚的構成( MIT プレス、 マサチューセッツ州ケンブリッジ)。
Google 学術クロスレフ
6. ブレグマン、 として(2015)。 聴覚シーン分析の理解の進歩」、音楽の知覚。 33(1)、12–19。https://doi.org/10.1525/mp.2015.33.1.12
Google 学術クロスレフ
7. ブルンガルト、 DS、 シンプソン、 B.、 エリクソン、 M.、 そして スコット、 韓国(2001)。 複数の同時話者の知覚における情報的およびエネルギー的マスキング効果」、J. Acoust. Soc. Am. 110(5)、2527–2538。https://doi.org/10.1121/1.1408946
Google 学術クロスレフ 出版元
8. バス、 E.、 ライボルド、 LJ、 ポーター、 HL、 そして グロース、 JH(2017)。 学齢期の子供と成人における1人または2人の話者マスキングにおける音声認識:知覚マスキングとちらつきの発達」、J. Acoust. Soc. Am. 141(4)、2650–2660。https://doi.org/10.1121/1.4979936
Google 学術クロスレフ 出版元
9. カブレラ、 L.、 ヴァルネット、 L.、 バス、 E.、 ローゼン、 S.、 そして ロレンツィ、 C.(2019)。 小児期における時間的聴覚処理の発達:時間的変調選択性ではなく効率性の変化」、J. Acoust. Soc. Am. 146(4)、2415–2429。https://doi.org/10.1121/1.5128324
Google 学術クロスレフ 出版元
10. カランドルッチョ、 L.、 ポーター、 HL、 ライボルド、 LJ、 そして バス、 E.(2020)。 学齢期の子供たちの明瞭な発話の利点:雑音下での発話と音声中の発話の認識」、J. スピーチ言語。聞く。研究。 63(12)、4265–4276。https://doi.org/10.1044/2020_JSLHR-20-00353
Google 学術クロスレフ 出版元
11. 微積分、 A.(2024)。 聴覚シーン分析の開発:ミニレビュー」、前面。人間の神経科学。 18、1352247。https://doi.org/10.3389/fnhum.2024.1352247
Google 学術クロスレフ
12. 微積分、 A.、 デルテンレ、 P.、 コリン、 C.、 そして コリンスキー、 R.(2018)。 失読症児の騒音知覚における発話困難に対する末梢的および中枢的寄与」、開発科学 21、12558 円。https://doi.org/10.1111/desc.12558
Google 学術クロスレフ 出版元
13. コフィー、 EBJ、 モギレバー、 注意、 そして ザトーレ、 RJ(2017)。 ミュージシャンの雑音下での音声知覚:レビュー」、聞く。Res。 352、49–69。https://doi.org/10.1016/j.heares.2017.02.006
Google 学術クロスレフ 出版元
14. デュラッハ、 NI、 石工、 CR、 キッド、 G.、 アルボガスト、 翻訳、 コルバーン、 HS、 そして シン・カニンガム、 BG(2003)。 情報マスキングに関する注意 (L)」、J. Acoust. Soc. Am. 113(6)、2984–2987。https://doi.org/10.1121/1.1570435
Google 学術クロスレフ 出版元
15. エルヒラリ、 M.、 ま、 L.、 ミシェル、 C.、 オクセナム、 AJ、 そして シャマ、 南アフリカ(2009)。 聴覚シーンの知覚組織と皮質表現における時間的一貫性」、ニューロン 61(2)、317–329。https://doi.org/10.1016/j.neuron.2008.12.005
Google 学術クロスレフ 出版元
16. エリオット、 LL(1979)。 制御された単語予測可能性を備えた文章素材を使用した、騒音下での音声明瞭度テストにおける 9 歳から 17 歳の子供の成績」、J. Acoust. Soc. Am. 66(3)、651–653。https://doi.org/10.1121/1.383691
Google 学術クロスレフ 出版元
17. エヴァンス、 S.、 そして ローゼン、 S.(2022)。 誰が正しいのか?最小対誤答法を用いた幼児向け雑音下での単語識別テスト」、J. スピーチ言語。聞く。研究。 65(1)、159–168。https://doi.org/10.1044/2021_JSLHR-20-00658
Google 学術クロスレフ 出版元
18. グッドボーイ、 AK、 そして クライン、 RB(2017)。 構造方程式モデリングを特徴とする出版されたコミュニケーション研究に関する統計的および実践的な懸念」、共同決議案 34(1)、68–77。https://doi.org/10.1080/08824096.2016.1214121
Google 学術クロスレフ
19. ガンツラー、 D.、 チェン、 T.、 ウー、 P.、 そして 張、 H.(2013)。 構造方程式モデリングによる媒介分析入門」、上海アーチ精神科 25(6)、390–394。https://doi.org/10.3969/j.issn.1002-0829.2013.06.009
Google 学術出版元
20. 髪、 JF、 リングル、 CM、 そして ザルスタット、 M.(2011)。 PLS-SEM: まさに特効薬」、J. マーケット。理論と実践。 19(2)、139–152。https://doi.org/10.2753/MTP1069-6679190202
Google 学術クロスレフ
21. ホームズ、 E.、 そして グリフィス、 TD(2019)。 「正常な」聴力閾値と基本的な聴覚グループ化プロセスは、騒音下での音声知覚の困難を予測する」、科学代表 9(1)、16771。https://doi.org/10.1038/s41598-019-53353-5
Google 学術クロスレフ 出版元
22. ホームズ、 E.、 ゼイドマン、 P.、 フリストン、 ケイジェイ、 そして グリフィス、 TD(2021)。 騒音下での音声知覚の困難は聴覚皮質における基本的なグループ化プロセスに関連している」、大脳皮質 31(3)、1582–1596。https://doi.org/10.1093/cercor/bhaa311
Google 学術クロスレフ 出版元
23. ジョンズ、 マサチューセッツ、 キャロウェイ、 RC、 フィリップス、 私。、 カルジス、 副社長、 ダッタ、 K.、 スミス、 E.、 シャマ、 南アフリカ、 グペル、 MJ、 そして クチンスキー、 南東(2023)。 確率的図形地知覚のパフォーマンスは、雑音下での音声認識と作業記憶容量の個人差によって異なる。」、J. Acoust. Soc. Am. 153(1)、286–303。https://doi.org/10.1121/10.0016756
Google 学術クロスレフ 出版元
24. クライン、 RB(2013)。 構造方程式モデリングによるテストの公平性の統計的側面の評価」、教育研究評価 19(2~3)、204–222。https://doi.org/10.1080/13803611.2013.767624
Google 学術クロスレフ
25. 法、 LNC、 そして ゼントナー、 M.(2012)。 音楽能力を客観的に評価する:音楽知覚スキルのプロファイルの構築と検証」、PLoSワン 7(12)、52508 円。https://doi.org/10.1371/journal.pone.0052508
Google 学術クロスレフ 出版元
26. ライボルド、 LJ、 そして バス、 E.(2019)。 学齢期の児童におけるマスク音声認識」、フロント。サイコ。 10、1981。https://doi.org/10.3389/fpsyg.2019.01981
Google 学術クロスレフ 出版元
27. レヴァンドフスカ、 M.、 ミルナー、 R.、 ガンク、 M.、 ウォダルチク、 E.、 ドルジツカ、 J.、 そして スカルジンスキ、 H.(2023)。 7歳から16歳までのポーランドの児童および青少年における中枢聴覚プロセスの発達」、カレント心理学 42(3)、1789–1806。https://doi.org/10.1007/s12144-021-01540-x
Google 学術クロスレフ
28. マドセン、 SMK、 ホワイトフォード、 クアラルンプール、 そして オクセナム、 AJ(2017)。 ミュージシャンは、競合する音声背景で音声を聞くときに、基本周波数の違いから利益を得られない。」、科学代表 7(1)、12624。https://doi.org/10.1038/s41598-017-12937-9
Google 学術クロスレフ 出版元
29. マティス、 SL、 デイビス、 MH、 ブラッドロー、 AR、 そして スコット、 SK(2012)。 悪条件下での音声認識:レビュー」、言語。認知。プロセス。 27(7~8)、953–978。https://doi.org/10.1080/01690965.2012.705006
Google 学術クロスレフ
30. ミラー、 G.そして ハイゼ、 G.(1950)。 トリル閾値」、J. Acoust. Soc Am. 22、637–638。https://doi.org/10.1121/1.1906663
Google 学術クロスレフ
31. ムーア、 BCJ、 グラスバーグ、 BR、 そして ピーターズ、 RW(1986)。 調和音群の中で不調和な部分を別々の音として聞く閾値」、J. Acoust. Soc. Am. 80(2)、479–483。https://doi.org/10.1121/1.394043
Google 学術クロスレフ 出版元
32. モース・フォーティエ、 C.、 パリッシュ、 MM、 バラン、 日本語、 そして フレイマン、 RL(2017)。 情報マスキングとエネルギーマスキングが存在する場合の音声検出に対する音楽トレーニングの効果」、トレンドを聞く。 2017、21。https://doi.org/10.1177/2331216517739427
Google 学術クロスレフ
33. オッキー、 ジェフ、 そして チェ、 私。(2015)。 言語評価のための構造方程式モデリング報告の実践」、言語。評価。Q。 12(3)、305–319。https://doi.org/10.1080/15434303.2015.1050101
Google 学術クロスレフ
34. オクセナム、 AJ、 フリゴール、 BJ、 石工、 CR、 そして キッド、 G.(2003)。 情報マスキングと音楽トレーニング」、J. Acoust. Soc. Am. 114(3)、1543–1549。https://doi.org/10.1121/1.1598197
Google 学術クロスレフ 出版元
35. シャマ、 南アフリカ、 エルヒラリ、 M.、 そして ミシェル、 C.(2011)。 聴覚情景分析における時間的一貫性と注意」、トレンド神経科学。 34(3)、114–123。https://doi.org/10.1016/j.tins.2010.11.002
Google 学術クロスレフ 出版元
36. シンプソン、 南アフリカ、 そして クック、 M.(2005)。 N話者の喃語における子音識別はNの非単調関数である(L)」、J. Acoust. Soc. Am. 118(5)、2775–2778。https://doi.org/10.1121/1.2062650
Google 学術クロスレフ 出版元
37. シュトラウス、 H.、 ライヒェ、 S.、 ディック、 M.、 そして ゼントナー、 M.(2023)。 10分で音楽能力をオンラインで評価: Micro-PROMSの開発と検証」、行動研究方法 56(3)、1968–1983。https://doi.org/10.3758/s13428-023-02130-4
Google 学術クロスレフ 出版元
38. サスマン、 E.、 そして シュタインシュナイダー、 M.(2009)。 子どもの聴覚情景分析における注意効果」、神経心理学 47(3)、771–785。https://doi.org/10.1016/j.neuropsychologia.2008.12.007
Google 学術クロスレフ 出版元
39. テキ、 S.、 マリア チャイト、 クマール、 S.、 シャマ、 S.、 そして グリフィス、 TD(2013)。 時間的一貫性に基づく複雑な音響シーンの分離」、イーライフ 2、00699 いいえ。https://doi.org/10.7554/eLife.00699
Google 学術クロスレフ 出版元
40. 王、 Y.、 そして 徐、 L.(2024)。 異なる人数の話者が混ざった複数話者の雑談における英語の母音認識」、JASAエクスプレスレター 4(4)、045202。https://doi.org/10.1121/10.0025616
Google 学術クロスレフ 出版元
41. ゼンデル、 BR、 そして アラン、 C.(2009)。 ミュージシャンの同時音分離は強化される」、ジャーナル オブ コグニティブ ニューロサイエンス 21(8)、1488–1498。https://doi.org/10.1162/jocn.2009.21140
Google 学術クロスレフ 出版元
42. ゼントナー、 M.、 そして シュトラウス、 H.(2017)。 音楽能力を迅速かつ客観的に評価する: Short-PROMSとMini-PROMSの開発と検証: 音楽能力の評価」、Ann. NY Acad. Sci. 1400(1)、33–45。https://doi.org/10.1111/nyas.13410
Google 学術クロスレフ 出版元
© 2024 著者。特に記載のない限り、すべての記事の内容は Creative Commons Attribution (CC BY) ライセンス (https://creativecommons.org/licenses/by/4.0/) に基づいてライセンスされています。
リンク先はASAというサイトの記事になります。(原文:英語)