Meine Theorie ist eine andere. Es hat viel damit zu tun, wo im Hals oder Mundbereich die Worte gebildet werden.
Im Deutschen werden die Worte meist im oberen Teil geformt, während die Briten oder Amerikaner Worte meist tiefer im Hals formen. Bei denen klingt für deutsche Ohren z. B. das "r" leicht gequirlt. Versuch mal, das englische Wort squirrel und dann das deutsche Wort Quirl zu sprechen. Vielleicht wird es dadurch leichter zu verstehen, was ich meine.
Ein Sänger, der sehr hoch singen möchte, bildet den Ton (gedanklich) am oberen Gaumen (fast vorn an den oberen Zähnen). Will er dagegen sehr tief singen, muss er den Ton tief im Hals erzeugen.