Historisch gesehen liegt die Betonung von „Musik“ tatsächlich auf der ersten Silbe, denn das Wort ist eine alte Entlehnung aus dem lateinischen mūsica, das auf der ersten Silbe betont wird. Die Endbetonung setzte sich unter Einfluss von französisch musique durch (vgl. Pfeifer) und wurde schließlich zur offiziellen Aussprache – vor dem Hintergrund, dass das Französische früher als Prestigesprache galt.
Die Verschiebung des Wortakzents hat jedoch z. B. die bairische und pfälzische Mundart nicht betroffen, wo man „Musi“ bzw. „Mussik“ immer noch auf der ersten Silbe betont. Die Tatsache, dass die meisten auf -ik endenden Wörter nicht auf der letzten Silbe betont werden (z. B. Plastik, Panik, Logik, Technik, Hektik, Taktik, Mimik) hat vermutlich auch dazu beigetragen, dass die Aussprache mit Betonung auf der ersten Silbe erhalten geblieben ist. Auch liegt der Wortakzent im Deutschen generell auf der ersten Silbe, sodass insbesondere bei häufig genutzen Wörtern die Erstbetonung bevorzugt wird. Fabrik und Politik hingegen sind von französisch fabrique bzw. politique entlehnt, weshalb die Betonung auf die letzte Silbe fällt.
Die Aussprache von Musik ist also dialektal und regional bedingt. Die eine oder andere Aussprache als falsch zu bezeichnen, da sie nicht dem hochdeutschen Standard entspricht, ist unangemessen, da Sprache nicht homogen ist und sich von Region zu Region und von Sprecher zu Sprecher unterscheidet – was absolut normal ist.
In dem Hörbeispiel, das Du am Ende verlinkt hast, höre ich die dialektale Aussprache [muˈzɪk] mit Betonung auf der letzten Silbe, die im Duden als österreichisch angegeben ist.