Wie Median effizient berechnen?

Ich habe Liste von betrachteten Merkmalen x1 , ... xm habe und deren absoluten häufigkeiten h1, ... hm.

Nun soll ich ein Programm schreiben, dass in nur in abhängigkeit von m nicht von der ganzen Stichprobe den Median berechnet. Wie geht das ?

jolinamaria

11.03.2022, 21:33

Bei uns war m immer der Modalwert…ist bei euch m der größte x-Wert oder wie kann ich mir das vorstellen und was hat der Median mit der Häufigkeit zu tun?

Super427

Beitragsersteller

11.03.2022, 21:37

Ne also es ist einfach eine Liste von Merkmalen der Länge m die noch nicht sortiert ist.

Der Median ist der Wert der in der Mitte der ganzen Stichproben Liste ist , oder nicht ?

1 Antwort

Vom Beitragsersteller als hilfreich ausgezeichnet

Jangler13

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Mathematik

11.03.2022, 23:18

Also die Methode die einem sofort einfallen würde wäre vermutlich zuerst die Werte zu sortieren und danach von der sortierten Liste den mittleren Wert zu bestimmen.

Man muss aber ja nur den "mittleren Wert" suchen, weswegen die Reihenfolge der Werte davor und danach egal ist.

Meine Idee es Effizienter zu gestalten wäre, eine Algorithmus, der ähnlich wie Quicksort ist, zu benutzen, nur, dass der Algorithmus den Median Sucht.

Also:

Lege ein Index (zum Beispiel k=1) fest und prüfe dann bei jedem Wert, ob der über oder unter dem Wert mit dem Index (also x_k) liegt. Dabei erhälst du zwei Listen

Summiere dann von den beiden Listen jeweils die absolute Häufigkeit, und prüfe dann ob der Median gleich x_k ist (du musst dir hier jedoch selber überlegen wie genau du das prüfen musst)

Falls ja hast du den Median gefunden, falls nein, musst du die Liste wählen, wo der Median drin sein muss und diese wieder in zwei Listen aufspalten. (Und so weiter, du musst aber dafür noch die Absoluten Häufigkeiten der Werte die vor und nach der Liste sind zwischenspeichern)

Das funktioniert zumindest wenn die Summe der absoluten Häufigkeiten ungerade ist, da der Median dann einer der Werte der Liste ist. Wenn jedoch die Summe gerade ist, ist der Median gleich dem Mittelwert zweier Werte (die gleich sein könnten), du musst hier also dann noch ein paar Gedanken machen, wie du die Beiden werte bestimmst.

Die Laufzeit müsste hier auf jeden Fall besser sein, weil du eben nicht die ganze Liste sortierst, sondern werte einfach streichen kannst, da du bei denen weißt, dass sie garantiert nicht der Median sind

Halbrecht

11.03.2022, 23:51

ob ich die Frage richtig verstanden habe ?

Wird hier behauptet , man könne den M bestimmen , ohne die ganze Stichprobe zu kennen ?

Lege ein Index (zum Beispiel k=1) fest ................ich nehme irgendeinen Wert und habe dann schlimmstenfalls in der eine Liste keine und in der anderen Liste alle ?

Beispiel

1 1 2 3 4 5 ( noch unsortiert )

ich wähle 1

Jangler13

11.03.2022, 23:58

@Halbrecht

Wird hier behauptet , man könne den M bestimmen , ohne die ganze Stichprobe zu kennen ?

Man kennt hier die ganze Stichprobe, es ist gegeben welche Werte wie oft vorkommen.

Lege ein Index (zum Beispiel k=1) fest ................ich nehme irgendeinen Wert und habe dann schlimmstenfalls in der eine Liste keine und in der anderen Liste alle ?

Ja das kann passieren. Das ist der worst case.

Halbrecht

12.03.2022, 00:07

@Jangler13

und sortieren ist nicht so schnell? Vor allem weil hier doch die Häufigkeiten vorliegen ?

Jangler13

12.03.2022, 00:21

@Halbrecht

Nein, weil sortieralgorymen O(n*log(n)) als erwartete laufzeit haben.

Quickselect ( so lautet der Algorithmus, ist aber etwas angepasst) hat die Laufzeit O(n)

Ähnliche Beiträge

Arithmetisches mittel oder median?

Aufg.)

Die Attraktivität der Vorlesung „Mathematik für Studierende der Biologie" wurde von 125 Studierenden subjektiv mit sieben vorgegebenen Rangwerten, nämlich -3 („ich ken- ne nichts Schlimmeres"), -2 (,,gefällt mir gar nicht"), -1 (,,gefällt mir nicht"), 0 („ha- be keine Meinung dazu"), +1 (,,gefällt mir"), +2 (,,gefällt mir sehr gut"), +3 (,,es gibt nichts Schöneres") beurteilt. Dabei wählten fünf Studierende die Beurteilung „ich kenne nichts Schlimmeres", 20 die Beurteilung gefällt mir gar nicht" und 40 die Beurteilung „gefällt mir nicht" aus. 20 Studierende hatten keine Meinung, während 30 das Urteil „gefällt mir gut" und zehn die Beurteilung „gefällt mir sehr gut" wählten. Die Beurtei- lung „ich kenne nichts Schöneres" wurde von keinem Studierenden ausgewählt.

Was kann man somit über die Attraktivität der Vorlesung aussagen? Diskutieren Sie, welcher Mittelwertsbegriff in einem solchen Fall sinnvoller ist. Das arithmetische Mittel oder der Median?

Lösung 1.2

Der Median der Messreihe ist durch x=-1gegeben. Das arithmetische Mittel der Messreihe hingegen hat den Wert XM=-0.36. Der Median berücksichtigt stark die Häufigkeiten der einzelnen Merkmalsausprägungen. Einzelne (möglicher Weise) extre- me „Ausreißer" spielen somit keine so große Rolle. Dies ist beim arithmetischen Mittel anders. Hier gehen alle Werte gleich gewichtet ein und können somit das Endergebnis deutlich beeinflussen. Des Weiteren ist bei ordinalen Merkmalen ein „Verrechnen der Merkmalsausprägungen" nicht möglich. Zwei Hörer, die von der Vorlesung begeistert sind, können nicht einen anderen Hörer, der die Vorlesung entsetzlich findet, aufwiegen. Daher ist das arithmetische Mittel bei besonders großen einzelnen Abweichungen und bei ordinalen Merkmalen nicht als Mittelwert geeignet. Die Attraktivität der Vorlesung wird in diesem konkreten Beispiel somit mit -1 bewertet.

->ich verstehe die Lösung nicht ganz, da ich 100% sicher war dass der Durchschnitt eine sinnvollere Aussage treffen würde als ein Zentralwert. Könnt ihr mir weiterhelfen

...zum Beitrag

Mathematik -> Statistik-> Aufgabe -> Median bestimmen?

Hallo, bei der folgenden Aufgabe gibt es die Teilaufgabe b), bei der ich den Median berechnen soll. Ich habe 2,5 herausbekommen, aber in der Musterlösung steht 2.

Wie kann das sein ?

...zum Beitrag

Was bedeutet Maximum und minimum Weil ich morgen eine Mathearbeit schreibe und median?

...zum Beitrag

Ergänzen, so das Median 200 ist?

Hey! Ich bin etwas sehr überfordert. Morgen schreiben wir eine Mathe ex und in der Hausaufgabe müssen wir den Median zu 200 bringen. Jedoch müssen die Zahlen doch sortiert bleiben denke ich. Der Median wird ja berechnet indem man die Mitte raussucht und wenn ich ja eine Zahl ergänze rückt die 190 vor, oder es kommt eine kleinere Zahl hervor, danke im voraus, vielleicht hsbe ich mich ja ihrgendwo vertan<3

...zum Beitrag

Median Vermögen?

Was ist das median Vermögen? Bitte einfach erklärt

Und was ist der Unterschied zw Median vermögen und Durschschnittsvermögen ?

...zum Beitrag

Nach welchen Kriterien gehört jemand für euch zur Oberschicht/Oberklasse?

Es geht die Untersuchung in einer Bachelorarbeit.

Gehalt:

Monatliches Gehalt < 70% Median (-1 Punkte)
Monatliches Gehalt 70%-200% Median (0 Punkt)
Monatliches Gehalt>200% Median (+1 Punkte)

Vermögen

fast kein Vermögen/Schulden (-1 Punkte)
Vermögen 20% Median-300% Median (0 Punkt)
Vermögen>300% Median (+1 Punkte)

Schulabschluss

kein Schulabschluss (-1 Punkte)
Hauptschul-/Realschulabschluss (0 Punkt)
Fachabitur/Abitur (+1 Punkte)

Berufliche Bildung

Ausbildung (-1 Punkte
Techniker/Betriebswirt/Bachelor/Dipl. FH (0 Punkt)
Dipl./Master/Dr. (+1 Punkte)

Prestige des Berufs

niedrig (z.B. Prostituierte, Hilfsarbeiter, Reinigungskräfte) (-1 Punkte)
mittel (z.B. Pfleger, Polizist) (0 Punkt)
hoch (z.B. Arzt, Lehrer, Professor) (+1 Punkte)

...zum Beitrag

Modus Median Mittel Diagramm Erklärung?

Kann mir einer diesen Diagramm erklären ?

Sigma bedeutet Wohl die Genauigkeit dieser Werte zbm wenn man die Größen aller Schüler mit den geometrischen Mittel arithmetischen Mittel und den Median ermittelt.

Welche Methode ist genauer ?

warum ist diese Methode die Genau ?

...zum Beitrag

Wie kann die EU den internationalen Klimaschutzforderungen gerecht werden und gleichzeitig ihre wirtschaftliche Wettbewerbsfähigkeit bewahren?

Die Klimakrise ist eines der drängendsten globalen Probleme der heutigen Zeit, und immer mehr Länder und internationale Organisationen drängen auf eine starke Reaktion der EU, um ihren Teil zur Minderung von CO2-Emissionen und anderen Umweltbelastungen beizutragen. Auf der anderen Seite steht jedoch auch die wirtschaftliche Situation, insbesondere in Europa, wo energieintensive Industrien und hohe Produktionskosten in einigen Sektoren eine Herausforderung darstellen. Gleichzeitig gibt es in den EU-Mitgliedstaaten unterschiedliche Auffassungen darüber, wie weitgehende Klimaschutzmaßnahmen tatsächlich gehen sollten, ohne die Wirtschaft zu stark zu belasten oder den sozialen Frieden zu gefährden.

Der internationale Druck: Es gibt zunehmende internationale Verpflichtungen und Übereinkommen, wie das Pariser Klimaabkommen, die eine ambitionierte Reduktion von Treibhausgasemissionen fordern. Die EU wird dabei oft als Vorreiterin in Sachen Klimaschutz betrachtet, aber der Druck aus anderen globalen Akteuren, insbesondere China, den USA und Indien, könnte dazu führen, dass die EU Maßnahmen in einem internationalen Kontext setzen muss. Gleichzeitig sind viele dieser Länder noch in der Entwicklungsphase und setzen andere Prioritäten, was den Klimaschutz betrifft.

Ökologische Ziele: Der grüne Wandel ist in der EU bereits weitgehend politisch verankert. Das Ziel, bis 2050 klimaneutral zu werden, steht im Mittelpunkt der europäischen Klimapolitik. Doch der Weg dorthin ist mit großen Herausforderungen verbunden: Welche Technologien sind tatsächlich bereit für den massenhaften Einsatz? Wie lässt sich die Energieproduktion nachhaltig gestalten, ohne dass der Übergang zu erneuerbaren Energien die Versorgungssicherheit gefährdet?

Wirtschaftliche Herausforderungen: Viele Industrien in der EU sind stark von fossilen Brennstoffen abhängig. Besonders in Ländern wie Polen oder Deutschland, die traditionell auf Kohle und andere fossile Brennstoffe gesetzt haben, stehen politische Entscheidungsträger vor der schwierigen Aufgabe, den Strukturwandel zu gestalten, ohne massive Arbeitslosigkeit oder soziale Unruhen zu riskieren. Investitionen in grüne Technologien und Innovationen sind notwendig, aber auch kostspielig. Es stellt sich die Frage, wie viel der europäische Bürger bereit ist zu zahlen, um die Klimaziele zu erreichen, und welche Branchen möglicherweise durch den Wandel in ihrer Existenz bedroht sind.

Soziale Gerechtigkeit und Kohärenz innerhalb der EU: In der EU gibt es unterschiedliche Auffassungen und wirtschaftliche Bedingungen in den verschiedenen Mitgliedsstaaten. Während die nord- und westeuropäischen Länder relativ gut auf den grünen Wandel vorbereitet sind, kämpfen süd- und osteuropäische Länder häufig mit einer höheren Abhängigkeit von fossilen Energieträgern und einer schwächeren wirtschaftlichen Basis. Wie lässt sich Klimaschutz mit sozialer Gerechtigkeit in Einklang bringen? Welche Maßnahmen können ergriffen werden, um den sozial schwächeren Regionen und den von Strukturwandel bedrohten Bevölkerungsgruppen zu helfen?

Der Weg zu einer Kreislaufwirtschaft: Ein weiterer wichtiger Aspekt ist die Förderung einer Kreislaufwirtschaft, in der Ressourcen effizienter genutzt und Abfallprodukte wiederverwertet werden. Doch auch dieser Wandel erfordert enorme Investitionen und strukturelle Anpassungen. Welche Instrumente und Anreize benötigt die EU, um Unternehmen zur Transformation in eine Kreislaufwirtschaft zu bewegen, und welche Herausforderungen bestehen dabei auf politischer Ebene?

Welche Strategien sind aus deiner Sicht am erfolgversprechendsten?

...zum Beitrag

siehe Bild; Wie berechnet man den Median?

...zum Beitrag

was ist ein quartil?

ich soll in mathe aus den datenmengen minimum,maximum, median, oberes und unteres quartil berechnen. was ist ein quartil ? hat das was mit quartal zutun ? und der median ist der durchschnitt richtig?

...zum Beitrag

Was ist der Unterschied zwischen Median und Mittelwert?

Wir haben das halt als neues Thema und er hat uns das online "erklärt", aber ich verstehe den Unterschied zwischen Median und Mittelwert nicht.

Ps: Eine Freundin von mir hat ihn gefragt, aber es kann etwas dauern, bis er antwortet. :/

...zum Beitrag

Java: Text einlesen und Häufigkeit der Buchstaben analysieren?

Hey! Ich möchte einen Text einlesen und die Häufigkeit der Buchstaben analysieren. Dazu habe ich folgenden Code geschrieben. Leider ist dort irgendwo ein Logikfehler versteckt, den ich aber nicht finde :( Das Programm tut nicht, was es soll. Es wird für alle Buchstaben die Anzahl 0 ausgegeben, was ja nicht sein kann. Ich wäre sehr dankbar, wenn jemand meinen Denkfehler findet. Dankeschön! P.S: hab erst vor 2 Wochen mit Programmieren angefangen, also verurteilt meinen Code nicht gleich ^^

import java.io.*;

public class Buchstabenstatistik { public static void main(String[] args) throws IOException{

    // Es werden 180 000 Buchstaben des Textes "time" eingelesen und in einem char Array 'buchstaben' gespeichert
    FileReader reader = new FileReader("d:\\time.txt");
    int n1 = 180000;
    char[] buchstaben = new char[n1];
    reader.read(buchstaben);
    reader.close();
    
    // Alle Buchstaben des englischen Alphabets werden in einem char Array 'alphabet' gespeichert
    char[] alphabet = {'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x', 'y', 'z'};
    
    // Es wird ein neues int Array 'counter'angelegt, mit dem später gezählt werden soll, wie oft ein 
    // einzelner Buchstabe im Text vorgekommen ist
    int a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z;
    a = b = c = d = e = f = g = h = i = j = k = l = m = n = o = p = q = r = s = t = u = v = w = x = y = z = 0;
    // Anfangs wird jedem Element des counters der Wert 0 zugewiesen, da ja noch keine Buchstaben gezählt wurden
    int[] counter = {a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z};
    for (int i1 = 0; i1 < counter.length; i1 ++){
        counter[i1] = 0;    
    }
    
    // Jeder Buchstabe im Text (gespeichert im char Array 'buchstaben') wird mit jedem Buchstaben des englischen Alphabets
    // verglichen. Wenn sie übereinstimmen, wird der Array 'counter' an der jeweiligen Stelle im Array, der für einen
    // bestimmten Buchstaben steht, um 1 erhöht
    for (int k1 = 0; k < buchstaben.length; k++) {
        for (int k2 = 0; k2 < alphabet.length; k2 ++) {
            if (buchstaben[k1] == alphabet[k2]) {
                counter[k2] = counter[k2] + 1;
            }
        }   
    }
    // Die Anzahl jedes Buchstaben, der im Text vorgekommen ist, wird ausgegeben
    System.out.println("Anzahl der Buchstaben: ");
    for (int k3 = 0; k3 < counter.length; k3 ++) {
        System.out.println(alphabet[k3] + " : " + counter[k3]);
    }
    //Die prozentuale Häufigkeit der Buchstaben soll berechnet und ausgegeben werden
    // (Anzahl des Buchstaben im Text / Anzahl aller Buchstaben im Text) * 100% 
    System.out.println();
    System.out.println("Häufigkeit der Buchstaben in Prozent: ");
    double h1 = 0;
    for (int k4 = 0; k4 < counter.length; k4 ++) {
        h1  = (counter[k4] / n1) * 100;
        System.out.println(alphabet[k4] + " : " + h1 + " % ");
    }

}

}

...zum Beitrag

Wie berechnet man diese Wahrscheinlichkeiten?

Ein im Jahr 07 zugelassener Pkw wird zufällig ausgewählt. () Geben Sie die Wahrscheinlichkeit der folgenden Ereignisse an: A: Der Pkw ist ein Elektroauto. B: Der Pkw wurde privat zugelassen und ist kein Elektroauto. (3) Bestimmen Sie die Wahrscheinlichkeit dafür, dass der Pkw ein Elektroauto ist, wenn er gewerblich zugelassen wurde. (6 + 3 + 3 Punkte) Im Folgenden werden die Verkaufszahlen eines großen Autohauses betrachtet, das sich auf den Verkauf von Elektrofahrzeugen spezialisiert hat. Im Vergleich zum Bundesdurchschnitt verkauft dieses Autohaus überdurchschnittlich viele Elektroautos. So ergab die Analyse der Vorjahresverkaufszahlen, dass 7,5 % der verkauften Autos Elektroautos waren. Diese empirisch ermittelte relative Häufigkeit soll im Folgenden als Wahrscheinlichkeit dafür angesehen werden, dass ein verkauftes Auto ein Elektroauto ist. Die Anzahl verkaufter Elektroautos wird im Folgenden als binomialverteilt angenommen. b) () Das Autohaus stellt eine Prognose für die nächsten 000 Autoverkäufe auf. Bestimmen Sie die Wahrscheinlichkeit folgender Ereignisse: E : Es werden genau 80 Elektroautos verkauft. E : Es werden mindestens 70, aber höchstens 80 Elektroautos verkauft. E 3 : Die Anzahl der verkauften Elektroautos entspricht genau dem Erwartungswert. () Ermitteln Sie, wie viele Autos mindestens verkauft werden müssen, damit darunter mit einer Wahrscheinlichkeit von mindestens 90 % mindestens ein Elektroauto ist.

...zum Beitrag

Werden beim median auch doppelte zahlen gezählt?

...zum Beitrag

Was möchtest Du wissen?

Deine Frage stellen