Python Pandas: Groupby und dabei Koordinaten behalten?

Hallo,

ich hänge gerade an einer Python Pandas Aufgabe und habe mich gefragt ob mir jemand weiterhelfen kann. Ich habe folgenden Code und bekomme folgende Ausgabe.

key_columns = ['fclass', 'long', 'lat', 'Anzahl']
df=df[key_columns]

df = df.groupby('fclass', as_index=False).count()[["fclass", "Anzahl"]].sort_values(by="Anzahl",ascending=False)
df.head()

Bild zum Beitrag

Er zählt die Anzal der Bushaltestellen und das ist schonmal gut. Leider schmeißt er aber die "long" und "Lat" Koordinaten raus. Ich habe dann folgendes versucht:

key_columns = ['fclass', 'long', 'lat', 'Anzahl']
df=df[key_columns]

df ["Anzahl"] = df.groupby('fclass', as_index=False).count()[["fclass", "Anzahl"]].sort_values(by="Anzahl",ascending=False)
df.head()

Bild zum Beitrag

Jetzt zählt er aber nicht mehr die Anzahl der Bushaltestellen, sondern überträgt die Werte der Spalte fclass in meine Anzahl Spalte auf merkwürdige Art und Weise.

Wie bekomme ich es hin, dass er mir die Anzahl der Bushaltestellen etc. angibt und ich dennoch die Koordinaten im Dataframe habe.

Kann mir da jemand helfen?

Gruß

1 Antwort

Vom Fragesteller als hilfreich ausgezeichnet

stdiff

28.12.2020, 00:43

Wenn du die Spalte "Anzahl" durch die Zahlen der ersten Tabelle ersetzen möchtest, musst du einfach die originelle Tabelle (df) und die erste Tabelle mergen:

df.drop("Anzahl", axis=1).merge(df_count_fclass, on="fclass")

Dann die Anzahl der Tabelle (df) verändert sich nicht, und die Spalte "Anzahl" zeigt die Anzahl der entsprechenden "fclass" in der originellen Tabelle.

Der Grund für die komischen Werte in der Spalte "Anzahl" ist, dass du eine Spalte (df["Anzahl"]) ein DataFrame zuordnest. Das Ergebnis der folgenden Zeile ist nämlich keine Series, sondern ein DataFrame mit zwei Spalten.

df.groupby('fclass', as_index=False).count()[["fclass", "Anzahl"]].sort_values(by="Anzahl",ascending=False)

Woher ich das weiß:Berufserfahrung

redsky

Fragesteller

29.12.2020, 18:53

ja ok ich vestehe. Ich muss mich glaube ich noch ein bisschen an Pandas gewöhnen :).

Danke für deine Hilfe! Mit dem mergen hat es wunderbar funktioniert.

Hallo,

Ich habe zwei Dataframes, zum einen eine "Allgemeine Übersicht" (Tel.Nummer + Kostenstelle) zum anderen eine monatliche Rechnung (Tel.Nummer + Eurobetrag)

Kurzgesagt möchte ich kontrollieren ob eine Tel.Nummer welche in der Rechnung auftaucht, in der "Allgemeinen Übersicht" vorhanden ist und sollte dies der Fall sein, dass die jeweilige Kostenstelle im DF der Rechnung ergänzt wird.

Ich habe leider keine Ahnung wie ich das umsetzen kann, daher auch noch keinen Code.

Als Hilfestellung habe ich mein Problem vereinfach in Excel visualisiert.

...zur Frage

Python wörter zählen aus importierten Text?

Hey, wie zähle ich in Python in einem Text die vorhandenen wörter?

Die Datei beispiel.txt besteht aus einem großen englischen Text, allerdings zählt der mit diesem Code nicht die wörter.. wo liegt genau der Fehler?

Bin noch anfänger, also verstehe noch keine komplizierten Codes :P

with open('beispiel.txt', 'r') as file:
    for line in file:
        woerter= line.split()
        
count = 0
for wort in woerter:
    if wort == 'a':
        wort = wort.lower()
        count += 1
        
    
print("Anzahl des Wortes 'a' sind", count)

...zur Frage

Pygame hängt sich bei while True: loop auf?

Hallo,

ich programmiere gerade ein Spiel in Pygame. Auf jeden Fall möchte ich den Ninja Wurfsternen (&anderen Waffen)Ammo geben, dass man eine bestimmte Anzahl von diesen hat und diese nicht spammen kann. Wenn man Space drückt, wird der Ammo Variable eins abgezogen und wenn der Ammo (heißt es der Ammo? ) höher als 0 ist, wird der Befehl self.shoot() ausgeführt. Jetzt mein Problem: Egal, welche Nummer die Variable hat (außer Null), kann ich einmal schießen und danach nicht mehr, auch wenn ich Space drücke. Ich weiß nur nicht wieso. Wenn ich es in einen while True, loop packe, hängt sich pygame auf. Nur wie kann ich das fixen, dass ich öfter als 1 Mal schießen kann. Hier mein benötigter Code (ohne den While True loop):

class Player(pg.sprite.Sprite):

def __init__(self, game, x, y):

self.weapon = 'blowpipe'

self.shurikan = False

self.blowpipe = False

self.xp = PLAYER_XP

self.shoot_ammo = True

self.BLOWPIPE_AMMO = 5

self.SHURIKAN_AMMO = 5

def get_keys(self):

keys = pg.key.get_pressed()

if keys[pg.K_SPACE]:

if self.weapon == 'blowpipe' and self.shoot_ammo == True:

self.BLOWPIPE_AMMO -= 1

if self.BLOWPIPE_AMMO < 0:

self.BLOWPIPE_AMMO = 0

if self.BLOWPIPE_AMMO == 0:

self.shoot_ammo = False

if self.BLOWPIPE_AMMO > 0:

self.shoot()

if self.weapon == 'shurikan' and self.shoot_ammo == True:

self.SHURIKAN_AMMO -= 1

if self.SHURIKAN_AMMO < 0:

self.SHURIKAN_AMMO = 0

if self.SHURIKAN_AMMO == 0:

self.shoot_ammo = False

if self.SHURIKAN_AMMO > 0:

self.shoot()

def shoot(self):

if self.shoot_ammo == True:

now = pg.time.get_ticks()

if now - self.last_shot > WEAPONS[self.weapon]['rate']:

self.last_shot = now

dir = vec(1, 0).rotate(-self.rot)

EinegleicheListegibtesfürBlowpipe.

pos = self.pos + BARREL_OFFSET.rotate(-self.rot)

self.vel = vec(-WEAPONS[self.weapon]['rate'], 0).rotate(-self.rot)

for i in range(WEAPONS[self.weapon]['count']):

spread = uniform(-WEAPONS[self.weapon]['spread'], WEAPONS[self.weapon]['spread'])

Blowpipe(self.game, pos, dir.rotate(spread))

Außerdem gibt es eine Weapons Liste in einem anderen File:

WEAPONS['blowpipe'] = {'img': 'blowpipe.png',

'speed': 500,

'lifetime': 600,

'rate': 300,

'kickback': 0,

'spread': 5,

'damage': 3,

'size': 'blowpipe',

'count': 1}

Eine ähnliche Liste benutze ich für den Shurikan. Thx

...zur Frage

Für Schleifenpython?

# Python-Programm zum Zählen der Anzahl gerader Ganzzahlen in der Liste.
 
# Liste von ganzen Zahlen
ganze Zahlen = [8, 3, 7, 4, 6, 21, 9]
# Variable zum Speichern der Zählung
Zählung = 0
# über die Liste iterieren
für val in ganzen Zahlen:
    wenn Wert % 2 == 0:
        zählen += 1
print("Die Anzahl der geraden Zahlen ist", count)

...zur Frage

Intellij kennt LiteralText nicht?

Hallo, Ich schreibe eine Fabric 1.20.1 Mod die mir die Anzahl der Totems der anderen Spieler auf einem Server über deren Köpfen als Hologramm anzeigen soll, und da wollte ich noch eine Funktion einbauen, die dem Spieler sagt, dass er so und so viele Totems hat, dafür habe ich diesen Code verwendet:

player.sendMessage(new LiteralText("You have " + count + "Totems"), false);

in diesem wird "LiteralText" allerdings ROT unterstrichen - und es findet auch den Import nicht - (Ich habe es imported aber es gibt es nicht), was kann ich stattdessen verwenden?

...zur Frage

MySQL: Spalten nach Anzahl der Zellen mit Wert=1 sortieren?

Ich habe eine Tabelle in der die Spalten entweder 0 oder 1 als Wert haben. Jetzt möchte ich gerne die Spalte in der am häufigsten, zweisfäufigsten usw. 1 als Wert vorkommt herausfinden.

Bsp:

Spalte 1 hat die Werte 1,0,0,1,1,0
Spalte 2 hat die Werte 1,1,1,0,1,0
Spalte 3 hat die Werte 0,1,1,0,0,0

Als Ergebnis soll irgendwie herauskommen das Spalte 2 am meisten hat, Spalte 1 am zweitmeisen usw.

Das Problem ist, das ich die Namen der Spalten nicht kenne. Sonst könnte man ja jede Einzelne Spalte mit count(`Spalte`) WHERE `Spalte`=1 auslesen und diese Werte dann vergleichen.

Wahrscheinlich geht es auch gar nicht. Aber ich dachte ich frage mal.

MfG,

Bohne47

...zur Frage

IF Funktion in excel auf mehrere Zellen anwenden?

Hallo,

Ich möchte wenn in einer Zelle etwas reingeschrieben wird das die darauffolgenden Felder zu Pflichtfelder werden. Dazu nutze ich aktuell folgende Formel.

Private Sub Workbook_BeforePrint(Cancel As Boolean)

Dim zeile As Long, OK As Boolean

OK = True

For zeile = 1 To Tabelle1.Cells.SpecialCells(xlCellTypeLastCell).Row

If Worksheets("Tabelle1").Cells(4, 2).Value <> "" Then

If Worksheets("Tabelle1").Cells(4, 3).Value = "" Then OK = False 'Spalte C

If Worksheets("Tabelle1").Cells(4, 4).Value = "" Then OK = False 'Spalte D

If Worksheets("Tabelle1").Cells(4, 5).Value = "" Then OK = False 'Spalte E

If Worksheets("Tabelle1").Cells(4, 6).Value = "" Then OK = False 'Spalte F

If Worksheets("Tabelle1").Cells(4, 8).Value = "" Then OK = False 'Spalte H

If Worksheets("Tabelle1").Cells(4, 9).Value = "" Then OK = False 'Spalte I

End If

If Not OK Then

MsgBox "Drucken nicht möglich - nicht alle Pflichtfelder ausgefüllt"

Cancel = True

End If

End Sub

Nun möchte ich das die obige Formel von B4- B25 durchgeführt wird. Also das wenn in in B8 z.B. etwas reingeschrieben wird das dann die Zellen in B8 geprüft werden das dort in den anderen Feldern auch was reingeschrieben worden ist.
Wie würde ich das ganze hinbekommen?

Danke im Voraus

...zur Frage

Längen und Breitengrad (Koordinaten) für deutsche Städte - OSM

Hallo, hat jemand eine Ahnung wo man eine Liste mit den Koordinaten aller deutschen oder auch europäischen Städte herbekommen kann? Die Werte bräuchten einfach einen Punkt im Stadtzentrum zu beschreiben (z.B. vor dem Brandenburger Tor in Berlin oder am Hauptbahnhof in Frankfurt). Also z.B. Berlin - lat="52.517" long="13.38". Habe auch schon bei Open Street Maps geschaut, aber es werden imme nur Tools verlinkt, mit denen man seinen Standort als Koordinate darstellen kann. Ich brauche aber einfach eine Liste mit den 3 zuvor genannten Daten. Am besten als csv. oder excel-datei. Im Voraus Vielen Dank.

...zur Frage

Python Primzahlen von 1 - 100.000 zählen?

Hey Leute, Ich bin grade dabei die Anfänge von Python zu lernen, und habe jetzt alle Primzahlen von 1 bis 100.000 ausrechnen lassen. Jetzt möchte ich mir die anzahl der Ergebnisse anzeigen lassen. Ich habe mir die Primzahlen so ausrechnen lassen:

endrange=100000

print("Primzahlen von 1 bis {0:d}: ").format(endrange)

for i in range(2,endrange): teilbar = False for j in range(2,i): if i % j == 0: teilbar = True if teilbar == False: print(i)

Also was muss ich da noch dazuschreiben, dass ich die anzahl der Primzahlen von 1 - 100.000 dazubekomme?

MFG

...zur Frage

Typkonvertierung eines Zeitstempels in Python?

Hallo an alle Python-Programmierer.

Ich habe versucht mit einem Python-Programm automatisch die Zeitstempel aus einer .tdms Datei (LabView-Datei) auszulesen, zu konvertieren & als eine .xlsx Datei (Excel-Datei) wieder abzuspeichern.

Allerdings ist die Uhrzeit im Zeitstempel der konvertierten Excel-Datei komischerweise immer genau 2 Stunden früher als in der tdms-Datei.

Hier folgend sieht man einen kurzen Auszug eines .tdms Messschriebs vom Kanal „SM States“. Geöffnet mit einem EXCEL-tdms Plugin. Somit kann man quasi mit Excel die .tdms Dateien öffnen:

Hier wird die erste Uhrzeit mit 04:21:06,391 PM bzw. 16:21:06,391 im 24h Format angegeben.

Wenn ich nun mit den folgenden Codezeilen im 12h Format versuche die "Timestamp" Daten in eine .xlsx Datei zu schrieben, kommt dabei das Problem mit den 2 Stunden Zeitversatz heraus:

# Daten in Excel-Datei schreiben

with pd.ExcelWriter(xlsx_output_path) as writer:

for df_list, sheet_name in zip([sm_states_data_frames],

['SM States']):

for i, df in enumerate(df_list):

if 'Timestamp' in df.columns:

df['Timestamp'] = df['Timestamp'].apply(lambda x: x.strftime('%d.%m.%Y %I:%M:%S,%f %p'))

df.to_excel(writer, sheet_name=sheet_name, index=False)

Hier zum besseren Verständnis ein Bild vom Code:

Hier sieht man nun das Ergebnis der Excel-Datei. Das Format an sich ist wie im obrigen Bild der .tdms Datei. Allerdings werden hier Microsekunden statt Millisekunden angezeigt, was aber denke ich erst mal nicht das Problem sein sollte.

Jedoch sieht man, dass nun 02:21:06 Uhr PM angezeigt wird, statt 04:21:06 Uhr PM der Quell-tdms-Datei. Das gleiche Problem habe ich übrigens auch wenn ich versuche den Zeitstempel in ein 24h Format umzuwandeln.

Hier noch ein Bild vom Dateiformat des "Timestamp" Reiters der Quell-tdms-Datei:

Ich wäre sehr dankbar, wenn mir hier jemand weiter helfen könnte!

Viele Grüße!

Jonas

...zur Frage

Python 3: Ich habe Fragen zur Implementation des Huffman-Code. Könnt ihr mir helfen?

Hallo Leute,

ich hoffe, dass ich hiermit nicht den Shitstorm of Doom heraufbeschwöre, aber ich komme seit fünf Tagen partout nicht weiter.

1) (2 Punkte) Gegeben sei folgende Nachricht: ”Mississippi River in Ontario isn’t Mississippi River in Mississippi!”

Zeichne den zugehörigen Huffman-Baum und stelle die Codetabelle auf, wie sie es in der Vorlesung gelernt haben. Geben Sie alle erforderlichen Werte an! Wie lautet die oben angegebene Nachricht in ihrer codierten Form?

2) (2 Punkte) Schreibe ein Python 3.7.x Programm, welches die in der Aufgabe 11.1 aufgestellte Codetabelle beinhaltet. Das Programm soll Befehle encode und decode verstehen und die darauffolgende Eingabe codieren oder decodieren können. Falsche Eingaben sind mit einer Warnung in der Konsole zu quittieren. Geben jeweils 5 Testfälle für Codierung und Decodierung an. Zusätzlich gebe an, wie Deine Implementierung die Nachricht

3) (4 Punkte) Schreibe ein in Python 3.7.x Programm, welches eine Eingabe (Nachricht) über die Konsole entgegennimmt, sie analysiert und basierend darauf eine Codetabelle aufbaut.

Gebe diese Codetabelle in der Konsole aus.
Gebe die codierte Eingabe in der Konsole aus.
Implementiere eine Funktion zur Decodierung und gebe die decodierte Nachricht zur Verifikation in der Konsole aus.

Setze die Befehle newbase und showtable um. Ermögliche damit eine neue Eingabe und lasse für diese eine neue Codetabelle berechnen und gegebenenfalls ausgeben. Setze weiterhin Befehle encode und decode um, wie Du es in der Aufgabe 11.2 gemacht hast.

Hinweise:

Zur Lösung dieser Aufgabe dürfen built-in Sortiermethoden verwendet werden. Denke daran, dass nicht alle Datentypen geordnet sind. Dennoch können hier auch solche Datentypen sehr hilfreich sein.

Nicht lauffähige Programme werden nicht bewertet, dabei gilt als Maßstab NUR die Ausführbarkeit in der Konsole!

Aufgabe 1 hab ich noch lösen können,

Ich weiß, im Netz gibt es gefühlt 3000 Huffman Code-Tutorials, aber die sind alle auf fortgeschrittenen Niveau und erklären auch nicht, wie ich diese Code-Tabelle implementieren soll. Zur Erklärung:

Spalte 1: Die relative Häufigkeit, wie oft ein Zeichen allgemein im String vorkommt.
Spalte 2: Der Logarithmus dualis:

Spalte 3: Blockcode der Reihe nach aufgeschrieben
Spalte 4: Der Huffman Code (auf den 0 und 1 in der Grafik basierend)
Spalte 5: Gewichtete Codelänge (Anzahl der Bits im Huffman-Code * Relative Häufigkeit)

Wie kann ich das in Python berechnen lassen und zusätzlich noch in so einer Tabellenform ausgeben? Dazu müsste man doch alle Werte von diesem Baum manuell eintragen, oder nicht?

Kann ich bei Aufgabe 2) nicht einfach die Variablen neu definieren, z.B. "M == 000" oder ist das geschummelt?

...zur Frage

Nodejs mariadb Column count doesn't match value count at row 1?

meine datenbank hat 4 spalten aber ich setze nur 3 ein weil die letzte eine auto_increment spalte ist,

ich nutze nodejs mit mariadb und habe folgende fehlermeldung beim daten einsetzen:

/home/j44/Downloads/themer/tut/node_modules/mariadb/lib/misc/errors.js:64
  return new SqlError(msg, sql, fatal, info, sqlState, errno, additionalStack, addHeader);
         ^

SqlError: (conn=2420, no: 1136, SQLState: 21S01) Column count doesn't match value count at row 1
sql: INSERT INTO thread value (no, head, ts) - parameters:['1171187570193989762','rrrrrrrrrrrrrrrr',1699303276347]
    at module.exports.createError (/home/j44/Downloads/themer/tut/node_modules/mariadb/lib/misc/errors.js:64:10)
    at PacketNodeEncoded.readError (/home/j44/Downloads/themer/tut/node_modules/mariadb/lib/io/packet.js:582:19)
    at Query.readResponsePacket (/home/j44/Downloads/themer/tut/node_modules/mariadb/lib/cmd/parser.js:58:28)
    at PacketInputStream.receivePacketBasic (/home/j44/Downloads/themer/tut/node_modules/mariadb/lib/io/packet-input-stream.js:85:9)
    at PacketInputStream.onData (/home/j44/Downloads/themer/tut/node_modules/mariadb/lib/io/packet-input-stream.js:135:20)
    at Socket.emit (node:events:514:28)
    at addChunk (node:internal/streams/readable:376:12)
    at readableAddChunk (node:internal/streams/readable:349:9)
    at Readable.push (node:internal/streams/readable:286:10)
    at TCP.onStreamRead (node:internal/stream_base_commons:190:23) {
  sqlMessage: "Column count doesn't match value count at row 1",
  sql: "INSERT INTO thread value (no, head, ts) - parameters:['1171187570193989762','rrrrrrrrrrrrrrrr',1699303276347]",
  fatal: false,
  errno: 1136,
  sqlState: '21S01',
  code: 'ER_WRONG_VALUE_COUNT_ON_ROW'
}

...zur Frage

Python Zeit und Tabelle?

Ich möchte in meinen Python-Code eine Zeit implementieren. Die Zeit soll mir sagen, wie lange das Programm für die Ausführung benötigt. Ich möchte, dass es sich wieder zurücksetzt, weiß aber nicht wie. Des weiteren möchte ich am Ende alle Ergebnisse einheitlich in einer Tabelle dargestellt haben. Ich habe bereits versucht, es mit "pandas" und "tabulate" zu lösen, hat aber leider nicht funktioniert. Wie löse ich das Problem?

Hier der Code (nicht sehr komplex):

import random
import time

zeitanfang = time.time()
zahlenliste=[]
t=1
z=1
a=100
time.sleep(0)
#Liste mit Zufallszahlen füllen
while t<3:
 Anzahl=int(input("Anzahl der sortierenden Zahlen:"))
  for i in range(Anzahl):
    zahlenliste.append(random.randint(0, a))
#unsortierte Liste ausgeben (array)
# print(zahlenliste)
#unsortierte Liste ausgeben (array)
# for i in range(len(zahlenliste)):
# print(zahlenliste[i])
  def bubblesort(liste):
    for i in range(len(liste)-1):
      if liste[i] > liste[i+1]:
        liste[i], liste[i+1] = liste[i+1], liste[i]
        zahlenliste.sort()
  zeitende=time.time()
  bubblesort(zahlenliste)
  print(z,zahlenliste, (zeitende-zeitanfang)*10000)
  print("Dauer des Programms:", (zeitende-zeitanfang)*10000, "ms")
  t=t+1
  z=z+1
  a=a+100
  print("")
  zahlenliste=[]

...zur Frage

SQL: Wie kann man Werte innerhalb einer Spalte miteinander vergleichen?

Bisher habe ich das: select count(id) as anzahl,id from freundschaft group by id;

Wie kann ich die Anzahlen der ID miteinander vergleichen, die ja alle in einer gemeinsamen Spalte liegen, und sobald sie denselben Wert haben, möchte ich die dazu gehörende ID-Nummer nebeneinander in 2 Spalten ausgeben lassen? :/

...zur Frage

Was möchtest Du wissen?

Deine Frage stellen