Python Wort was zwischen zwei anderen ist im String ausgeben?

Hallo,

ich habe einen String mit folgenden Inhalt:

Edelrost Garten Feuerschale Pflanzenschale Rost aus Metall mit Konus Blumen <div>

Hier möchte ich als Ausgabe "Edelrost Garten Feuerschale Pflanzenschale Rost aus Metall mit Konus Blumen " haben.

Allerdings ist es wichtig, dass ich den Text zwischen dem HTML Teil bekomme, da der HTML Teil immer gleich bleibt, sich der Text aber ändert.

Es kann z.B. auch jederzeit so aussehen:

Meine Freundin ließt gern Bücher <div>

In diesem Beispiel hätte ich gern mit dem gleichen Code "Meine Freundin ließt gern Bücher" raus.

Wie mache ich das?

Danke im Voraus!

LG
Niklas

PS: Wenn mein Ansatz falsch ist (ich mache es mit BeautifulSoup) gerne schreiben wie ich es richtig mache, da ich mit den soup.find commands nicht wirklich vertraut bin.

4 Antworten

Vom Beitragsersteller als hilfreich ausgezeichnet

MrAmazing2

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Computer, HTML, programmieren

14.09.2021, 21:45

BeautifulSoup erlaubt es dir, nur den Text auszulesen, ohne diese ganzen HTML-Tags aussenrum.

Dafür gibt es das Attribut text

Eventuell reicht es schon, bei deinem aktuellen Codestück (mit dem du obigen String bekommst) einfach ein .text anzuhängen.

Zum Beispiel

soup.find('div', {'class' :'abc'}).text

anstatt

soup.find('div', {'class' :'abc'})

Probier das mal, und wenn es nicht klappt, dann schick mir mal das Code-Stück.

Woher ich das weiß:Hobby – Programmieren ist mein Hobby & Beruf

DZNRandom

Beitragsersteller

14.09.2021, 22:34

Genau mit soup.find kenne ich mich ja nicht aus.. :( Hier mal der Link zum HTML Code (Ich möchte den Titel herausfiltern und ihn mir ausgeben lassen): eBay (ebaydesc.com)
Wenn der code nicht angezeigt wird einfach rechtsklick -> seitenquelltext anzeigen
Danke dir wirklich das hilft mir sehr!!! :)

PS: Mit titel meine ich in diesem Beispiel, dass mir "Edelrost Garten Feuerschale Pflanzenschale Rost aus Metall mit Konus Blumen

Handarbeit " ausgegeben wird. :)

MrAmazing2

14.09.2021, 22:35

@DZNRandom

Naja, den String in der Fragestellung hast du ja schon

ich habe einen String mit folgenden Inhalt:

 Edelrost Garten Feuerschale Pflanzenschale Rost aus Metall mit Konus Blumen <div>

Mithilfe welches Codes bekommst du den denn momentan?

MrAmazing2

14.09.2021, 22:43

@DZNRandom

Versuch mal das:

soup.select_one("#ds_div>font>font>span").text

DZNRandom

Beitragsersteller

16.09.2021, 09:08

@MrAmazing2

Danke, klappt! Wie genau kommst du darauf?

MrAmazing2

16.09.2021, 12:04

@DZNRandom

Da ist ein <div> mit ID „ds_div“, darin ist ein , darin ein weiterer , und darin dann der mit dem Text.

Also

#ds_div > font > font > span

Der Pfeil bedeutet soviel wie „direkter Nachfahre“. Der Hashtag bedeutet „Element mit der ID“.

Ist ein normaler CSS Selektor. Dafür wäre es natürlich nützlich, wenn man die CSS Basics kann. BeautifulSoups select und select_one erlaubt dir, normale CSS Selektoren zu benutzen, um Elemente auszuwählen. Find ich beiweitem einfacher als find.

Transistor3055

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Computer, Internet, Netzwerk

14.09.2021, 23:54

Das ist doch HTML, somit würde ich auch einen HTML-Parser benutzen.

Da scheint doch BeautifulSoup der richtige Parse zu sein.

Schau dir die Funktion an

soup.get_text()

Doku sagt: The get_text() function retrieves all the text from the HTML document.

Sie liefert nur die reinen Teste aus dem HTML Dokument/Fragment.
Hier wird sie erklärt:

https://stackabuse.com/guide-to-parsing-html-with-beautifulsoup-in-python/

Viel Erfolg!

Woher ich das weiß:Recherche

DZNRandom

Beitragsersteller

15.09.2021, 01:39

So habe ich ja die html ausgabe bekommen ;) steht auch da. Danke trotzdem! Möchte ja nur den teil rausbekommen. Da ist ja noch mehr text in der gesamten html

AynosX

15.09.2021, 15:07

Python hat eine eingebaute Funktion, die Präfixe und Suffixe entfernt.

Da du erwähnt hast, dass die Text-Teile um deinen eigentlichen Text immer gleich bleiben, daher solltest du diese Funktionen verwenden.

string = '<prefixBeispiel>text<suffixBeispiel>'
output = string.removeprefix("<prefixBeispiel>").removesuffix("<suffixBeispiel>")

Das "<prefixBeispiel>" und "<suffixBeispiel>" musst du natürlich deinen Wünschen entsprechend verändern.

Woher ich das weiß:Hobby

stdio

14.09.2021, 21:35

Du könntest RegEx nehmen, oder einfach split:

text = html.split(';">')[1].split('<')[0];

Danach steht dein gewünschter Text in der Variablen "text".

Gut, reguläre Ausdrücke mögen eleganter sein, brauchen aber einen zusätzlichen Import und sind auch nicht kürzer, eher im Gegenteil. :)

Woher ich das weiß:Berufserfahrung

DZNRandom

Beitragsersteller

14.09.2021, 22:32

text1223 = textv0.split(';">')[1].split('<')[0];

print(text1223)

Gibt leider kein output :(

Ähnliche Beiträge

Ölfilm auf Wasser in Regentonne - was tun?

Hallo Ihr,

auf dem Wasser der Regentonne meiner Großmutter befindet sich ein dünner Ölfilm, da eine veröltes Stück Metall (mit Altöl) reingefallen ist.

Die Regentonne ist ja für das Gießen der Blumen. Und da sich auch ein Birnenbaum im Garten befindet, sollte man das Wasser wohl nicht im Garten verteilen, oder?

Wie Schädlich ist Erdöl bzw. Altöl von Maschinen in kleinen Mengen für Pflanzen? Kriegt man die Ölschicht sonst irgendwie unkompliziert aufgefangen?

...zum Beitrag

Wie brüniere ich am einfachsten eine Feuerschale?

Habe eine Feuerschale aus (noch) blanken Metall geschenkt bekommen. Wie schütze ich das gute Stück am besten vor Rost?

...zum Beitrag

Excel: Vetretungsplan aus Website in Stundenpan einbinden?

Hi,

unsere Schule ist suuuuper unmodern. Kein Wlan kein Smartboard garnichts. Aber naja egal, zumindest haben sie eine Website wo der Vetretungsplan drauf ist.

Jetzt habe ich mir Zuhause mit Excel einen Stundenplan gemacht und würde den gerne mit dem Vertretungsplan synchronisieren. Also wenn zum Beispiel die 8. Stunde entfällt, soll die im Stundenplan nicht mehr angezeigt. Genaudo bei Vertretung. Das dann der Lehrer aktualisiert wird. Das importieren in Excel von der Website funktioniert perfekt. Doch wie kann ich meine Klasse (9c) filtern und dann die Daten aus dem Stundenplan überschreiben?

Ist diese Art Scraping erlaubt?

...zum Beitrag

Crawler geht nicht weiter, wenn fertig mit einer URL?

Hallo zusammen,

ich arbeite gerade an einem Python-Crawler, der spezifisch für die Website beispielurl.de entwickelt wurde. Mein Ziel ist es, verschiedene Unterseiten zu crawlen, die jeweils unterschiedlichen Kategorien angehören, wie z.B. "Flaschenhersteller" und "Kartenhersteller". Der Crawler soll automatisch von einer Kategorie (z.B. beispielurl.de/Flaschenhersteller/page-1, beispielurl.de/Flaschenhersteller/page-2, usw.) zur nächsten wechseln (z.B. beispielurl.de/Kartenhersteller/page-1, beispielurl.de/Kartenhersteller/page-2, usw.), sobald alle Seiten der aktuellen Kategorie durchlaufen sind.

Leider funktioniert der Wechsel zwischen den Kategorien nicht wie erwartet. Der Crawler verarbeitet alle Seiten der ersten Kategorie korrekt, aber anstatt zur nächsten Kategorie zu wechseln, beginnt er wieder von vorn bei der ersten Kategorie, ohne die nachfolgenden Kategorien zu berücksichtigen.

Hier ist ein vereinfachter Ausschnitt meines Codes:

def process_page(self, url):
  soup = self.fetch_page_with_selenium(url)
  links = self.extract_PLZ_links(soup)

  for link in links:
    self.fetch_PLZ_details(link)

def run(self):
  try:
    for code in self.postal_codes:
      page_number = 1
      has_more_pages = True

      while has_more_pages:
        url = f"{self.base_url}/suche/-/{code}?page={page_number}"
        soup = self.fetch_page_with_selenium(url)
        links = self.extract_PLZ_links(soup)

        if links:
          for link in links:
            self.fetch_PLZ_details(link)
            page_number += 1
        else:
          has_more_pages = False
  finally:
    self.driver.quit()
    self.csv_handler.close_csv()

Hersteller = [Flaschenhersteller, Kartenhersteller, etc. ]
crawler = WebCrawler("https://beispielurl.de", Hersteller)
crawler.run()

Hat jemand eine Idee, warum der Crawler nicht zur nächsten Kategorie wechselt und wie ich dieses Problem beheben könnte? Ich bin für jeden Tipp dankbar!

...zum Beitrag

Feuerschale als Miniteich?

Hallo zusammen,

ich habe aber zum Geburtstag eine Feuerschale geschenkt bekommen. Der Vermieter duldet diese aber nicht im Garten.

Jetzt kam mir die Idee einen Miniteich daraus zu machen.

Wasser ist drin, es bildet sich aber Rost. 😳

Was kann ich tun?

Schadet das evtl. den schwimmenden Pflanzen?

Habe auch einen kleinen Solarspringbrunnen bestellt und werde versuchen ob er funktioniert.

Habt ihr vielleicht Ideen für mich.?

liebe Grüße

susi467 🙋

...zum Beitrag

Trampolin im Winter im Garten?

Was passiert,wenn man sein Trampolin pber den Winter draußen stehen lässt?Und wenn es rostet,
welche Trampoline (Stoffe/Metalle) rosten nicht?
Danke im Voraus 😉🙏🏼

...zum Beitrag

Mysteriöse Snapchat Nachricht?

Hallo Leute mir ist letzten Abend etwas sehr komisches passiert und ich möchte eure Meinung dazu haben also ist es keine direkte Frage.

Und zwar war ich letzten Abend bei Nachbarn Blumen gießen und mir ist was sehr komisches passiert. Ihr kennt wahrscheinlich alle Snapchat, die meisten auf jeden fall und wahrscheinlich auch den Begriff „days“ ich wollte nachdem ich die Blumen gegossen hatte einen typischen Nacht-Snap im Nachbarsgarten machen und habe als bild eine Statue aus den Garten genommen da sie von Scheinwerferlichtern bestrahlt wurde. Den Snap wollte ich aber erst zu Hause abschicken und habe das handy ohne es ab zu drehen in die Hosentasche gesteckt und mich auf den weg nach Hause gemacht. Zu Hause angekommen hab ich dann mein aufgedrehtes handy genommen und wollte den Snap verschicken. Das foto war noch da nur ein bestimmter text war über den foto zu finden als wäre das bild bearbeitet worden. Der Text war irgendwas mit „Jal kome eim“ oder so, ich weiß leider nicht mehr ganz genau was der Text war. Zum Spaß hab ich spontan den text im Google Übersetzer dann eingegeben und war sehr erschrocken. Auf deutsch war dann das zu sehen: „Ja, ich bin willkommen“, aber auch andere dinge wie: „du wirst kommen“, „er wird kommen“ und „es tut mir leid“ die Ausgangssprachen von den deutschen Ergebnissen waren Norwegisch, Hindi und Kroatisch. Das Grundstück wo ich das Foto gemacht hatte wurde vererbt und dann verkauft der letzte Besitzer hatte belgische Herkunft mehr weiß ich leider nicht. Ich werde euch noch das Originalfoto mit leider nicht den richtigen text schicken da ich nicht so schlau war das originalfotoFoto mit original text zu screenshoten. Was haltet ihr davon oder kommt der text irgendjemanden bekannt vor wenn ihr nichts vom text wisst wäre eine Meinung auch genügend, danke im Vorhinein!

...zum Beitrag

Ich habe ein Gedicht geschrieben, möchte jemand Feedback geben?

Hey-hey:). Wir machen in Deutsch bald einen poetry slam und mussten dafür ein Gedicht schreiben. Wenn jemand Lust hätte, würde ich mich über Feedback freuen. Ich hab's nicht zu persönlich gemacht, weil ich das vor meiner Klasse vortragen muss (bin achte Klasse). Irgendwie hat gutefrage das so formatiert, dass ich jetzt zwischen Jedem Zeilenumbruch eine Zeile Abstand habe, ist im Original nicht soDenn als Teich zu existieren fühlt sich an wie Versagen

Blumenstrauß

Ich hab’ angefangen, übers Schreiben zu schreiben.

Als wären Wörter Blumen im Boden,

denn da müsste ich nur Texte verfassen,

damit sie sich meiner greifenden Hand entgegen neigen.

Dabei wollen sie doch in der Erde bleiben.

Ich soll sie nicht pflücken,

nur auf sie zeigen.

Mich an ihrem Anblick beglücken

Und sie mit meinen Tränen gießen,

Sodass sie sprießen.

Also stehe ich da.

Meinen Worten, meinen Blumen so nah.

Aber ich kann es nicht lassen,

muss über sie schreiben, nach ihnen fassen.

Ich halte die Blumen in meiner Hand.

Sie leuchten so rot.

Mein Beet nicht länger bekannt.

Die Blumen schon welk.

Dann lese ich Texte anderer Leute.

Sehe Gärten, so beständig.

Nicht tot noch heute, ihre Blumen lebendig.

Wie ein Teich ohne Fische ist mein Beet leer.

Trotzdem schreibe ich mehr.

Fische im Gewässer nach Worten,

in der Hoffnung, dass nicht alle mit den Blumen verdorrten.

Es ist, als sei mein Teich mit Säure gefüllt.

In Verzweiflung tauche ich hinein,

Doch selbst so sind die Worte mir nicht gewillt.

Hier sind keine Fische, ich bin allein.

Irgendwo höre ich die Ozeane anderer Leute rauschen.

Keine Ahnung, ob dort Fische leben.

Trotzdem würd’ ich gerne tauschen.

Denn ich will auch einen Ozean, nicht nur den Säureteich daneben.

Ich hätte gern’ einen Garten voller Pflanzen,

keine Hand mit Resten.

Denn ich versuche lediglich, mich dahinter zu verschanzen.

Nur einen kleinen Ozean, ich will doch gar nicht den besten.

Da würd’ ich sogar das Schreiben übers Schreiben lassen,

In Säure kann ich ja ohnehin keine Fische fassen.

Vielleicht will ich auch ein Ozan sein und nicht nur einen haben.

Denn als Teich zu existieren fühlt sich an wie Versagen

Ich bin ein Beet und kein Garten,

ein leeres, genau genommen.

Also lausche ich Ozeanen und bewundere Gärten.

Verbringe Zeit damit, zu warten,

Während ich über Worte schreib’, als Teich, in dem lange keine schwommen.

Dankeschön, Liebe Grüße:)

...zum Beitrag

Grundlagen Konstruktion von Frästeilen?

Hallo,

Ich suche nach Links (texte, videos, ev bücher) zum Thema Konstruktion von CNC-Frästeilen (Metall).

Ich würde mich freuen über Links zu Konstruktions-Grundlagen wie z. B.

wo wird ein Freistich benötigt
wo sind Fasen/Radien sinnvoll
was muss beachtet werden damit Teile auf 3 Achs Fräsen gefertigt werden können usw.

Vielen Dank im Voraus für Eure Beiträge

...zum Beitrag

Wenn Gemüse so gedüngt wird, ist es denn dann noch vegan?

Heute Vormittag habe ich auf meinem Streifzug durch die Medienwelt folgenden Artikel gefunden:

https://www.fuldaerzeitung.de/ratgeber/duenger-pflanzen-hausmittel-guenstig-garten-balkon-milch-gemuese-blumen-giessen-anpflanzen-anbau-92360086.html#:~:text=Wer%20sich%20an%20einer%20Milch,Erhitzung%20keine%20wachstumsf%C3%B6rdernden%20Mikroorganismen%20enth%C3%A4lt.

So weit so gut, bis auf Milch kannte ich diese Hausmittel auch alle schon und wende diese seit Jahren selbst an....

Allerdings drängt sich mir nun doch die Frage auf, weil ja alle Welt von "vegan" spricht, wenn nun Gemüse oder auch Obstbäume mit diesen, für mich, "natürlichen Produkten" behandelt und gedüngt werden, ist dann die Ernte noch als vegan anzusehen?

Danke fürs Mitdenken 🙏

...zum Beitrag

Gibt es Berufe, bei denen man schreiben muss?

Also Berufe, bei denen man so richtige Texte schreiben muss. Geschichten oder einfach nur kurze Texte. Sowas mit Gefühl und so. Also man könnte ja so Kurzgeschichten veröffentlichen, aber bekommt man dafür überhaupt Geld ? Deshalb wollte ich wissen ob es irgendeinen Job gibt wo man wirklich so Kurzgeschichten oder sowas schreiben muss. Oder muss man dafür Schriftsteller werden ? Weil Bücher ließt ja heutzutage eh keiner mehr

...zum Beitrag

VBA Programmierung - Automatischer Email versandt Probleme?

Hallo ich hoffe Ihr könnt mir helfen :/

Folgendes Problem: Wenn ich die Mail versende, öffnen sich für jede Zeile eine extra Email und leider auch nur jeweils ein Empfänger und einer in cc.

Was muss ich nun in der Programmierung hinzufügen, um nur eine Email geöffnet zu bekommen, mit mehreren Empfängern (Falls mehrere Kreuze gesetzt worden sind). Ich danke euch echt wenn Ihr mir helfen können :/

Ich habe mir die Bausteine aus dem Internet zusammengesetzt, bin daher kein Profi darin.

Programmtext:

Private Sub Send_Email()
   '-------------< Send_Email() >-------------
   Dim sTitle As String
   sTitle = "Test-HTML Email from Excel"
   '< HMTL holen >
   Dim sTemplate As String
   sTemplate = Sheets("ini_Vorlage").Shapes(1).TextFrame2.TextRange.Text
   '</ HMTL holen >
   '----< Send with Outlook >----
   Dim app_Outlook As Outlook.Application
   Set app_Outlook = New Outlook.Application
   '--< Email einstellen >--
   Dim objEmail As Outlook.MailItem
   Dim sEmail_Addresscc As String
   Dim sEmail_Address As String
   Dim iRow As Integer
   For iRow = 4 To 100
       If Cells(iRow, 21) = "x" Then
           '< get Email Address >
           'Column 2, B
           sEmail_Address = Cells(iRow, 19)
           sEmail_Addresscc = Cells(iRow, 20)
           '</ get Email Address >
           '< Fill Placeholders >
           Dim sHTML As String
           sHTML = Replace(sTemplate, "[@Name]", sEmail_Address)
           '</ Fill Placeholders >
           '--< Send Email >--
           Set objEmail = app_Outlook.CreateItem(olMailItem)
           objEmail.To = sEmail_Address
           objEmail.CC = sEmail_Addresscc
           objEmail.Subject = sTitle
           'objEmail.HTMLBody = sHTML 'use .HTMLBody for HTML
           objEmail.Body = sHTML      'and .body for pure Text
           objEmail.Display
           '--</ Send Email >--
       End If
   Next
   '< Abschluss >
   Set objEmail = Nothing
   Set app_Outlook = Nothing
   '</ Abschluss >
   MsgBox "Emails erstellt", vbInformation, "Fertig"
   '----</ Send with Outlook >----
   '-------------</ Send_Email() >-------------
End Sub

...zum Beitrag

VBA zu HTML Code umgewandelt - Zeilenumbrüche weg?

Hallo,

ich habe durch den unten beigefügten Code versucht eine E-Mail samt Signatur automatisch kommen zu lassen. Nun habe ich das Problem, dass die Absätze in der Mail weg sind und alles in einer Zeile ist. Wie behebe ich das?

Private Sub CommandButton2_Click()

Dim objOutlook As Object

Dim objMail As Object

Dim S As String

Dim body As String

Dim htbody As String

Set objOutlook = CreateObject("Outlook.Application")

Set objMail = objOutlook.CreateItem(0)

If TextBox2.text = "" Or TextBox2.text = TextBox1.text Then

body = "Sehr geehrte Frau x," & vbCrLf & _

vbCrLf & _

"Folgende/r Mitarbeiter/in ist erkrankt:" & vbCrLf & _

vbCrLf & _

ComboBox1.text & vbCrLf & _

vbCrLf & _

"Zeitraum: " + TextBox1.text

Else

body = "Sehr geehrte Frau x," & vbCrLf & _

vbCrLf & _

"Folgender Mitarbeiter ist erkrankt:" & vbCrLf & _

vbCrLf & _

ComboBox1.text & vbCrLf & _

vbCrLf & _

"Zeitraum: " + TextBox1.text + " bis " + TextBox2.text

End If

htbody = fnConvert2HTML(htbody)

S = Environ("appdata") & "\Microsoft\Signatures\autoE-Mailsenden.htm"

If Dir(S, vbDirectory) <> vbNullString Then

S = S

S = CreateObject("Scripting.FileSystemObject").GetFile(S).OpenAsTextStream(1, -2).readall

With objMail

.To = "x.de"

.Subject = "Krankmeldung " + ComboBox1.text + " x"

htbody = body & " " & S

.htmlbody = "" & htbody & ""

.Display 'Erstellt die Email und öffnet diese. Der Versand erfolgt anschließend manuell vom User!

End With

Else

' With objMail

' .To = Empfänger

' .Subject = Betreff

' htbody = body '& " " & S

' .htmlbody = "" & htbody & ""

' .Display

' ' .Display 'Erstellt die Email und öffnet diese. Der Versand erfolgt anschließend manuell vom User!

' End With

End If

End Sub

Zudem noch folgende Funktion:

Function fnConvert2HTML(myText As String) As String

Dim bldTagOn, itlTagOn, ulnTagOn, colTagOn As Boolean

Dim i, chrCount, n As Integer

Dim chrCol, chrLastCol, htmlTxt As String

Dim myChar As String

bldTagOn = False

itlTagOn = False

ulnTagOn = False

colTagOn = False

chrCol = "NONE"

htmlTxt = "<html>"

chrCount = Len(myText)

End Function

Danke im voraus!!!

...zum Beitrag

Unterschied zwischen 301 & 304 Redirect?

Moin an alle,

ich betreibe einen kleinen Onlineshop über Shopify und einige Seiten, deren URLs ich gerne in andere Sprachen übersetzen möchte, würden automatisch per 304 redirect anstelle eines 301 redirects behandelt werden.

Zur Info: Die fremdsprachigen Seiten existieren schon, doch wurden die URLs dieser Seiten bis jetzt immer in Englisch ausgegeben.

Ich bin nicht vom Fach und lese mir alles selber an, aber hier werde ich nicht schlau aus den Onlinequellen.

Gibt ein 304 redirect an Google auch die Info des permanenten Umzugs der Seite aus, nur mit der Info, dass diese nicht erneut gecrawlt werden muss?

Weil intuitiv hätte ich jetzt gesagt, ich bräuchte ein 301 redirect...

Vielen Dank schon einmal vorab.

...zum Beitrag

Was möchtest Du wissen?

Deine Frage stellen