Open Source LLMs?

Welche sehr Resourcenschonenden Open Source LLMs gibt es, die auf einem normalem CPU laufen können? Sie sollten so sein, dass sie Fragen beantworten können.
Danke im Voraus!

2 Antworten

Vom Beitragsersteller als hilfreich ausgezeichnet

Waldelb3

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Linux

21.02.2025, 15:54

In 32GB RAM kriegst du z.B.

Qwen2.5-32B-Instruct in Q4_K_L (optional Qwen2.5-0.5B-Instruct in Q4_0 für speculative decoding)
Mistral-Small-24B-Instruct-2501 in Q6_K

Ich nutze gerne koboldcpp um das auszuführen. Kannst so um die 2T/s erwarten.

Woher ich das weiß:Studium / Ausbildung – Informatik

Cari1232

Beitragsersteller

21.02.2025, 16:06

Also auf meinem Mac nur 8, ich hab noch einen server gemietet, da guck ich mal...

Waldelb3

21.02.2025, 16:07

@Cari1232

Wie viel sind von den 8GB frei?

Waldelb3

21.02.2025, 16:08

@Cari1232

Und hat der eine GPU mit VRAM die du nutzen könntest?

Cari1232

Beitragsersteller

21.02.2025, 16:15

@Waldelb3

Nur 2.

Waldelb3

21.02.2025, 16:37

@Cari1232

2GB VRAM auf der GPU, oder 2GB freier Speicher?

Cari1232

Beitragsersteller

22.02.2025, 12:59

@Waldelb3

Nein, 2 GB RAM auf dem Mac sind frei.

Waldelb3

22.02.2025, 14:24

@Cari1232

Das ist sehr wenig. Damit geht nur sowas wie https://huggingface.co/bartowski/Qwen2.5-3B-Instruct-GGUF in Q4_K_S

Wobei du wahrscheinlich auch noch SWAP frei hast, d.h. wenn du den mit nutzt ginge auch https://huggingface.co/bartowski/Qwen2.5-7B-Instruct-GGUF

Kannst du mal ausprobieren. Ansonsten wird mit dem Server sehr viel mehr möglich sein.

Cari1232

Beitragsersteller

21.02.2025, 16:02

Und mit Weniger?

Waldelb3

21.02.2025, 16:03

@Cari1232

Wie viel hast du denn?

TechnikTim

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Computer

21.02.2025, 15:44

Richtige Open Source Modelle, die auch was können gibt es meines wissens nicht. Aber es gibt "frei" verfügbare Modelle wie llama, deepseek, gemma, phi, ...

Du kannst mit Ollama einige Modelle ausprobieren und gucken welche zu deiner Rechenleistung passen bzw. wie viel TPS dir reichen.

Ich habe zum Beispiel ein 405b Modell zum auswerten von sehr großen Logs genutzt. Mein KI Server hat aber nicht ansatzweise genug VRAM und muss deswegen den normalen RAM nutzen. Das macht das ganze sehr langsam aber wenn ich 30min auf ne Antwort warten muss juckt mich das bei solchen Aufgaben nicht. Für normale Nachfragen bzw. arbeiten direkt mit KI ist das natürlich Schwachsinn. Da nehme ich kleinere Modelle.

Woher ich das weiß:Berufserfahrung – FISI, Ausbildungsleiter, 1st Level Supervisor, Homelab

Cari1232

Beitragsersteller

21.02.2025, 15:53

Danke! Könntest du mir vieleicht aber sagen, welche spezifischen Modelle es da gibt?

TechnikTim

21.02.2025, 15:55

@Cari1232

Bei Ollama? Steht doch auf deren Seite:
https://ollama.com/search

Oder schönere Auflistung:
https://github.com/ollama/ollama

Open Source LLMs?

2 Antworten

Open Source Chatbot oder selbst programmieren?

Keine Software ist 100% Open Source.

Wie hat sich deine Einstellung zu Open-Source-Software verändert?

Was haltet ihr vom LLM Hype?

Hat Open Source-Software mehr Vor- als Nachteile?

Sind Open Source Programme unsicherer?

Nutzt du lieber Open-Source-Software oder proprietäre Programme?

Gibt es KI, die lokal auf einem Rechner läuft, ohne Internet?

Gibt es gute Open Source Möglichkeiten wie Word und Excel?

Welche Lizenz für öffentliches, aber nicht-Open-Source Repo?

Gibt es ein open source Text to speech Modell?

Open Source Apps selber ohne Kenntnisse erstellen?

Qt Open-Source-Lizenz: Android-App veröffentlichen?

Macht es Sinn in Schulen den Einsatz von open source Software zu fördern?