Welches machine learning Modell um Samples basierend auf RNA-seq Daten als Stammzellen/keine Stammzellen zu klassifizieren?
Im training set sind 150 Samples vorhanden und für jedes Sample RNA-seq Daten für 10,000 gene. Jedes Sample is als Stammzelle oder als nicht-Stammzelle gelabled. Möchte nun für testing set vorhersagen welche Samples Stammzell-Samples sind, basierend auf Expressions-Daten für dieselben Gene. Welche Modelle wären hier am besten geeignet? Logistic Regression, Random Forest? Vielen Dank für eure Antworten!
Bioinformatik,
Machine Learning